Cómo explicar la transformación de Fourier a un estudiante de secundaria

Secundo la respuesta de Jaimal.

Como estudiante actual de secundaria que investiga en análisis de sonido, creo que la forma más sencilla de explicarlo es tomando el caso del sonido: la Transformada de Fourier descompone la señal de sonido en sus diversas frecuencias.

Esto es más útil si está tratando de averiguar qué cantidad de sonido tiene una frecuencia particular, por ejemplo, encontrar la nota que se reproduce con más frecuencia en una canción, identificar a un hablante usando biometría conversacional (reconocimiento de voz) o encontrar la más frecuente RPM del motor de un automóvil (esto es en realidad parte de mi proyecto de investigación).

Si está buscando implementar dicho algoritmo en un programa (usando Python, MATLAB, etc.), recomendaría buscar la Transformada rápida de Fourier (FFT). Esto se usa en casi todos los programas de procesamiento de señales, y en realidad fue nombrado uno de los 10 mejores algoritmos del siglo XX (aunque olvido dónde se dijo esto). Es un algoritmo realmente excelente para cualquier cosa que tenga que ver con el procesamiento de señales.

Encontré este video

Dice que esencialmente, la transformación de Fourier tiene que ver con lo siguiente:

1. Obtenga datos en una dimensión (que es principalmente una variable discreta dependiente del tiempo).
2. Conviértalo en una representación circular 2D de un vector que se mueve como una manecilla de reloj con frecuencias variables (cada frecuencia produce su propia gráfica)
3. La FFT es una gráfica del valor promedio del vector para cada representación de frecuencia en 2-D (del paso 2).

Si toma un ejemplo de una canción, muestreada a, digamos 22kHz, entonces tiene 22k puntos discretos para sus tramas. Imagina generar muchas de esas gráficas en 2-D, para los 22k puntos por parcela, en un rango de frecuencias. Por lo tanto, cada gráfico le dará un valor promedio de su vector (como el centro de masa para todo el gráfico) y luego graficará todos esos valores promedio, con cada valor en el eje Y, y el valor de frecuencia correspondiente en el eje X.

Simple y elegante

Creo que un buen lugar para comenzar es hacer que un estudiante juegue con un ecualizador gráfico visual mientras escucha clips de audio. Puede comenzar con una demostración y algunos archivos de audio que tienen más actividad en la parte inferior y superior del espectro para que el alumno pueda ver visualmente lo que está escuchando. A partir de ahí, puede mostrar lo que sucede con el sonido cuando atenúa el extremo superior o inferior con los controles del ecualizador en algunos clips de audio de banda ancha.

Tendría que encontrar un software para esto. No tengo ninguna recomendación inmediata, pero creo que hay muchas opciones para ecualizadores gráficos visuales en tiempo real.

También puedes mirar los espectrogramas solo para reafirmar un poco más la intuición. No es una mala idea ya que el ecualizador es instantáneo. Incluso puede señalar dónde suceden algunas cosas (cambios de ancho de banda, canto, etc.). La clave aquí sería mostrar una imagen de la forma de onda y una imagen del espectrograma. Este sería un punto de partida para hablar sobre el dominio del tiempo frente al dominio de la frecuencia.

Así que ahora el estudiante tiene una idea de para qué sirve el análisis de frecuencia sin saber nada más. Hay algunos saltos técnicos para pasar de una señal a un espectrograma (que incluye la transformada discreta de Fourier, las ventanas de Hamming, etc.). En cambio, solo hablaría sobre el contenido de frecuencia general de una señal y lo usaría para conducir a la transformación de Fourier. Podría mantener un nivel bastante alto simplemente hablando de cuáles son las entradas y salidas de la transformación: una función en el dominio del tiempo se asigna a una función en el dominio de la frecuencia.

A partir de ahí, puede describir qué es un filtro con bastante facilidad e incluso crear un ecualizador gráfico dibujando un conjunto de filtros de banda estrecha que se multiplican por la salida de la transformación de Fourier.

La ruta tradicional en ingeniería eléctrica para profundizar en estas cosas es tomar un curso de “Señales y sistemas” y luego un curso de “Procesamiento de señal digital”. Entonces, si el interés está allí, podría llevar al estudiante a un programa de estudios para estos cursos.

Suponiendo que el estudiante de secundaria haya tomado trigonometría, solo diría que es un método para escribir cualquier función (razonable) sobre un dominio finito como una suma (potencialmente infinita) de ondas sinusoidales con diferentes frecuencias.

De hecho, la idea de frecuencias es quizás la mejor manera de dar intuición a las matemáticas detrás de la transformación de Fourier; Si se considera el caso específico de la música u otro tipo de sonido, la transformación de Fourier puede considerarse como una descomposición de las ondas de sonido en sus diversas frecuencias.

Un estudiante de secundaria puede estar familiarizado con la trigonometría, pero puede comprender o no las ondas seno / coseno. Es bueno poder visualizar cómo se traza primero una onda sinusoidal y cuál es el significado de frecuencia y tiempo.

Encontré este video bastante bueno en MATLAB Central que lo explica visualmente muy bien. Es solo un video de 1 minuto y no hay sonido, es realmente intuitivo.

Animación de la serie de Fourier con adición fasorial