¿Cuál es la intuición detrás de una función que es diferenciable si sus derivadas parciales son continuas?

¡Intentaré responder a mi propia pregunta!

  • Respuesta corta :

Moverse en una superficie de un punto a otro se realiza a través de las derivadas parciales porque cuando ahora tiene un punto (a, b, f (a, b)) puede ir a un punto cercano a través de la derivada parcial (puede ver el único caso variable en la tercera imagen a continuación). Esto es sutilmente diferente de la continuidad de la función misma. La función debe ser continua para que podamos comenzar a hablar de parciales.

La continuidad de una función significa que hay que ir al punto. Las derivadas parciales son los medios para llevarlo allí, mientras que las derivadas parciales continuas significan que puede tomar todas las rutas disponibles para ir allí, dado que el punto al que debemos ir está cerca del punto original y las rutas están en un vecindario cerca del Entonces, necesitamos que las derivadas parciales sean continuas en un vecindario cercano al punto original para que la función sea diferenciable en ese punto. Entonces, si este es el caso y cada ruta que conecta los dos puntos está disponible, entonces tenemos una aproximación lineal de la función en el punto original y a través de esa aproximación podemos obtener los otros puntos cercanos. Eso significa que existe un plano tangente en ese punto y ese plano contiene las rutas disponibles desde el punto original a cada punto cercano a él.

  • Respuesta larga :

Creo que todo se reduce a que la derivada es una buena aproximación alrededor de un punto donde la función es diferenciable.

Por ejemplo, de cálculo de variable única:

g (x) (función a la derecha) es diferenciable en todas partes, lo que significa que podemos tomar una línea tangente en cualquier punto de su gráfica y podemos usarla para aproximar puntos cercanos de la gráfica. Por otro lado, f (x) (gráfico de la izquierda) no es diferenciable en el punto donde hay una esquina porque no sabemos qué línea es tangente a ese gráfico, por lo que no sabemos con qué línea podemos aproximar los puntos cercanos . Esto se ilustra aquí (con las líneas azul y roja como líneas tangentes a f (x) en x = a desde su izquierda y derecha, respectivamente):

Además, por aproximación (lineal) me refiero a lo siguiente:

Los puntos cercanos a x = a (para Δx pequeño) se pueden calcular aproximadamente a partir de la recta tangente a x = a.

Otro ejemplo es y = | x | :

Para x 0 tiene un valor positivo. Pero, ¿qué valor tiene la derivada en x = 0? O, más importante, ¿cuál es la línea tangente en x = 0? ¡No hay ninguno! La función no es diferenciable en ese punto. No hay una línea con la cual podamos aproximar puntos cercanos x = 0.

Para el caso tridimensional, una buena aproximación alrededor de un punto para el cual la función es diferenciable es un plano en lugar de una línea; es decir, una colección de líneas infinitas todas tangentes a la gráfica en ese punto.

Ahora, yendo a un caso multivariable análogo al caso y = | x | de variable única:

Aquí, la función es continua, las derivadas parciales existen en todas partes, pero las derivadas parciales son discontinuas, por lo que no hay un plano que sea tangente a la gráfica en (0,0,0).

Del mismo modo que pasamos de f (x = a) a f (x = a + Δx) a través de la aproximación lineal de f en x = a (la línea tangente), para el caso multivariable podemos “movernos” con mas libertad. Podemos pasar de f (a, b) a f (a + Δx, b + Δy) de muchas maneras. Para poder moverse de todas las formas posibles (es decir, para que exista el plano tangente porque el plano tangente contiene todos los caminos posibles que podemos recorrer para ir al siguiente punto que está cerca (a, b)), el parcial las derivadas deben existir y ser continuas, de lo contrario habrá caminos en el plano tangente que no podremos atravesar porque contendrá puntos en los que el plano no será una buena aproximación de la función debido a la discontinuidad de la parcial derivados.

Como extra, señalaré que la derivada parcial fx (derivada a lo largo del eje x) es continua a lo largo de la línea y = 0 y lo análogo va para fy. También existen en (0,0,0). Así, desde una primera vista en la ecuación del plano tangente:

uno esperaría falsamente que el plano debería existir en (xo, yo, zo) = (0,0,0). Eso no es cierto como podemos ver en la gráfica de f. Por lo tanto, he forzado la intuición de por qué necesitamos que las derivadas parciales (solo las parciales porque todas las otras derivadas direccionales se pueden obtener por el gradiente) existan y sean continuas alrededor de un punto para que la función sea diferenciable en ese punto ; es decir, tener un plano tangente a ese punto; es decir, tener otra función que sea una buena aproximación de la función original en ese punto. 😀

En conclusión, todo se reduce a una función suave:

[Las imágenes fueron tomadas de las imágenes de Google, excepto de la segunda imagen que fue tomada de Advanced Calculus – A Geometric View | James J. Callahan | Springer, la quinta imagen que fue tomada de Vector Calculus (4a edición): Susan J. Colley: 9780321780652: Amazon.com: Libros y la última imagen que fue tomada de Vector Calculus: Jerrold E. Marsden, Anthony Tromba: 9780716749929: Amazon .com: Libros]

Esa es una gran pregunta. Los profesores a menudo pasan por alto esta pepita de la intuición, no se les enseña nada o no se les enseña bien, lo que da al resultado un aura un tanto misteriosa. “Una función es diferenciable en un punto si las derivadas parciales existen en el punto y cerca, y son continuas en ese punto”. Está claro que las derivadas parciales deben existir, pero ¿por qué necesitan ser continuas?

Tratemos de visualizar esto.

Para empezar: una función es diferenciable si hay una transformación lineal que se aproxima bien. Lo bueno de las transformaciones lineales es que se determinan tan pronto como se conocen sus valores. Si tiene una transformación lineal [matemática] T: \ mathbb {R} ^ n \ to \ mathbb {R} ^ m [/ matemática] y sabe [matemática] T (e_1), T (e_2), \ ldots, T (e_n) [/ math] donde [math] \ {e_i \} [/ math] es la base estándar de [math] \ mathbb {R} ^ n [/ math], entonces sabes todo sobre [math] T [/matemáticas].

Para aplicar esto al diferencial de una función, recordamos lo que significa tener una transformación lineal que se aproxima a una función: tenemos alguna función [matemática] f [/ matemática] y un punto [matemática] P [/ matemática], y queremos calcular [matemáticas] f (P + h) [/ matemáticas] basado en [matemáticas] f (P) [/ matemáticas]. Si la función es diferenciable en [matemática] P [/ matemática], entonces hay alguna transformación lineal [matemática] T [/ matemática] tal que [matemática] f (P + h) = f (P) + T (h) + [ / math] algún término de error pequeño (lo suficientemente pequeño como para tender a [math] 0 [/ math] más rápido que [math] h [/ math]).

¿Cómo podemos vincular esto a las derivadas parciales? Las derivadas parciales nos dicen cómo cambia la función cuando solo una variable cambia un poco. Esto suena prometedor, ya que podemos construir el movimiento general de [matemáticas] P [/ matemáticas] a [matemáticas] P + h [/ matemáticas] cambiando una coordenada a la vez. Por ejemplo, si [matemática] h = (0.1,0.2) [/ matemática], primero nos movemos de [matemática] P [/ matemática] a [matemática] P + (0.1,0) [/ matemática], cambiando solo el [ matemática] x [/ matemática], y luego desde allí nos movemos hacia arriba agregando [matemática] (0,0.2) [/ matemática], cambiando solo la coordenada [matemática] y [/ matemática], así:

Llamemos a los pequeños pasos [matemáticas] h_1 [/ matemáticas] y [matemáticas] h_2 [/ matemáticas] (en general habrá [matemáticas] h_1, h_2, \ ldots, h_n [/ matemáticas] pero podemos centrarnos en el caso [matemáticas] n = 2 [/ matemáticas] ya que cuenta toda la historia). Entonces [math] h = h_1 + h_2 [/ math], y [math] h_1 [/ math] se ve como [math] (\ star, 0) [/ math] y [math] h_2 [/ math] se ve como [ matemáticas] (0, \ estrella) [/ matemáticas].

Cuando damos el primer paso, de [matemática] P [/ matemática] a [matemática] P + h_1 [/ matemática], sabemos que el resultado está bien aproximado por [matemática] \ frac {\ parcial f} {\ parcial x_1} (P) [/ math], el valor de la primera derivada parcial en nuestro punto de origen [math] P [/ math].

[matemáticas] \ displaystyle f (P + h_1) = f (P) + \ frac {\ partial f} {\ partial x_1} (P) h_1 + o (\ | h_1 \ |) [/ math]

Pero en el siguiente paso nos topamos con un pequeño problema. Necesitamos pasar de [matemática] P + h_1 [/ matemática] a [matemática] P + h [/ matemática], es decir [matemática] P + h_1 + h_2 [/ matemática]. ¡Esto no es lo mismo que pasar de [matemáticas] P [/ matemáticas] a [matemáticas] P + h_2 [/ matemáticas]!

Lo que podemos decir es que

[matemáticas] \ displaystyle f (P + h) = f (P + h_1) + \ frac {\ partial f} {\ partial x_2} (P + h_1) h_2 + o (\ | h_2 \ |) [/ math] .

Esto está muy cerca de lo que teníamos antes, excepto que la derivada parcial se evalúa en [matemáticas] P + h_1 [/ matemáticas], no en [matemáticas] P [/ matemáticas]. Pero no se supone que sepamos nada sobre los valores de las derivadas parciales en [math] P + h_1 [/ math]. Todo lo que tiene el teorema son los valores de las derivadas parciales en [math] P [/ math].

Y aquí radica la intuición que necesita: si las derivadas parciales son continuas, sabemos que evaluarlas en puntos cercanos produce casi el mismo resultado.

Cuando ese es el caso, podemos reemplazar el término [matemáticas] \ frac {\ partial f} {\ partial x_2} (P + h_1) [/ matemáticas] con el término [matemáticas] \ frac {\ partial f} {\ parcial x_2} (P) [/ math], pagando un pequeño error que será insignificante cuando consideramos lo que sucede cuando [math] | h | [/ math] tiende a [math] 0 [/ math]. Esto nos permite demostrar que [matemáticas] f (P + h) [/ matemáticas] es de hecho [matemáticas] f (P) + T (h) + [/ matemáticas] algún error, al tomar [matemáticas] T (h) = T (h_1 + h_2) = T (h_1) + T (h_2) = a_1h_1 + a_2h_2 [/ math], siendo [math] a_1, a_2 [/ math] simplemente las derivadas parciales de [math] f [/ math] en [matemáticas] P [/ matemáticas].

Sin embargo, si las derivadas parciales no son continuas, esto simplemente no es cierto, y no hay forma de saber qué [matemática] f (P + h) [/ matemática] podría ser solo porque sabemos [matemática] f (P) [/ math] y todas las derivadas parciales en [math] P [/ math].

La intuición visual a tener en cuenta es esas dos líneas púrpuras paralelas en el diagrama anterior, la que se mueve hacia arriba desde [matemáticas] P [/ matemáticas] y la que se mueve hacia arriba desde un punto ligeramente a la derecha de [matemáticas] P [/ matemáticas]. Ahí es donde entra la continuidad.

Aquí hay un ejemplo divertido. Partición R ^ 2 por y = x ^ 2 e y = 0. Esto da 4 regiones distintas unidas por la línea y la parábola. Uno está debajo del eje x. Llámalo A. El que está arriba de la etiqueta de la parábola como C y los dos intercalados entre ellos llaman B.

Sea f: R ^ 2-> R dado por f = 1 para (x, y) en A o C yf = 0 para (x, y) en B. Todas las derivadas direccionales alejadas del origen son cero: u .gradf = 0. Sin embargo, claramente la función no es diferenciable en x = y = 0. La función no puede ser aproximada por un avión allí. Aquí todos los parciales son cero, por lo tanto, continuos, pero la función ni siquiera es continua en el origen, mucho menos diferenciable.

Si las derivadas parciales no son continuas, entonces el valor no está definido en alguna parte. Eso hace que la función no sea diferenciable en esos puntos. Como señaló una de las otras respuestas, un ejemplo simple es | x |, para el cual la derivada no está definida para x = 0. Una vez que el valor de una derivada no se puede definir en alguna parte, entonces no existe en ese punto.

Estamos hablando de funciones de múltiples variables con valor real, ¿verdad?

El diferencial total se puede expresar como la suma de las funciones diferenciales parciales, por lo que si los parciales son continuos, el diferencial total también lo es.

Lo contrario también es cierto. Esto debería estar cubierto en cualquier libro de texto básico sobre cálculo multivariable.

More Interesting

¿Podemos resolver problemas de física sin leer el libro de física?

¿Cuál es la diferencia entre las pruebas en física y las pruebas en matemáticas?

Tienes nueve bolas del mismo tamaño. Ocho de ellos pesan lo mismo, y uno de ellos pesa un poco más o menos. ¿Cómo puedes encontrar la pelota que es diferente usando una balanza y solo tres pesadas?

¿Qué consejo tiene para las especialidades de matemáticas y física en las universidades de artes liberales que intentan ingresar en programas de doctorado de élite en matemáticas o física?

¿Hay alguna derivación en la física que se base únicamente en las matemáticas mientras mantiene aparte cualquier tipo de argumento lógico aplicado dentro de ella?

¿Cuándo se usan los productos escalares y vectoriales?

¿Qué debo considerar antes de elegir entre una especialización en matemáticas y física?

¿Los conceptos matemáticos utilizados en una teoría de la física son inevitables en el desarrollo de la teoría?

En unos pocos pasos matemáticos, ¿por qué la relatividad no es compatible con QM?

¿La utilidad de los números complejos dice algo sobre el cosmos o la "realidad" de los números complejos?

¿Cómo derivar de manera análoga la ley de los gases ideales, utilizando la ley de entropía y la interpretación estadística de Boltzmann para definir la temperatura? Puede esto siquiera estar terminado

¿Hay alguna situación en la que los números negativos representen cantidades reales en lugar de simples cambios en la cantidad?

¿Cuál es, matemáticamente, la diferencia entre impulso, fuerza e impulso?

¿Cuál es una explicación intuitiva del formalismo hamiltoniano de la relatividad general?

¿Qué importancia tienen los grupos SO (3) y SU (2) en física?