LECCIÓN 7

Derivada = sensibilidad

La interpretación que de verdad importa en el aprendizaje automático: la derivada te dice cuánto cambia la salida si tocas un poquito la entrada. Es una medida de "sensibilidad". Y es la brújula que usa una red para aprender.

1. Otra forma de leer la derivada

Hasta ahora vimos la derivada como "pendiente" y como "velocidad". Hay una tercera lectura, equivalente y poderosísima: cuánto responde la salida a un pequeño empujón en la entrada.

Si la derivada en un punto es 6, significa: "si empujo la entrada 1 unidad, la salida cambia ≈ 6 unidades". Derivada grande → salida muy sensible a esa entrada. Derivada pequeña → casi no le afecta. Derivada cero → ese empujón no cambia nada.

2. Lo vemos con un empujón pequeño

Con posición = tiempo², en t=3 la derivada es 6. Démosle un empujoncito de 0.1 al tiempo y veamos cuánto se mueve la posición:

✍️ Empujón de 0.1 en t=3
posición en t=3.0:  3.0²  = 9.00
posición en t=3.1:  3.1²  = 9.61
cambio en la salida:  9.61 − 9.00 = 0.61
cambio en la entrada: 3.1 − 3.0   = 0.10

sensibilidad = cambio salida ÷ cambio entrada = 0.61 ÷ 0.10 = 6.1
                                          ≈ la derivada (6) ✓

El empujón "amplifica" ×6: muevo el tiempo 0.1 y la posición se mueve ~0.6. Cuanto más pequeño el empujón, más exacto sale 6.

🎮 Empuja la entrada y mira la salida

Elige un punto t y el tamaño del empujón. Verás cuánto se mueve la salida y que el cociente ≈ la derivada (2t).

3.0
0.50

3. Por qué esto ES el aprendizaje automático

En una red neuronal, la "salida" que importa es el error (lo mal que predice), y las "entradas" que podemos tocar son los pesos. La derivada del error respecto a un peso responde la pregunta de oro:

"si muevo este peso un poquito, ¿el error sube o baja, y cuánto?"
Esa sensibilidad es exactamente lo que la red necesita para mejorar: mueve cada peso en la dirección que reduce el error. Si la derivada del error respecto al peso es positiva (subir el peso sube el error), baja el peso; si es negativa, súbelo. Lo formalizaremos en la lección 10 (descenso de gradiente). Pero primero, el salto a muchas entradas a la vez.

4. Resumen

La derivada = sensibilidad: cuánto cambia la salida por un empujón unitario en la entrada. Grande = muy sensible; cero = indiferente. En ML, la sensibilidad del error a cada peso es la brújula del entrenamiento. Hasta aquí una entrada → una salida. En la próxima lección: ¿qué pasa cuando hay varias entradas?