La interpretación que de verdad importa en el aprendizaje automático: la derivada te dice cuánto cambia la salida si tocas un poquito la entrada. Es una medida de "sensibilidad". Y es la brújula que usa una red para aprender.
Hasta ahora vimos la derivada como "pendiente" y como "velocidad". Hay una tercera lectura, equivalente y poderosísima: cuánto responde la salida a un pequeño empujón en la entrada.
Con posición = tiempo², en t=3 la derivada es 6. Démosle un empujoncito de 0.1 al tiempo y veamos cuánto se mueve la posición:
posición en t=3.0: 3.0² = 9.00
posición en t=3.1: 3.1² = 9.61
cambio en la salida: 9.61 − 9.00 = 0.61
cambio en la entrada: 3.1 − 3.0 = 0.10
sensibilidad = cambio salida ÷ cambio entrada = 0.61 ÷ 0.10 = 6.1
≈ la derivada (6) ✓
El empujón "amplifica" ×6: muevo el tiempo 0.1 y la posición se mueve ~0.6. Cuanto más pequeño el empujón, más exacto sale 6.
Elige un punto t y el tamaño del empujón. Verás cuánto se mueve la salida y que el cociente ≈ la derivada (2t).
En una red neuronal, la "salida" que importa es el error (lo mal que predice), y las "entradas" que podemos tocar son los pesos. La derivada del error respecto a un peso responde la pregunta de oro: