LECCIÓN 7

Derivada = sensibilidad

La interpretación que de verdad importa en el aprendizaje automático: la derivada te dice cuánto cambia la salida si tocas un poquito la entrada. Es una medida de "sensibilidad". Y es la brújula que usa una red para aprender.

Recuerda de la lección anterior: aprendiste los atajos para derivar — la regla de la potencia (tⁿ → n·tⁿ⁻¹), la constante (→ 0) y la suma (deriva por partes). Para posición = t², la derivada es 2t, así que en t=3 la derivada vale 2·3 = 6. Hoy: ¿qué significa ese "6" en términos prácticos?

1. Otra forma de leer la derivada

Hasta ahora vimos la derivada como "pendiente" y como "velocidad". Hay una tercera lectura, equivalente y poderosísima: cuánto responde la salida a un pequeño empujón en la entrada.

Si la derivada en un punto es 6 (como en t=3 para posición = t²), significa: "si empujo la entrada 1 unidad, la salida cambia ≈ 6 unidades". Derivada grande → salida muy sensible a esa entrada. Derivada pequeña → casi no le afecta. Derivada cero → ese empujón no cambia nada.

2. Lo vemos con un empujón pequeño

Con posición = tiempo², en t=3 la derivada es 6. Démosle un empujoncito de 0.1 al tiempo y veamos cuánto se mueve la posición:

✍️ Empujón de 0.1 en t=3

posición en t=3.0:  3.0²  = 9.00
posición en t=3.1:  3.1²  = 9.61
cambio en la salida:  9.61 − 9.00 = 0.61
cambio en la entrada: 3.1 − 3.0   = 0.10

sensibilidad = cambio salida ÷ cambio entrada = 0.61 ÷ 0.10 = 6.1
                                          ≈ la derivada (6) ✓
   (el símbolo ≈ se lee "aproximadamente igual" — no exacto, pero muy cercano)

El empujón "amplifica" ×6: muevo el tiempo 0.1 y la posición se mueve ~0.6. Cuanto más pequeño el empujón, más exacto sale 6.

🎮 Empuja la entrada y mira la salida

Elige un punto t y el tamaño del empujón. Verás cuánto se mueve la salida y que el cociente ≈ la derivada (2t).

punto t = 3.0

empujón 0.50

3. Por qué esto ES el aprendizaje automático

En una red neuronal, la "salida" que importa es el error (lo mal que predice), y las "entradas" que podemos tocar son los pesos — los números ajustables dentro de la red, como los diales de una radio que se giran para mejorar la señal. La derivada del error respecto a un peso responde la pregunta de oro:

"si muevo este peso un poquito, ¿el error sube o baja, y cuánto?"

Esa sensibilidad es exactamente lo que la red necesita para mejorar: mueve cada peso en la dirección que reduce el error. Si la derivada del error respecto al peso es positiva (subir el peso sube el error), baja el peso; si es negativa, súbelo. Lo formalizaremos en la lección 10 (descenso de gradiente). Pero primero, el salto a muchas entradas a la vez.

4. Lo que aprendiste

Lo que aprendiste hoy: la derivada = sensibilidad — cuánto cambia la salida por un empujón unitario en la entrada. Derivada 6 significa "si empujo 1 unidad, la salida cambia ~6 unidades". Grande = muy sensible; cero = indiferente. En una red neuronal, esta sensibilidad del error a cada peso es la brújula del entrenamiento.

Hasta aquí: una entrada → una salida. En la próxima lección: ¿qué pasa cuando hay varias entradas a la vez?