Hasta ahora algo dependía de una sola cosa (el tiempo). Pero el error de una red depende de millones de pesos a la vez. El primer paso para manejarlo: la derivada parcial — mover una perilla y dejar las demás quietas.
Cambiemos de ejemplo a uno con dos entradas. Imagina estar parado en un terreno.
Tu altura depende de dónde estés: cuánto te has movido al este
(lo llamamos x) y cuánto al norte (lo llamamos y).
Usaremos un terreno con forma de cuenco (un valle), cuya altura es:
El fondo del valle está en el centro (x=0, y=0, altura 0). Cuanto más te alejas en cualquier dirección, más alto subes.
"¿Cuál es la pendiente del terreno?" no tiene una sola respuesta: depende de hacia dónde camines. Así que preguntamos por separado:
∂/∂x): la pendiente si caminas solo hacia el este, manteniendo el norte (y) congelado.∂/∂y): la pendiente si caminas solo hacia el norte, con el este (x) congelado.Si y está fijo en 1, la altura solo depende de x:
altura = x² + (1)² = x² + 1
La derivada de eso respecto a x (el "+1" es constante → 0):
∂/∂x = 2x
En x=3: 2·3 = 6
→ caminando al este, el terreno sube con pendiente 6 (¡empinado!)
Si x está fijo en 3, la altura solo depende de y:
altura = (3)² + y² = 9 + y²
La derivada respecto a y (el "9" es constante → 0):
∂/∂y = 2y
En y=1: 2·1 = 2
→ caminando al norte, el terreno sube con pendiente 2 (más suave)
En este punto, el terreno está más empinado hacia el este (6) que hacia el norte (2).
Coloca el punto y observa las dos pendientes parciales. Las circunferencias son las "curvas de nivel" (puntos a la misma altura), como en un mapa topográfico.
∂/∂x = 2x y ∂/∂y = 2y. Ahora tenemos dos pendientes en
cada punto. La próxima lección las junta en un solo objeto — el gradiente — que
además apunta en una dirección muy especial.