LECCIÓN 10 · DERIVADAS

La regla de la cadena

La regla más importante (y más usada) del cálculo. Para derivar funciones "metidas una dentro de otra" — y casi todas las funciones reales lo están. Es el motor matemático del backpropagation.

1Funciones compuestas — una función dentro de otra

Una función compuesta es una función dentro de otra. Ejemplo: (x² + 1)³ es cubo(algo), donde "algo" es a su vez x² + 1.

Para derivar esto NO basta con las reglas de la lección 9: hay que tratar las dos funciones por capas. Eso es la regla de la cadena.

2La regla

(f ∘ g)'(x)  =  f'(g(x)) · g'(x)

En palabras claras: deriva la función "de fuera" sin tocar lo de dentro, multiplica por la derivada de lo de dentro. Es como pelar una cebolla por capas.

🎯 La receta operativa:
  1. Identifica qué función es la de fuera y cuál la de dentro.
  2. Deriva la de fuera y déjala con "lo de dentro" intacto.
  3. Multiplica por la derivada de lo de dentro.

3Ejemplo paso a paso: (x² + 1)³

✍️ Derivar f(x) = (x² + 1)³
1) función "de fuera": ( · )³   ← elevar al cubo
   función "de dentro": x² + 1

2) derivada de la de fuera (sin tocar dentro):
   derivada de u³ = 3u²  →  con u = x² + 1:  3(x² + 1)²

3) derivada de la de dentro:
   derivada de x² + 1 = 2x

4) multiplicar (regla de la cadena):
   f'(x) = 3(x² + 1)² · 2x
        = 6x · (x² + 1)²

4Otro: derivar √(3x + 7)

✍️
1) de fuera: √( · ) = ( · )^(1/2)
   de dentro: 3x + 7

2) derivada de fuera: (1/2)·u^(-1/2) = 1/(2√u)  →  1/(2√(3x+7))

3) derivada de dentro: 3

4) multiplicar:
   f'(x) = 1/(2√(3x+7)) · 3
        = 3 / (2√(3x+7))

5Y si hay tres niveles… aplica la cadena dos veces

La regla se aplica recursivamente. sin((x²+1)³) se desmonta así:

✍️ f(x) = sin((x²+1)³)
capas:  sin( ___ )         ← más exterior
        ( x²+1 )³           ← media
        x² + 1              ← más interior

1) derivada de sin(algo) = cos(algo)
   →  cos((x²+1)³)

2) multiplicar por derivada de (algo)³ = 3·(algo)² · (derivada de dentro)
   →  cos((x²+1)³) · 3(x²+1)² · 2x

f'(x) = 6x · (x²+1)² · cos((x²+1)³)

6Conexión con redes neuronales

🧠 Una red neuronal es una función compuesta gigante. Cada capa es una función, y se apilan unas sobre otras. Para calcular la derivada del error respecto a cualquier peso, se aplica la regla de la cadena tantas veces como capas haya — eso es literalmente backpropagation. La regla de la cadena no es trivia académica: es el motor de la IA moderna.

7Resumen

Regla de la cadena: deriva lo de fuera (sin tocar lo de dentro) y multiplica por la derivada de lo de dentro. Aplícala por capas si hace falta. Es la herramienta que junto con las reglas de la lección 9 te permite derivar prácticamente todo. La próxima lección añade las derivadas de las funciones que más aparecen: trigonométricas, exponenciales y logarítmicas.