Última lección. Cada matriz tiene "direcciones favoritas": vectores que NO se desvían cuando la matriz los transforma, solo se estiran o encogen. Esas direcciones — los autovectores — sostienen muchísima IA moderna.
Cuando aplicas una matriz M a un vector, normalmente lo mueve y lo gira. Pero algunos vectores especiales son distintos: la matriz los estira (o encoge) sin cambiarles la dirección. Son los autovectores.
Léelo así: "aplicar M a v = multiplicar v por un número λ". Es decir,
v sale apuntando a la misma dirección, solo más largo o más corto (el factor es λ, la
letra griega "lambda"). Ese λ es el autovalor.
Toma esta matriz diagonal:
| 2 | 0 |
| 0 | 3 |
Calculemos qué hace M a los vectores horizontal (1, 0) y vertical (0, 1):
M · (1, 0) = (2·1 + 0·0, 0·1 + 3·0) = (2, 0) = 2 · (1, 0) ↑ ¡autovector con autovalor 2! M · (0, 1) = (2·0 + 0·1, 0·0 + 3·1) = (0, 3) = 3 · (0, 1) ↑ ¡autovector con autovalor 3!
Tanto el vector horizontal como el vertical son autovectores de M. La matriz solo los estira: el primero ×2, el segundo ×3. No los gira nada. Los autovalores son 2 y 3.
Los autovectores son las direcciones "naturales" de una matriz. Si entiendes los autovectores, entiendes lo esencial de la transformación: en sus direcciones favoritas la matriz es simplemente un escalado. Toda la complicación está en girar; en las direcciones autovectores, no hay giro.
Encontrar los autovectores de la matriz de covarianza te da las "direcciones de máxima variación" de tus datos. Comprimes 1000 dimensiones a 50 sin perder mucha info.
La importancia de cada página web es un autovector de la matriz de enlaces de internet. Literalmente así nació Google.
Word2Vec, GloVe y otros embeddings se construyen factorizando matrices — autovalores y vectores singulares por dentro.
Que una red profunda no "explote" depende de los autovalores de sus matrices de pesos. Si son muy grandes, los gradientes explotan; muy chicos, desaparecen.
SVD (una generalización) permite guardar imágenes con muchísimos menos números, conservando los autovalores más importantes.
El comportamiento a largo plazo de procesos (epidemias, mercados, ecosistemas) se predice con autovalores de sus matrices de transición.
Mira lo que sabes ahora, comparado con cuando empezaste:
| Concepto | Lección |
|---|---|
| Vector como flecha y como par de números | 1 |
| Suma de vectores (visual y numérica) | 2 |
| Escalar y combinación lineal | 3 |
| Producto punto (la operación reina) | 4 |
| Longitud y ángulo desde el producto punto | 5 |
| Vectores en N dimensiones (puente a IA) | 6 |
| Matriz como tabla / colección / transformación | 7 |
| Matriz por vector = productos punto | 8 |
| Transformaciones del plano (visual) | 9 |
| Multiplicar matrices = encadenar transformaciones | 10 |
| Determinante = cambio de área | 11 |
| Inversa y sistemas de ecuaciones | 12 |
| Autovalores y autovectores | 13 |
x @ W + b en PyTorch, sabes que es un montón de
productos punto. Cuando se hable de Q, K, V en un Transformer, sabes que son matrices proyectando
vectores. Cuando alguien mencione "embeddings de 768 dimensiones", lo visualizas (¡aunque no se
pueda dibujar!). Has cerrado la base matemática del laboratorio.