Ahora lo divertido. Cada matriz "deforma" el espacio entero de una forma específica: lo rota, lo escala, lo aplasta, lo refleja. Verlo en vivo es lo que vuelve obvio el álgebra lineal.
En la lección 8 vimos que M tomaba el vector a y lo movía a otro sitio.
Pero la matriz hace lo mismo con TODO vector del plano: a cada punto le asigna un
nuevo punto. Es como agarrar la hoja de papel y deformarla.
Estas son las transformaciones básicas. Cada una es solo una matriz 2×2:
Click en una transformación de abajo. La rejilla original (gris) se deforma en la rejilla transformada (rosa). El vector a también se mueve.
Aquí va una idea preciosa que te ahorrará mucho lío. Mira las columnas de una matriz:
M · (1, 0) = (1·1 + 2·0, 0·1 + 1·0) = (1, 0) ← (1,0) no se mueve (primera columna de M) M · (0, 1) = (1·0 + 2·1, 0·0 + 1·1) = (2, 1) ← (0,1) se va a (2,1) (segunda columna) → Por eso M "estira" hacia un lado: la vertical (0,1) se ha inclinado hacia (2,1). La rejilla rectangular se vuelve un paralelogramo inclinado.
Una red neuronal apila muchas matrices, una por capa. Cada matriz "deforma" el espacio de los datos a su manera. Los pesos que aprende la red no son más que las entradas de esas matrices. Entrenar una red = encontrar las matrices que mejor deforman el espacio para resolver el problema.
Por ejemplo: una capa de un Transformer "proyecta" cada palabra a un nuevo espacio (las
famosas Q, K, V de la atención). Eso es exactamente matriz · vector con matrices
aprendidas. El resto es repetir esta idea.