Hasta ahora vectores con 2 componentes — flechas en una hoja. Pero un vector puede tener 3, 100, o mil componentes. Y todo lo que aprendiste sigue funcionando exactamente igual. Esta es la lección que abre la puerta a la IA.
Usamos 2 componentes porque cabe en una hoja y se ve. Pero la definición real de vector es solo "una lista ordenada de números". Esa lista puede tener cualquier longitud:
Cada número de la lista es una "dimensión" o "componente". El número total de componentes se llama la dimensión del vector.
Muchísimas cosas de la vida real son, de hecho, vectores. Solo que con más o menos dimensiones:
(latitud, longitud) → 2 números. Vector de dimensión 2.
(rojo, verde, azul). Ejemplo: (236, 72, 153) = magenta. 3 componentes.
(temperatura, humedad, viento, presión) → 4 números. Vector de dimensión 4.
Imagen 28×28 en gris = 784 píxeles. Vector de dimensión 784.
En NLP, cada palabra se convierte en un vector de cientos o miles de números — su "embedding". Vector de dimensión 300–4096.
Un párrafo procesado por un Transformer es un vector de varios miles de dimensiones. Vector de dimensión 4096+.
3D todavía se puede visualizar: 3 ejes perpendiculares (x, y, z). Un vector en 3D tiene 3 componentes:
Tomemos dos vectores en 4 dimensiones (imagínalos como, por ejemplo, predicciones del tiempo: temperatura, humedad, viento, presión):
Suma — sumamos componente a componente, igual que antes: u + v = (1+5, 2+0, 3+(-1), 4+2) = (6, 2, 2, 6) Escalar — multiplicamos cada componente: 3·u = (3, 6, 9, 12) Producto punto — multiplicamos componentes y sumamos: u · v = 1·5 + 2·0 + 3·(-1) + 4·2 = 5 + 0 − 3 + 8 = 10 Longitud — Pitágoras generalizado: |u| = √(1² + 2² + 3² + 4²) = √(1+4+9+16) = √30 ≈ 5.48
Recordemos cómo es una neurona (curso de redes):
Lo que antes era un producto punto entre vectores de 2 componentes ahora ocurre con vectores de cientos de componentes. Una capa típica de un Transformer hace productos punto entre vectores de 768 o 4096 dimensiones. La fórmula es la misma; solo cambia cuánta suma haces.
| Modelo | Dimensión de los vectores que maneja |
|---|---|
| Una red XOR (curso de redes) | 4 |
| BERT pequeño | 768 |
| GPT-3 | 12.288 |
| LLaMA 70B | 8.192 |