La pieza más pequeña de una red neuronal. Si entiendes esto, entiendes el 80% de todo lo demás — el resto es repetir esta idea muchas veces.
Una neurona artificial toma varios números de entrada, les da más o menos importancia, los suma, y produce un solo número de salida. Nada más.
Toda red neuronal — incluido el Transformer que ya viste — está hecha apilando miles o millones de estas piezas diminutas. Vamos a entender una sola, a fondo y con números.
Una neurona tiene tres tipos de ingredientes:
| Ingrediente | Qué es | ¿Lo aprende la red? |
|---|---|---|
| Entradas (x₁, x₂, …) | Los datos que entran. Vienen de fuera o de otra neurona. | No, son el dato |
| Pesos (w₁, w₂, …) | Cuánta importancia le da a cada entrada. Uno por entrada. | ✅ Sí |
| Bias (b) | Un ajuste fijo que se suma al final. Desplaza el resultado. | ✅ Sí |
Con 2 entradas (que es nuestro caso para XOR), la neurona calcula:
Leído en palabras:
z es la salida de la neurona (su "pre-activación").
Si hubiera más entradas, la fórmula crece igual: z = w₁x₁ + w₂x₂ + w₃x₃ + … + b.
Esa suma de "peso × entrada" es exactamente el producto punto que viste en el
Transformer — la misma operación, otra vez.
Durante todas las lecciones entrenaremos una red para resolver XOR. Esta es
una de sus neuronas — la primera neurona de la capa oculta, que llamaremos
h₁. Sus valores iniciales (inventados, la red los ajustará después) son:
Pesos y bias de la neurona h₁: w₁ = 0.20 (peso de la entrada x₁) w₂ = 0.40 (peso de la entrada x₂) b = -0.10 (bias) Le damos la entrada XOR x = (1, 0): x₁ = 1 x₂ = 0
z = (w₁ · x₁) + (w₂ · x₂) + b = (0.20 · 1) + (0.40 · 0) + (-0.10) = 0.20 + 0.00 + (-0.10) = 0.10
h₁, ante la entrada (1, 0), produce z = 0.10.
Guarda ese número: es el primer valor de nuestro hilo conductor. En la lección 4 verás de dónde
viene cuando la red completa procese XOR.
Un peso grande y positivo dice "esta entrada empuja la salida hacia arriba".
Uno negativo dice "esta entrada empuja hacia abajo". Uno cercano a
cero dice "esta entrada casi no me importa". En nuestro ejemplo, w₂=0.40
le da más importancia a x₂ que w₁=0.20 a x₁.
El bias desplaza el resultado sin depender de ninguna entrada. Un bias positivo hace que la
neurona dé números más altos por defecto; uno negativo (como nuestro -0.10) la
hace más "exigente". Piensa en él como el umbral que mueve la balanza.
Cambia los pesos, el bias y las entradas, y mira cómo cambia z en vivo.
(Arranca con los valores de h₁.)
La neurona que acabas de entender tiene dos cosas pendientes:
z = 0.10 normalmente pasa por una
función de activación que lo "aplasta" a un rango útil (por ejemplo entre 0 y 1).
Es lo que da el poder no-lineal. → Lección 2.
z. Aprender = ajustar esos pesos y bias.
Con la neurona h₁ y la entrada (1,0) obtuvimos z = 0.10, el primer
número de nuestro recorrido por XOR.