🏠 ← Volver al laboratorio
⚙️ · Curso 8 de 8

microgpt

Construyes un GPT completo desde cero. 200 líneas de Python puro, sin dependencias, sin librerías de deep learning. Al terminar entenderás cada pieza que hace funcionar a ChatGPT por dentro.

📚 15 lecciones ⏱ ~8h de lectura 🎯 Nivel: Avanzado 🆓 Gratis
Cada cálculo se hace a mano. Cada pieza de la arquitectura se visualiza. No hay caja negra: el tokenizador, el autograd, la atención, el optimizador Adam — todo se construye con tus propias manos, con números reales.

Cursos de apoyo (opcionales pero útiles)

Este es el curso final del laboratorio. Cada lección enlaza exactamente lo que necesita de cursos anteriores. Si ves un concepto que no reconoces, los enlaces te llevan directo a la lección correspondiente.

Curso Transformer · Redes Neuronales · El Gradiente · Álgebra Lineal

Las 15 lecciones

01

¿Qué hace un modelo de lenguaje?

Predecir el siguiente carácter — sin magia, sin inteligencia

02

Tokenización: de letras a números

Las redes no ven texto — ven enteros

03

Bigram: aprender sin neuronas

train0.py — contar qué carácter sigue a cuál

04

De tabla a red

Por qué necesitamos parámetros ajustables

05

Entropía cruzada

Cómo medir qué tan equivocado está el modelo

06

El grafo computacional

Cada cálculo deja un rastro — ese rastro es el grafo

07

Autograd: la clase Value

Un número que recuerda cómo fue calculado

08

Backpropagation

La regla de la cadena en el grafo, hacia atrás

09

Embeddings

Darle coordenadas ricas a cada token

10

Atención de una cabeza

Q, K, V — con números reales, paso a paso

11

Atención multi-cabeza

Cuatro perspectivas en paralelo

12

Arquitectura GPT completa

4 192 parámetros — todos contados y explicados

13

Caché KV

Por qué inferencia es diferente al entrenamiento

14

Optimizador Adam

Momentum + varianza — el descenso inteligente

🏁

Entrenamos y generamos nombres

Todo junto — la pérdida baja, el modelo inventa nombres

Empezar por la Lección 01 →