🏠 ← Volver al laboratorio

⚙️ · Curso 8 de 8

microgpt

Construyes un GPT completo desde cero. 200 líneas de Python puro, sin dependencias, sin librerías de deep learning. Al terminar entenderás cada pieza que hace funcionar a ChatGPT por dentro.

📚 15 lecciones ⏱ ~8h de lectura 🎯 Nivel: Avanzado 🆓 Gratis

Cada cálculo se hace a mano. Cada pieza de la arquitectura se visualiza. No hay caja negra: el tokenizador, el autograd, la atención, el optimizador Adam — todo se construye con tus propias manos, con números reales.

Cursos de apoyo (opcionales pero útiles)

Este es el curso final del laboratorio. Cada lección enlaza exactamente lo que necesita de cursos anteriores. Si ves un concepto que no reconoces, los enlaces te llevan directo a la lección correspondiente.

Curso Transformer · Redes Neuronales · El Gradiente · Álgebra Lineal

Las 15 lecciones

¿Qué hace un modelo de lenguaje?

Predecir el siguiente carácter — sin magia, sin inteligencia

Tokenización: de letras a números

Las redes no ven texto — ven enteros

Bigram: aprender sin neuronas

train0.py — contar qué carácter sigue a cuál

De tabla a red

Por qué necesitamos parámetros ajustables

Entropía cruzada

Cómo medir qué tan equivocado está el modelo

El grafo computacional

Cada cálculo deja un rastro — ese rastro es el grafo

Autograd: la clase Value

Un número que recuerda cómo fue calculado

Backpropagation

La regla de la cadena en el grafo, hacia atrás

Embeddings

Darle coordenadas ricas a cada token

Atención de una cabeza

Q, K, V — con números reales, paso a paso

Atención multi-cabeza

Cuatro perspectivas en paralelo

Arquitectura GPT completa

4 192 parámetros — todos contados y explicados

Caché KV

Por qué inferencia es diferente al entrenamiento

Optimizador Adam

Momentum + varianza — el descenso inteligente

Entrenamos y generamos nombres

Todo junto — la pérdida baja, el modelo inventa nombres

Empezar por la Lección 01 →