Historia y evolución: de los sistemas expertos a los LLMs
Historia, fundamentos y práctica de la Inteligencia Artificial — desde Dartmouth 1956 hasta los agentes autónomos de 2026.
Módulo 01
Historia de inviernos y primaveras — cómo la IA pasó de la euforia al abandono y volvió más fuerte cada vez.
Se acuña el término "Inteligencia Artificial" bajo un optimismo desbordado sobre simular la mente. Pioneros como McCarthy y Minsky establecen que cualquier aspecto del aprendizaje podía describirse con precisión para ser simulado por una máquina.
El Informe Lighthill (1973) critica la falta de resultados, provocando recortes masivos de financiamiento. La explosión combinatoria demuestra que la complejidad del mundo real superaba exponencialmente la capacidad computacional de las reglas lógicas.
Los sistemas expertos (programados en LISP) fallan por su fragilidad y el mercado de hardware especializado colapsa. La recuperación vendría del surgimiento del Machine Learning estadístico.
AlexNet gana ImageNet usando GPUs, demostrando que más datos + más potencia computacional superan al software programado manualmente. Es el punto de inflexión moderno — las GPUs permiten entrenar redes neuronales profundas hasta 20 veces más rápido.
ChatGPT alcanza 100 millones de usuarios en ~60 días — más rápido que TikTok (200 días), Instagram (900 días) o Netflix (3,500 días). La IA deja de ser herramienta técnica y se vuelve cotidiana.
La IA evoluciona de reglas rígidas a agentes autónomos que aprenden de la experiencia. El paradigma pasa de "responder" a "hacer".
Módulo 02
La revolución de los 2010 — cómo los asistentes de voz evolucionaron de comandos básicos a comprensión profunda.
Módulo 03
2017–2026: cómo la arquitectura Transformer permitió el paso de modelos básicos a sistemas multimodales y agentes autónomos.
La arquitectura Transformer rompió las limitaciones del procesamiento secuencial de RNN/LSTM. Este cambio técnico permitió un escalado masivo de datos y parámetros, llevando la IA de ser una herramienta predictiva a una infraestructura cognitiva generativa y autónoma.
| Dimensión | RNN (pre-2017) | Transformer |
|---|---|---|
| Procesamiento | Secuencial | En paralelo |
| Escalabilidad | Limitada por memoria | Altamente escalable |
| Contexto | Dificultad en secuencias largas | Relaciones globales eficientes |
Módulo 04
De herramienta de consulta basada en reglas a tejido operativo capaz de razonar y ejecutar tareas.
Programas basados en lógica "SI-ENTONCES" que codifican el conocimiento de expertos para tareas específicas. Explicable y controlable, pero frágil. Falló por la explosión combinatoria — el mundo real es demasiado complejo para capturarlo en reglas.
Ejemplos: MYCIN, XCON, ELIZA, Logic Theorist
Algoritmos que identifican patrones en datos históricos para clasificar o predecir. El humano ya no escribe reglas, pero sí diseña las features. Mejor generalización, pero dependiente de calidad de datos y con falta de explicabilidad.
Ejemplos: scoring crediticio, detección de fraude, SVM, Redes Neuronales
Modelos LLM que generan texto, imágenes y código original mediante redes neuronales profundas. El salto: de clasificar lo existente a sintetizar algo nuevo. Democratizó la IA pero introdujo las alucinaciones.
Ejemplos: ChatGPT, Claude, DALL-E, Midjourney, Sora
Sistemas que planifican, utilizan herramientas externas y ejecutan flujos de trabajo completos con supervisión humana mínima. El cambio más radical: pasa de "responder" a "hacer". Requiere regulación estricta.
Ejemplos: Claude con computer use, Devin, agentes empresariales
| Era | Dónde reside la inteligencia | Mecanismo dominante | Ventaja | Límite |
|---|---|---|---|---|
| Simbólica | Reglas, hechos, ontologías | Encadenamiento lógico IF-THEN | Explicabilidad, control | Fragilidad, explosión combinatoria |
| ML Clásico | Patrones + features humanas | Estimación estadística | Generalización en tareas medibles | Dependencia de calidad de datos |
| Deep Learning | Representaciones jerárquicas | Backpropagation multicapa | Aprendizaje end-to-end | Hambre de datos y cómputo |
| Transformers / MF | Preentrenamiento a gran escala | Auto-atención, prompting, RAG | Reutilización multi-tarea | Alucinaciones, gobernanza |
Módulo 05
La IA no es una tecnología — es un paraguas de múltiples tecnologías con propósitos distintos.
Módulo 06
Modelo fundacional enfocado específicamente en lenguaje — cómo funciona, qué puede hacer y qué no.
"Un LLM es un modelo que aprende a predecir lenguaje a gran escala, capturando patrones semánticos y contextuales del conocimiento humano. No sabe — probabiliza en base a patrones aprendidos."
Regla práctica: úsalo para generar y transformar texto. No lo uses como fuente única de hechos verificables. Siempre valida información crítica en fuentes primarias.
Módulo 07
Cómo un modelo procesa imagen, texto, audio y video en un solo sistema integrado.
El paso crítico es el Cross-Modal Fusion — conectar información de diferentes modalidades en un espacio compartido de significado. Eso es lo que permite a Gemini o GPT-4o responder preguntas sobre imágenes, describir audio o generar video desde texto.
Módulo 08
El cambio de paradigma: de modelos especializados a una plataforma universal adaptable.
Modelos individuales aislados — AI1 para texto, AI2 para música, AI3 para imágenes... Cada uno requiere entrenamiento específico desde cero con supervisión humana extensiva.
Un modelo masivo que absorbe todos los tipos de datos. Dos modos de uso: prompting directo o fine-tuning con datos propietarios.
La analogía: Traditional ML = contratar 6 especialistas distintos. Foundation Model = contratar 1 experto generalista que se adapta a cualquier tarea con solo cambiar el prompt.
Módulo 09
La decisión práctica más importante al elegir un modelo para tu negocio o proyecto.
| Dimensión | Abiertos | Cerrados |
|---|---|---|
| Acceso al modelo | Pesos disponibles | Solo vía API |
| Control | Alto — modificas, afinas, despliegas | Bajo — dependes del proveedor |
| Personalización | Muy alta (fine-tuning interno) | Limitada (prompting, RAG, tools) |
| Costo | Alto upfront, bajo marginal | Pago por uso (OPEX) |
| Infraestructura | Necesitas cloud propia | No necesaria |
| Rendimiento | Bueno, suele ir por detrás | El mejor disponible |
| Velocidad de evolución | Depende de la comunidad | Muy rápida (big tech invierte) |
| Privacidad / datos | Máximo control (on-premise) | Riesgo percibido |
| Transparencia | Mayor, auditable | Caja negra |
| Dependencia proveedor | Baja | Alta (lock-in) |
Elige abierto si tienes datos sensibles, quieres control total, o necesitas fine-tuning profundo. Elige cerrado si quieres arrancar rápido, necesitas el mejor rendimiento hoy, o tu equipo es pequeño. Para la mayoría de negocios, los modelos cerrados vía API son la opción práctica.
Nos comunicamos con el LLM a través del "PROMPT" — la instrucción en lenguaje natural.
La barrera de entrada es mínima — no necesitas saber programar. Solo necesitas saber formular bien lo que quieres. Esa habilidad de escribir buenos prompts es la competencia más valiosa de la era actual.