Añádenos a tus favoritos en Google y no te pierdas nada
Añadir

Andrej Karpathy ficha por Anthropic y deja claro dónde está la pelea por los LLM

Karpathy se une a Anthropic para investigar LLM.

Andrej Karpathy ficha por Anthropic
Andrej Karpathy ficha por Anthropic

Pocos fichajes mueven tanto el tablero como este. Andrej Karpathy, uno de los nombres propios de la IA moderna y cofundador de OpenAI, acaba de anunciar que se incorpora a Anthropic para volver de lleno a la investigación. Lo confirmó él mismo en X el 19 de mayo, sin grandes adornos, con un mensaje breve donde dice que los próximos años en la vanguardia de los LLM van a ser «especialmente formativos».

Como ya hablamos cuando se marchó por segunda vez de OpenAI en 2024, Karpathy llevaba un tiempo centrado en Eureka Labs, su startup de educación nativa de IA. Que ahora aparque ese proyecto para meterse en un laboratorio puntero dice bastante sobre cómo están las cosas en la carrera por los modelos frontier.

Andrej Karpathy ficha por Anthropic
Andrej Karpathy ficha por Anthropic – Imagen:
@Pulkit_Meen

Por qué este fichaje le duele a OpenAI más de lo que parece

Karpathy no es un investigador cualquiera. Fue miembro fundador de OpenAI, lideró el equipo de Autopilot Vision en Tesla durante años y volvió a OpenAI en 2023 para trabajar en ChatGPT antes de salir definitivamente. Su trayectoria abarca visión por computador, deep learning e IA multimodal, con trabajos sobre generación de descripciones de imágenes que son anteriores al boom actual de los LLM.

Actualización personal: me he unido a Anthropic. Creo que los próximos años en la vanguardia de los LLM serán especialmente formativos. Sigo sintiendo una profunda pasión por la educación y planeo retomar mi trabajo en este campo en el futuro.

La reacción dentro del propio sector es reveladora. Noam Brown, investigador de OpenAI, reconoció públicamente en X que le habría gustado verlo volver a su antigua casa, aunque celebra que esté «en cualquier laboratorio de vanguardia impulsando el campo». Lo curioso aquí es la franqueza: cuando un competidor directo aplaude un fichaje rival, normalmente es porque entiende que el talento de ese nivel mueve la frontera independientemente del logo que lleve en la tarjeta.

A qué va a dedicarse exactamente en Anthropic

Aquí está el detalle que más nos interesa. Karpathy se incorpora al equipo de Nick Joseph para acelerar la investigación en pre-entrenamiento, la fase inicial del entrenamiento de un modelo donde se le inyectan cantidades masivas de datos para que aprenda patrones lingüísticos, sintaxis, semántica y conocimiento del mundo. Es la base sobre la que luego se construyen el fine-tuning y la alineación.

No es un detalle menor, que Anthropic ponga a alguien con el perfil de Karpathy en el pre-entrenamiento sugiere que están preparando algo más ambicioso que iteraciones incrementales de Claude. El pre-entrenamiento es justamente donde se juegan las mejoras de capacidad bruta, y donde los grandes laboratorios están invirtiendo cifras absurdas en computación.

El contexto: la guerra por el talento se ha desbocado

Anthropic, OpenAI, Google DeepMind, xAI y Meta llevan dos años pagando paquetes que hace nada habrían parecido de ciencia ficción para arañar investigadores senior unos a otros. La diferencia con Karpathy es que no es alguien que se compre con un cheque. Sale de proyectos cuando quiere, vuelve cuando le interesa, y elige laboratorio en función de dónde cree que se está cocinando lo siguiente.

Que haya elegido Anthropic en este momento concreto, y no a otro de los grandes, es una señal. La empresa que dirigen los hermanos Amodei lleva un par de años posicionándose como la alternativa más sólida a OpenAI en modelos de propósito general, con Claude compitiendo cara a cara contra GPT en la mayoría de benchmarks relevantes.

Lo que dice este movimiento sobre el mapa de la IA

Si miramos atrás, la trayectoria de Karpathy funciona casi como un termómetro de dónde está pasando lo interesante. OpenAI cuando OpenAI era el sitio. Tesla cuando Tesla iba a resolver la conducción autónoma. OpenAI otra vez con el boom de ChatGPT. Y ahora Anthropic, justo cuando el debate sobre seguridad, alineación y capacidades de los modelos frontier está más vivo que nunca.

No es coincidencia, Anthropic ha construido su identidad alrededor de la investigación en seguridad de IA, y a la vez compite por sacar modelos que rindan al nivel de los mejores. Karpathy encaja ahí con naturalidad: alguien que entiende los fundamentos técnicos del pre-entrenamiento como pocos y que además ha mostrado siempre interés genuino por las implicaciones más amplias de lo que se está construyendo.

Habrá que ver qué sale de aquí en los próximos meses, si el equipo de Nick Joseph estaba ya trabajando en una iteración importante de los modelos base de Anthropic, sumar a Karpathy puede acortar plazos o subir el techo de lo que están intentando. Y si OpenAI no responde rápido con movimientos equivalentes, este fichaje va a pesar bastante en cómo se cuente el 2026 dentro del sector.

Síguenos en Google News y recibe más noticias en tu feed
Seguir