Meta LLaMA es la nueva IA dedicada a la investigación

Meta LLaMA (Large Language Model Meta AI) es la nueva inteligencia artificial lanzada por la compañía Meta con el objetivo de ayudar a los investigadores a avanzar en su trabajo.

Se trata de un modelo de IA más eficiente y compacto según la compañía, la cual ayudará a otras comunidades dedicadas a la investigación que carecen de grandes recursos informáticos para realizar investigaciones.

Más detalles acerca de Meta LLaMA

A diferencia de los otros lenguajes que son muy grandes, LLaMA es un modelo más pequeño lo que permite un bajo requerimiento de poder de cómputo y recursos.

Actualmente, LLaMA tiene diferentes tamaños (7B, 13B, 33B y 65B de parámetros), lo que brinda a los usuarios la flexibilidad de elegir el tamaño adecuado para sus necesidades.

Con el lanzamiento de LLaMA, Meta busca democratizar aún más el acceso a este importante campo que cambia rápidamente, permitiendo que otros miembros de la comunidad de investigación que no tienen acceso a grandes cantidades de infraestructura puedan explorar y estudiar estos modelos con mayor facilidad.

En el último año, los modelos de lenguaje más grandes (sistemas de procesamiento de lenguaje natural o NLP con miles de millones de parámetros) han demostrado nuevas habilidades en la generación de texto creativo, la resolución de teoremas matemáticos, la predicción de estructuras de proteínas, la respuesta a preguntas de comprensión de lectura, entre otros.

No obstante, a pesar de todos los avances recientes en modelos de lenguaje grandes, el acceso completo a la investigación sigue siendo limitado debido a los recursos necesarios para entrenar y ejecutar modelos tan masivos.

Cómo funciona Meta LLaMA

Al igual que otros modelos de lenguaje grande, LLaMA funciona tomando una secuencia de palabras como entrada y predice la siguiente palabra para generar texto de forma recursiva.

Para entrenar este modelo, se eligieron texto de los 20 idiomas con más hablantes, enfocándonos en aquellos con alfabetos latino y cirílico.

Como modelo básico, LLaMA está diseñado para ser versátil y se puede aplicar a muchos casos de uso diferentes, en comparación con un modelo ajustado que está diseñado para una tarea específica.

Limitaciones de Meta LLaMA

Según ha informado la compañía, LLaMA no estará disponible para todos, ya que la nueva IA se ha lanzado bajo una licencia no comercial centrada en casos de uso de investigación.

El acceso al modelo se otorgará caso por caso a investigadores académicos; aquellos afiliados a organizaciones en el gobierno, la sociedad civil y la academia; y laboratorios de investigación de la industria en todo el mundo.

Las personas interesadas en solicitar acceso pueden hacerlo desde este enlace. Para más información puede visitar Meta LLaMA.