LLaMA: Meta también tiene su propia inteligencia artificial similar a ChatGPT, pero que será exclusiva para fines de investigación

La empresa detrás de Facebook, Meta, ha dado a conocer su propia inteligencia artificial impulsada por un modelo de lenguaje, de forma similar a ChatGPT, Bing con IA y Bard de Google.

Esta nueva IA, con el nombre de LLaMA (Large Language Model Meta AI), no estará disponible de la misma forma que otras opciones para la gran mayoría de los usuarios, sino que está enfocada específicamente a la comunidad de investigación.

Meta ha detallado en una actualización de su blog que LLaMA tendrá una licencia no comercial para investigadores, entidades oficiales de gobierno, sociedad civil y la academia, así como para laboratorios de investigación de la industria.

Según Zuckerberg, los LMM se han mostrado "muy prometedores" en la generación de texto, tener conversaciones, resumir material escrito y en tareas más complicadas como resolver teoremas matemáticos o predecir estructuras de proteínas, pero no detalló si LLaMA es capaz de realizar estas acciones.

Así funciona LLaMA

Entre los detalles de su modelo, Meta reveló que su IA funciona tomando secuencias de palabras como entradas, prediciendo la siguiente para generar el texto de forma recursiva, siendo entrenada en texto de 20 idiomas diferentes, enfocándose en aquellos con alfabetos latino y cirílico.

Para Meta, LLaMA es un modelo pequeño, que requiere mucha menos potencia y recursos informáticos a diferencia de otras opciones más grandes, capaz de lograr "resultados competitivos" contra los mejores modelos lanzados actualmente, estando disponible en varios tamaños determinados por la cantidad de tokens (piezas de palabras) con los que fueron entrenados.

via GIPHY

Según la compañía, LLaMA no se escapa de los problemas que hemos visto en otros modelos que generan errores o información inexacta, por lo que reconoce que aún falta más investigación para abordar los riesgos de sesgo, comentarios tóxicos y alucinantes de los LLM. Además, con su enfoque para compartir el código de la IA, otros investigadores pueden probar más fácilmente nuevos enfoques para eliminar o limitar los problemas que tienen los modelos de lenguaje grandes.

Eso sí, se revela que como un modelo básico, LLaMA está diseñado para ser versátil y con aplicación en muchos casos de uso diferentes, en comparación con modelos que están ajustados para una tarea específica.

Meta menciona que su forma de lanzar el modelo bajo una licencia no comercial centrada únicamente en ser usada en el área de la investigación, es con la intención de mantener la integridad de la IA y evitar que se pueda utilizar de forma indebida por cualquier persona.

Así funciona LLaMA

RECIBE "", NUESTRA NEWSLETTER SEMANAL

Explora en nuestros medios