Llama 3, el esperado juego de código abierto de Meta, finalmente está aquí

Resumen

Llama 3 de Meta ofrece configuraciones de parámetros de 8B y 70B, superando a los modelos de IA líderes con sólidas capacidades de razonamiento y codificación.
Meta tiene como objetivo democratizar la innovación con Llama 3, brindando a los desarrolladores e investigadores acceso a herramientas poderosas para superar los límites de la IA.
Las mejoras técnicas de Llama 3, como la tokenización eficiente y el entrenamiento de modelos únicos, se centran en mejorar la interacción del usuario y el uso ético de la IA.

Meta ha anunciado finalmente el lanzamiento de Llama 3, la última versión de la serie de modelos de lenguaje de gran tamaño de Llama de la empresa. Este nuevo modelo viene con capacidades mejoradas y está disponible en dos configuraciones: 8 mil millones y 70 mil millones de parámetros, cada una diseñada para satisfacer un amplio espectro de aplicaciones de IA. Introduce mejoras importantes, incluidas habilidades de razonamiento más sólidas, y promete una mejora significativa en sus capacidades de codificación y seguimiento de instrucciones, prometiendo ser el modelo de código abierto más versátil y capaz disponible hasta la fecha.

Meta ha enfatizado su intención de seguir promoviendo la innovación en IA haciendo que estas poderosas herramientas sean accesibles para un uso amplio. Se espera que este enfoque otorgue poder a los desarrolladores, investigadores y empresas para ampliar los límites de lo que la IA puede lograr, ya que puede ejecutarse localmente en todo tipo de máquinas. El modelo de parámetros 8B es particularmente liviano, pero los primeros informes sugieren quecasi superaa Wizard 8x22B, un modelo Mixture of Experts de 140B.

Llama 2 header showing Llama 2 7B, Llama 2 13B, and Llama 2 70B

Relacionado

Cómo ejecutar Llama 2 localmente en tu Mac o PC

Si has oído hablar de Llama 2 y quieres ejecutarlo en tu PC, puedes hacerlo fácilmente con algunos programas gratuitos.

Publicaciones

Metas e Innovaciones de Meta's Llama 3

Supera a un montón de modelos diferentes.

Puntuaciones de referencia de Llama 3 en su modelo de parámetros 8B y 70B, en comparación con los competidores

Fuente: Meta

Con Llama 3, Meta pretende igualar o incluso superar las capacidades de los mejores modelos propietarios que se encuentran actualmente en el mercado. El modelo responde a los comentarios previos de los desarrolladores al mejorar la utilidad general y, al mismo tiempo, mantener el foco en la implementación responsable. Llama 3 está diseñado para ser multilingüe y multimodal en futuras iteraciones, lo que promete ventanas de contexto más amplias y mejoras continuas del rendimiento. Como ejemplo, supera a Claude 3 Sonnet según Meta, y Sonnet ya supera con creces a GPT-3.5. Puede leer sobre cómo Meta calculó sus cifras enel documento de evaluación de la empresa.

Las mejoras técnicas de Llama 3 incluyen un tokenizador más eficiente y un nuevo enfoque para el entrenamiento de modelos que utiliza la atención de consultas agrupadas, optimizando el modelo para un mejor rendimiento de inferencia. Las mejoras de Llama 3 no son solo de naturaleza técnica, sino que apuntan a refinar la interacción del modelo con los usuarios, haciéndolo más intuitivo y efectivo en el uso diario. Esto se logró a través de un proceso de entrenamiento para Llama 3 que fue más extenso y refinado que sus predecesores. Implica un conjunto de datos masivo de más de 15 billones de tokens, con un enfoque significativo en fuentes diversas y de alta calidad. Este entrenamiento extenso, dice Meta, se complementa con técnicas avanzadas de filtrado de datos para garantizar la calidad y relevancia del material de entrenamiento.

Meta también ha adoptado mecanismos de entrenamiento sofisticados, como paralelización de datos, modelos y canalizaciones, para gestionar de manera eficiente las enormes demandas computacionales de Llama 3. Estas técnicas no solo mejoran la velocidad de entrenamiento, sino que también mejoran la capacidad del modelo para aprender de un conjunto de datos expansivo sin comprometer el rendimiento.

Con estas mejoras, Meta tampoco elude las cuestiones éticas de la IA. La empresa afirma haber integrado pruebas exhaustivas y equipos de trabajo para identificar y mitigar el posible uso indebido de Llama 3. Esto incluye funciones de seguridad avanzadas y el nuevo marco Llama Guard 2, que proporciona a los desarrolladores herramientas para garantizar un uso seguro y responsable de la IA. Queda por ver qué implica exactamente esto o cómo funciona, pero es de esperar que evite el uso indebido de la IA.

Cómo utilizar Llama 3 hoy

Está disponible para su uso ahora mismo en Meta AI, y también puedes descargar el modelo.

Puntuaciones del modelo de parámetros Llama 3 400B, actualmente en entrenamiento

Fuente: Meta

Llama 3 está comenzando su lanzamiento y Meta ya se está preparando para futuras mejoras. Estas incluyen planes para modelos con más de 400 mil millones de parámetros, mejoras en capacidades multimodales y compatibilidad con varios idiomas. El desarrollo de Llama 3 es un proceso continuo y Meta se compromete a realizar actualizaciones y mejoras periódicas. Ya puede probarlo hoy mismo ingresando al sitio webde Meta AIy ni siquiera necesita una cuenta para usarlo.

Si desea ejecutar Llama 3 localmente, puede visitarel sitio web Llama 3 de Metapara familiarizarse con sus capacidades y cómo ejecutarlo, junto con descargas de modelos para que pueda probarlos. Es probable que necesite unhardware potentepara ejecutar el modelo más grande en su PC, pero el modelo de parámetro 8B debería ser lo suficientemente fácil para que cualquiera lo pueda ejecutar.

Relacionado

Se espera que LlaMa 3 de Meta salga este año, y estas son 5 cosas que nos gustaría ver

Se espera que LlaMa 3 de Meta llegue a principios de junio, y hay mucho que queremos ver de él.

Publicaciones