💻 Miércoles de IA con Código Abierto 💻: LLAMA 3 en la CIMA
MIÉRCOLES
24 Abril 2024
CÓDIGO ABIERTO
LLAMA 3 en la CIMA
META.AI contra ataca, este pasado 18 de abril meta anuncio su modelo de IA LLAMA 3 de Código Abierto (Open Source ) y da un batacazo al ecosistema de la IA con una promesa brutal de 400 mil Millones de parámetros, esto es bestial si tomamos en cuenta que todos los modelos disponibles en este momento son de 70 billones. Zuckerberg dijo recientemente en una entrevista que “ el verdadero reto al que se enfrenta la IA es la guerra entre los modelos cerrados y los de código abierto ( Open Source ) y por eso META.IA esta haciendo inversiones gigantescas apostando por el código abierto porque no creemos que sea justo para nadie que algunas cuantas compañías se queden con el control de las API’s que le permitan a los usuarios seguir construyendo modelos sobre bases mas solidas y previamente probadas”.
IMAGEN GENERADA POR DALL-E
No podía estar mas de acuerdo con Mark en esto, no debemos olvidar que toda esta conectividad es posible a un muy bajo costo gracias a un tal Tim Berners-Lee quien en 1991 presento al mundo nada mas y nada menos que la World Wide Web mejor conocido como Internet y dejo su código abierto para el mundo sin cobrar un solo dólar por él. Se imaginan que este código hubiera caído en las manos de Bill Gates o Carlos Slim en lugar de haber sido donado a la humanidad como lo hizo el buenazo de Tim. Si, mejor ni se lo imaginen, por eso es importante que nosotros como usuarios privilegiemos siempre las plataformas de código abierto ( Open Source ) en lugar de las de paga como openai.com.
Aquí les dejamos un resumen de las especificaciones de LLAMA 3 y su comparativa con los demás modelos.
Puntos de referencia y tabla comparativa
Los modelos Llama 3 toman datos y escalan a nuevas alturas porque ha sido entrenado en dos clústers de GPUs de 24K personalizados recientemente anunciados en más de 15T de tokens de datos: un conjunto de datos de entrenamiento 7 veces mayor que el utilizado para Llama 2, incluyendo 4 veces más código. Esto da como resultado el modelo Llama más capaz hasta el momento, que admite una longitud de contexto de 8K que duplica la capacidad de Llama 2.
Creo que estamos llegando a un momento desicivo por la egemonia de las IA generativas y todos los LLM o GPTs. Es esta apuesta de META quiza las mas ambiociosa de todas al ser de codigo abierto y no solo por la buena imagen o el buen marketing que esto les representa, si no porque ademas permite que los usuarios hagan descargas de los modelos para construir nuevas plataformas y de ahi aprovehar toda la retroalimentacion para seguir dado entrenamiento a nuevos prototipos. Esperemos que sea esta la tendencia que marque el camino de los investigadores e inversionistas y que en verdad como muchas veces presumen en sus discursos compartan abiertamente sus resultados para beneficio de todos.
Federico Paredes