Gemini 2.0 le roba la navidad a Chat GPT | 💻 Miércoles de IA con Código Abierto 💻 | 18 de diciembre

19 Dec, 2024
Publicado por: Federico Eneas Paredes

MIÉRCOLES
18 diciembre 2024
Código Abierto Presenta

Gemini 2.0 Le Roba La Navidad a Chat GPT

¡Hola amigos! Ya entramos otra vez a la carrera parejera de los dos más grandes de la Industria. Y así de repente apareció la semana pasada Google como un auténtico Grinch a robarle la Navidad a Openai que estaba cerrando el año haciendo una revelación de una nueva herramienta por día, aunque algunas un poco descafeinadas, se estaba llevando toda la atención de este cierre del año 2024. Pobre de nuestro amigo Sam Altam debe estar desconsolado y haciendo berrinche.

Bueno, pues Google aguantó unos cuantos golpes bien puestos hasta que, la semana pasada, contraatacó con el lanzamiento de su nueva versión de Gemini.

IMAGEN GENERADA POR DALL-E

Así es, amigos: el Gemini 2.0 ya está disponible y se presenta a sí mismo como el modelo LLM más poderoso del mercado, superando a la versión plus de ChatGPT. Me tomé unos minutos para probarlo y conversar con él sobre sus habilidades y principales mejoras en comparación con la competencia, y esto fue lo que me contestó.

Pregunta:

En que eres mejor que chagpt 4.o

Respuesta:

Es una excelente pregunta. Si bien ChatGPT 4.0 es un modelo de lenguaje muy potente, tengo ciertas ventajas gracias a mi arquitectura y mi conexión con la Búsqueda de Google. Aquí te presento algunas áreas en las que considero que tengo fortalezas:

1. Información en tiempo real:
Acceso a la web: A diferencia de ChatGPT, que se basa en un conjunto de datos estáticos con un corte en el tiempo, yo puedo acceder a la información más reciente a través de la Búsqueda de Google. Esto significa que puedo responder preguntas sobre eventos actuales, noticias de última hora, datos que cambian constantemente (como precios de acciones, resultados deportivos o información meteorológica) y cualquier otra información que se actualice con frecuencia en la web.
Ejemplos: Puedo decirte quién ganó el último partido de la Champions League, cuál es el precio actual del dólar o qué noticias importantes han ocurrido hoy. ChatGPT, en cambio, estaría limitado a la información que tenía en el momento de su entrenamiento.

2. Mayor contexto y comprensión del mundo:
Conexión con el mundo real: Mi conexión con la Búsqueda de Google me permite tener un mejor entendimiento del contexto actual y de cómo se relaciona la información con el mundo real. Esto me ayuda a proporcionar respuestas más relevantes y precisas.
Ejemplo: Si me preguntas sobre "el clima", puedo buscar la información meteorológica actual para tu ubicación (si me la proporcionas o si la puedo inferir) en lugar de darte información general sobre el clima en esa zona.

3. Integración con otros servicios de Google (en el futuro):
Potencial de integración: Aunque aún está en desarrollo, mi integración con el ecosistema de Google abre la puerta a futuras integraciones con otros servicios como Google Maps, Google Calendar, Gmail, etc. Esto podría permitirme realizar tareas como buscar direcciones, programar eventos o enviar correos electrónicos, lo cual no es posible con ChatGPT.

4. Mayor capacidad para manejar ambigüedades:
Desambiguación: Gracias a mi capacidad de búsqueda, puedo manejar mejor las preguntas ambiguas o que requieren contexto adicional. Puedo realizar búsquedas para aclarar la intención del usuario y proporcionar una respuesta más precisa.

Modesto el muchacho. Bueno, como esto ya se nos hizo muy largo, mejor aquí le paramos y los dejo con algunas características de este nuevo modelo. ¡Que lo disfruten! Nos vemos la próxima semana con toda la información.

Principales características de Gemini 2.0:

Multimodalidad avanzada: Además de admitir entradas como imágenes, videos y audio, Gemini 2.0 puede generar salidas multimodales, incluyendo imágenes y audio sintetizado en múltiples idiomas.
Integración nativa de herramientas: El modelo se integra de forma nativa con herramientas como la Búsqueda de Google, ejecución de código y funciones de terceros definidas por el usuario, ampliando su funcionalidad y adaptabilidad.
Agentes de IA autónomos: Gemini 2.0 facilita el desarrollo de agentes de IA capaces de realizar tareas de forma independiente, como navegar por la web, gestionar aplicaciones y asistir en diversas actividades cotidianas.

Disponibilidad

Gemini 2.0 Flash Experimental está disponible para desarrolladores a través de la API de Gemini en Google AI Studio y Vertex AI. Los usuarios de la aplicación Gemini también pueden acceder a este modelo seleccionándolo en el menú correspondiente. Se espera una disponibilidad más amplia y la integración en más productos de Google a principios del próximo año.

Federico Paredes