Google estrena Gemini, su nueva IA multimodal más potente que GPT-4: comienza una nueva era
Google estrena Gemini, su nueva IA multimodal más potente que GPT-4: comienza una nueva era
8 de desembre de 2023

    Google lo llama "la nueva era de Gemini", porque están convencidos de que va a cambiar el mundo.
    Esta nueva inteligencia artificial multimodal trabaja con texto, audio, vídeo, imágenes, código, y otro contenido.
    He usado LuzIA, el asistente de inteligencia artificial de WhatsApp, durante semanas y aunque tiene cosas que pulir me parece un añadido fantástico.

Olvídate de lo que sabes o has probado hasta ahora de la IA de Google. Gemini es la inteligencia artificial que Google lleva una década desarrollando. La IA que iba a darle a Google el monopolio del mercado, como hizo el buscador de Google hace tres décadas... si no llega ser por la arrolladora irrupción de OpenAI y GPT, que pilló a todos por sorpresa.

Google siempre ha presumido de ser la compañía pionera en el mercado de la inteligencia artificial. Lleva casi una década desarrollando modelos de IA. Seguramente Gemini iba a ser un gran estreno, pero OpenAI se les adelantó con ChatGPT.

Hoy, según ha dicho el CEO de Google, Sundar Pichai, comienza una nueva era: la era de Gemini, la inteligencia artificial multimodal capaz de trabajar con texto, audio, vídeo, imágenes, código, y otro contenido. Y ya está disponible dentro de Bard.

Qué es Gemini, la nueva IA que supera a GPT-4

Compañías como OpenAI, Meta y otras, disponen de modelos de lenguaje especializados para cada tarea. Por ejemplo, ChatGPT se basa en texto, DALL-E en imágenes, y Whisper en el audio. Cada IA se especializa en un "sentido".

Si ChatGPT tiene una petición de imágenes, usa DALL-E para generarla. Colaboran entre sí. El enfoque de Gemini es muy diferente.

Gemini es el nuevo modelo de lenguaje grande (LLM) de Google que, según sus creadores, supera ampliamente a GPT-4. Es más potente en 30 de 32 benchmarks en donde lo han probado.

Gemini es una IA multimodal: puede trabajar al mismo tiempo con texto, vídeo, imágenes, audio, código, etc. Esto, en teoría, hará que sea más rápida y precisa que usar varias IAs especializadas. Google asegura que, con el tiempo, irá añadiendo nuevos "sentidos". Incluyendo el tacto de los robots.

Gemini promete ser también la mejor a la hora de corregir y revisar código. Integra la nueva versión AlphaCode 2, que es el doble de potente que su predecesora. Y, según Google, supera al 85% de la competencia, generando código seguro y estable.

Las tres versiones de Gemini

Otra característica interesante es que existen tres versiones de la IA: Gemini Nano, Gemini Pro, y Gemini Ultra.

Gemini Nano es una versión recortada basada en texto, tipo ChatGPT, que puede funcionar en los móviles en modo local, sin necesidad de acceder a la nube. La acaba de integrar en los Pixel 8 Pro.

Gemini Pro será la versión que se integrará en los servicios de Google, con funciones similares a ChatGPT, DALL-E, Whisper, Stable Diffusion, etc. Será la que usen la mayoría de los usuarios individuales en ordenadores, o en móviles conectados a la nube. Gemini Pro acaba de integrarse en Google Bard.

Finalmente, Gemini Ultra, que no estará disponible hasta principios de año, es la versión premium para servidores y empresas.

En su blog, Google se muestra convencida de que Gemini va a marcar un antes y un después en el mercado de la inteligencia artificial, como en su momento hizo con su buscador. La teoría es muy prometedora, pero aún queda por comprobar cómo funciona en la práctica. Como hemos comentado, Gemini Pro ya está disponible a través de Google Bard, aunque solo en inglés, y para países anglosajones.

https://computerhoy.com/google/gemini-inteligencia-artificial-google-mas-potente-gpt-4-1346392

ARTICLES PUBLINET
Cómo hacer SEO en TikTok con Creator Search Insights
2 de juny de 2025

TikTok este año está cambiando las reglas del juego. Desde la llegada de TikTok Shop estamos viendo cómo se está convirtiendo en una app mucho más completa. Tanto que ha hecho aumentar la facturación de Bytedance, su matriz,...

Leer más...
El eRetail Congress 2025 señala el rumbo del eCommerce hacia una experiencia más integrada, personalizada y eficiente
2 de juny de 2025

La IV edición del eRetail Congress ha reunido a profesionales y referentes del sector Retail y eCommerce para analizar los desafíos que plantea un entorno cada vez más complejo y omnicanal. En esta edición, el foco estuvo en la convergencia e...

Leer más...
Notícies
WhatsApp lanza su app nativa para iPad (no, aún no tenía): ¿Instagram para cuando?
2 de juny de 2025

Después de que en 2022, Will Cathhart, director de Whatsapp, dijera que una app nativa para iPad «sería genial»… por fin esa promesa se ha cumplido. Así es la app de Whatsapp para iPad La verdad es que el lanzamiento no lo h...

Así usamos las redes sociales en España: Whatsapp reina, X se desploma
2 de juny de 2025

El Estudio de redes sociales 2025 elaborado por Elogia e IAB Spain refleja la realidad de un sector en el que los clásicos pierden peso. Penetración y perfil de usuarios de redes sociales en España En esta edición, el estudio ha tenido...

Cómo hacer SEO para AI Overviews y AI Mode, según Google
2 de juny de 2025

Google está destrozando la forma «clásica» en que los usuarios interactuábamos con los resultados de búsqueda mediante la introducción de experiencias basadas en inteligencia artificial, como AI Overviews y el nuevo AI Mode...