8 de desembre de 2023 Google lo llama "la nueva era de Gemini", porque están convencidos de que va a cambiar el mundo.
Esta nueva inteligencia artificial multimodal trabaja con texto, audio, vídeo, imágenes, código, y otro contenido.
He usado LuzIA, el asistente de inteligencia artificial de WhatsApp, durante semanas y aunque tiene cosas que pulir me parece un añadido fantástico.
Olvídate de lo que sabes o has probado hasta ahora de la IA de Google. Gemini es la inteligencia artificial que Google lleva una década desarrollando. La IA que iba a darle a Google el monopolio del mercado, como hizo el buscador de Google hace tres décadas... si no llega ser por la arrolladora irrupción de OpenAI y GPT, que pilló a todos por sorpresa.
Google siempre ha presumido de ser la compañía pionera en el mercado de la inteligencia artificial. Lleva casi una década desarrollando modelos de IA. Seguramente Gemini iba a ser un gran estreno, pero OpenAI se les adelantó con ChatGPT.
Hoy, según ha dicho el CEO de Google, Sundar Pichai, comienza una nueva era: la era de Gemini, la inteligencia artificial multimodal capaz de trabajar con texto, audio, vídeo, imágenes, código, y otro contenido. Y ya está disponible dentro de Bard.
Qué es Gemini, la nueva IA que supera a GPT-4
Compañías como OpenAI, Meta y otras, disponen de modelos de lenguaje especializados para cada tarea. Por ejemplo, ChatGPT se basa en texto, DALL-E en imágenes, y Whisper en el audio. Cada IA se especializa en un "sentido".
Si ChatGPT tiene una petición de imágenes, usa DALL-E para generarla. Colaboran entre sí. El enfoque de Gemini es muy diferente.
Gemini es el nuevo modelo de lenguaje grande (LLM) de Google que, según sus creadores, supera ampliamente a GPT-4. Es más potente en 30 de 32 benchmarks en donde lo han probado.
Gemini es una IA multimodal: puede trabajar al mismo tiempo con texto, vídeo, imágenes, audio, código, etc. Esto, en teoría, hará que sea más rápida y precisa que usar varias IAs especializadas. Google asegura que, con el tiempo, irá añadiendo nuevos "sentidos". Incluyendo el tacto de los robots.
Gemini promete ser también la mejor a la hora de corregir y revisar código. Integra la nueva versión AlphaCode 2, que es el doble de potente que su predecesora. Y, según Google, supera al 85% de la competencia, generando código seguro y estable.
Las tres versiones de Gemini
Otra característica interesante es que existen tres versiones de la IA: Gemini Nano, Gemini Pro, y Gemini Ultra.
Gemini Nano es una versión recortada basada en texto, tipo ChatGPT, que puede funcionar en los móviles en modo local, sin necesidad de acceder a la nube. La acaba de integrar en los Pixel 8 Pro.
Gemini Pro será la versión que se integrará en los servicios de Google, con funciones similares a ChatGPT, DALL-E, Whisper, Stable Diffusion, etc. Será la que usen la mayoría de los usuarios individuales en ordenadores, o en móviles conectados a la nube. Gemini Pro acaba de integrarse en Google Bard.
Finalmente, Gemini Ultra, que no estará disponible hasta principios de año, es la versión premium para servidores y empresas.
En su blog, Google se muestra convencida de que Gemini va a marcar un antes y un después en el mercado de la inteligencia artificial, como en su momento hizo con su buscador. La teoría es muy prometedora, pero aún queda por comprobar cómo funciona en la práctica. Como hemos comentado, Gemini Pro ya está disponible a través de Google Bard, aunque solo en inglés, y para países anglosajones.
https://computerhoy.com/google/gemini-inteligencia-artificial-google-mas-potente-gpt-4-1346392
Los avances en IA están dotando a las obras generadas con esta tecnología de un realismo cada vez mayor, lo cual puede ser un gran problema a la hora de distinguir entre realidad y contenido artificial. Para ayudar a los usuarios y usuarias en este sentido...
Leer más...
A Google casi le dan las uvas con su última core update del año. El gigante tecnológico activó su actualización principal el pasado 11 de diciembre, junto con la predicción de que tardaría unas tres semanas en completarla...
Leer más...
Hace un par de meses te contábamos cómo TikTok Shop había alcanzado los 12.000 vendedores locales, coincidiendo con su primer aniversario en España. Un año de crecimiento y, claro, de adaptación, tanto de la plataforma como de q...
En el mes de octubre, OpenAI lanzó Atlas, un navegador impulsado por IA que funciona como un asistente personal proactivo, capaz de entender el contexto de la web que visitas y ayudarte en tiempo real con resúmenes, búsquedas contextuales y automati...
La apuesta de Meta es tan inesperada como arriesgada, y deja expuesta su preocupación por adelantarse en la carrera por lograr la Inteligencia Artificial General, algo de lo que Manus viene presumiendo desde su fundación, en marzo de 2025. Qué im...