Google estrena Gemini, su nueva IA multimodal más potente que GPT-4: comienza una nueva era
Google estrena Gemini, su nueva IA multimodal más potente que GPT-4: comienza una nueva era
8 de desembre de 2023

    Google lo llama "la nueva era de Gemini", porque están convencidos de que va a cambiar el mundo.
    Esta nueva inteligencia artificial multimodal trabaja con texto, audio, vídeo, imágenes, código, y otro contenido.
    He usado LuzIA, el asistente de inteligencia artificial de WhatsApp, durante semanas y aunque tiene cosas que pulir me parece un añadido fantástico.

Olvídate de lo que sabes o has probado hasta ahora de la IA de Google. Gemini es la inteligencia artificial que Google lleva una década desarrollando. La IA que iba a darle a Google el monopolio del mercado, como hizo el buscador de Google hace tres décadas... si no llega ser por la arrolladora irrupción de OpenAI y GPT, que pilló a todos por sorpresa.

Google siempre ha presumido de ser la compañía pionera en el mercado de la inteligencia artificial. Lleva casi una década desarrollando modelos de IA. Seguramente Gemini iba a ser un gran estreno, pero OpenAI se les adelantó con ChatGPT.

Hoy, según ha dicho el CEO de Google, Sundar Pichai, comienza una nueva era: la era de Gemini, la inteligencia artificial multimodal capaz de trabajar con texto, audio, vídeo, imágenes, código, y otro contenido. Y ya está disponible dentro de Bard.

Qué es Gemini, la nueva IA que supera a GPT-4

Compañías como OpenAI, Meta y otras, disponen de modelos de lenguaje especializados para cada tarea. Por ejemplo, ChatGPT se basa en texto, DALL-E en imágenes, y Whisper en el audio. Cada IA se especializa en un "sentido".

Si ChatGPT tiene una petición de imágenes, usa DALL-E para generarla. Colaboran entre sí. El enfoque de Gemini es muy diferente.

Gemini es el nuevo modelo de lenguaje grande (LLM) de Google que, según sus creadores, supera ampliamente a GPT-4. Es más potente en 30 de 32 benchmarks en donde lo han probado.

Gemini es una IA multimodal: puede trabajar al mismo tiempo con texto, vídeo, imágenes, audio, código, etc. Esto, en teoría, hará que sea más rápida y precisa que usar varias IAs especializadas. Google asegura que, con el tiempo, irá añadiendo nuevos "sentidos". Incluyendo el tacto de los robots.

Gemini promete ser también la mejor a la hora de corregir y revisar código. Integra la nueva versión AlphaCode 2, que es el doble de potente que su predecesora. Y, según Google, supera al 85% de la competencia, generando código seguro y estable.

Las tres versiones de Gemini

Otra característica interesante es que existen tres versiones de la IA: Gemini Nano, Gemini Pro, y Gemini Ultra.

Gemini Nano es una versión recortada basada en texto, tipo ChatGPT, que puede funcionar en los móviles en modo local, sin necesidad de acceder a la nube. La acaba de integrar en los Pixel 8 Pro.

Gemini Pro será la versión que se integrará en los servicios de Google, con funciones similares a ChatGPT, DALL-E, Whisper, Stable Diffusion, etc. Será la que usen la mayoría de los usuarios individuales en ordenadores, o en móviles conectados a la nube. Gemini Pro acaba de integrarse en Google Bard.

Finalmente, Gemini Ultra, que no estará disponible hasta principios de año, es la versión premium para servidores y empresas.

En su blog, Google se muestra convencida de que Gemini va a marcar un antes y un después en el mercado de la inteligencia artificial, como en su momento hizo con su buscador. La teoría es muy prometedora, pero aún queda por comprobar cómo funciona en la práctica. Como hemos comentado, Gemini Pro ya está disponible a través de Google Bard, aunque solo en inglés, y para países anglosajones.

https://computerhoy.com/google/gemini-inteligencia-artificial-google-mas-potente-gpt-4-1346392

ARTICLES PUBLINET
Qué es Bizum: cómo funciona la solución de pagos online de la banca española
24 d’abril de 2025

En una época en la que todos nuestros datos los llevamos en el bolsillo, concentrados en nuestros dispositivos móviles, no es de extrañar que la posibilidad de pago digital haya ido cobrando fuerza hasta tal punto que ha comenzado a imponerse al din...

Leer más...
Del pago a la fidelización: cómo convertir cada operación en una ventaja competitiva
24 d’abril de 2025

En el comercio digital, cada interacción con un cliente es una oportunidad única para fortalecer la relación, construir lealtad y diferenciarse de la competencia. La fase de pago, que tradicionalmente se ha visto como un simple trámite final...

Leer más...
Notícies
OpenAI se postula para comprar Chrome
24 d’abril de 2025

Aun cuando todavía se desconoce si finalmente Google deberá trocear su negocio, ya hay quienes buscan quedarse con los pedazos más jugosos. Este es el caso de OpenAI, que ha revelado su interés por comprar Chrome a Google en caso de que la re...

Google no eliminará las cookies de terceros
24 d’abril de 2025

Google da otro «plot twist» en sus anuncios sobre privacidad y dice que, finalmente, no eliminará las cookies de terceros en Chrome tal y como había anunciado previamente a través de la iniciativa Privacy Sandbox. Este cambio responde a...

Meta amplía los anuncios en Threads a nivel global
24 d’abril de 2025

Meta anunció la expansión global de los anuncios en Threads, permitiendo a todos los anunciantes elegibles activar campañas en la red social integrada con Instagram. Threads Ads ya está disponible en más de 30 países, incluyendo...