Google revela Gemini AI

Google revela “Gemini”, el proyecto de ciencia e ingeniería más grande de su historia, afirma. El sistema de inteligencia artificial llegará a todo, desde el chatbot Bard hasta los teléfonos Pixel. También es el último intento de la compañía de alcanzar a su rival OpenAI para desarrollar inteligencia artificial e intentar construir un sistema mejor que su ChatGPT.

 

Como tal, Gemini llegará a Bard de Google, el chatbot que lanzó a raíz de ChatGPT en un intento de ponerse al día. Pero también se implementará en los teléfonos Pixel de Google y en otros lugares. Google admitió que no estaba claro cuál era realmente el modelo y el director ejecutivo, Sundar Pichai, dijo que era mejor entenderlo en uso.

 

Gemini se lanzará en Bard en más de 170 países en todo el mundo, excepto en el Reino Unido. Pichai dijo que era la mayor actualización de Bard hasta el momento. Dijo que están dando el siguiente paso en nuestro viaje con Gemini, nuestro modelo más capaz y general hasta el momento, con un rendimiento de última generación en muchos puntos de referencia líderes. “Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa”.

 

Se produce cuando los rápidos avances en la IA se aceleran, tras el último lanzamiento de ChatGPT en marzo, y Google sigue su ejemplo en medio de una ola de modelos de IA generativa de próxima generación, que los expertos predicen que serán significativamente más avanzados.

 

Google afirma que Gemini es el primer modelo de inteligencia artificial que supera a los “expertos humanos” en su gama de pruebas de inteligencia. Planea lanzarse primero en inglés, pero se expandirá a diferentes idiomas y otros países “en un futuro próximo”.

 

Google dijo que Gemini será “multimodal”, lo que significa que podrá operar y combinar diferentes tipos de información a través de palabras, imágenes, videos y sonidos.

 

“Gemini es también nuestro modelo más flexible hasta el momento: capaz de ejecutarse eficientemente en todo, desde centros de datos hasta dispositivos móviles”, afirmó. Bard utilizará Gemini Pro, uno de los tres niveles del modelo, para permitir “razonamiento, planificación, comprensión y más avanzados”.

 

Gemini también estará integrado en sus teléfonos inteligentes Pixel 8 Pro, potenciando nuevas funciones como “resumen” en su aplicación de grabación, así como “respuesta inteligente” en el teclado de Google, comenzando con los mensajes de WhatsApp.

 

Confirmó que estará disponible en más productos y servicios “en los próximos meses”, como Search, Ads, Chrome y Duet AI, que es el asistente en la nube impulsado por IA de Google.

 

El grupo dijo que incorporará salvaguardias mientras trabaja “en colaboración” con gobiernos y expertos para ayudar a evitar los crecientes riesgos de la IA.

 

Gemini se anuncia como el modelo de Inteligencia Artificial más avanzado que ha desarrollado hasta la fecha. Este es el resultado de los esfuerzos colaborativos a gran escala por parte de distintos equipos de Google, incluidos Google DeepMind y Google Research y se trata del proyecto científico y de investigación más grande de la compañía hasta el momento.

 

Se ha optimizado Gemini 1.0, la primera versión de este modelo, en tres dimensiones diferentes:

  • Gemini Ultra: el modelo de mayor capacidad y tamaño para tareas complejas
  • Gemini Pro: el mejor modelo para escalar una amplia gama de tareas
  • Gemini Nano: el modelo más eficiente para tareas en dispositivos móviles.

 

¿Qué es Gemini?

Es un modelo de Inteligencia Artificial multimodal, lo que significa que puede generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.

 

También es el modelo más flexible hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos. Gemini mejorará significativamente la forma en la que los clientes corporativos y desarrolladores construyen y escalan con IA.

 

Basado en tecnología de última generación

Hasta el momento, el método estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades, y luego unirlos para imitar a grandes rasgos algunas de sus funciones. A veces, estos modelos pueden ser buenos en determinadas tareas, como la descripción de imágenes, pero tienen algunas dificultades con el razonamiento más conceptual y complejo.

 

Por eso, la compañía diseñó Gemini, para que fuera un modelo de IA multimodal de forma nativa, es decir, previamente entrenado en diferentes modalidades (y desde el inicio). Se perfeccionó con datos multimodales adicionales para poder mejorar su eficacia. Esto ayuda a Gemini a comprender y razonar sin problemas todo tipo de entradas desde el principio, mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos.

 

Pruebas comparativas

Este nuevo modelo de IA se ha puesto a prueba rigurosamente y evaluando su rendimiento en una amplia variedad de tareas que abarcan: desde la comprensión de imágenes naturales, audio y video, hasta codificación y el razonamiento matemático. El desempeño de Gemini Ultra supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos. Podrán conocer más en este documento técnico, haciendo clic aquí.

 

Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:

 

Para usuarios

  • A partir de hoy, Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios. Esta herramienta será más capaz en cuestiones como comprender y resumir, razonar, generar ideas, escribir y planificar. Esta es la mayor mejora de calidad de Bard desde su lanzamiento.
  • También se llevará “Gemini” a Pixel. Pixel 8 Pro es el primer teléfono inteligente diseñado para ejecutar Gemini Nano que impulsa nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard, comenzando con WhatsApp, y el próximo año se incluirán más aplicaciones de mensajería.

 

Ejemplo de resumen en la aplicación de grabadora en Pixel 8 pro

 

  • Como parte de las exhaustivas verificaciones de confianza y seguridad de Gemini Ultra, Google lo pondrá a disposición de clientes, desarrolladores, socios y expertos en seguridad y responsabilidad seleccionados para que experimenten y den su opinión antes de lanzarlo para desarrolladores y clientes corporativos, a principios del año que viene.
  • A principios del 2024, la compañía lanzará Bard Advanced: una nueva experiencia de IA avanzada mediante la que podrá acceder a los mejores modelos y capacidades, comenzando por Gemini Ultra.
  • Y ya estamos trabajando para que Gemini potencie otros productos como Search, Chrome, nuestros anuncios y Duet AI.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

PHP Code Snippets Powered By : XYZScripts.com