Getting your Trinity Audio player ready... |
Google anunció el lanzamiento de Gemini AI, su modelo de inteligencia artificial generativa más avanzado hasta el momento y rival más importante de GPT-4.
Google DeepMind lideró el proyecto y de acuerdo a las declaraciones de Eli Collins, vicepresidente de producto de esta división, Gemini es un sistema multimodal nativa; capaz de entender (prácticamente) cualquier estímulo, ya sea texto, imágenes, videos o audio.
Características de Google Gemini AI
Un gran diferencial entre Gemini y el resto de modelos de AI es su capacidad de razonar de manera conceptual y discernir en medio de grandes cantidades de información.
Durante su presentación demostró ser capaz de obtener información de fórmulas matemáticas para resolver ejercicios, explicar el resultado paso a paso, generar gráficas a partir de datos y entregar detalles para complementar el resultado.
“Su notable capacidad para extraer información de cientos de miles de documentos a través de la lectura, el filtrado y la comprensión de la información ayuda a ofrecer nuevos avances a velocidades digitales en muchos campos, desde la ciencia hasta las finanzas”, señala la compañía.
Gemini también tiene la capacidad de entender el código de los lenguajes de programación más populares, como Python, Java, C++ y Go.
Respecto a esto, la empresa destacó que crearon un sistema de generación de código avanzado, llamado AlphaCode 2, que cuenta con la capacidad de resolver problemas de programación que van más allá de la codificación y donde se involucran matemáticas complejas y ciencias de la computación teórica.
Sundar Pichai, CEO de Google reconoce que Gemini es “un impulso increíble” para la empresa, sin embargo esta es sólo una pequeña muestra y están apenas “arañando la superficie de lo que es posible”.
Gemini se podrá integrar a Bard y tiene tres versiones
Google Gemini AI tiene tres versiones dependiendo de sus capacidades y se clasifican en:
Ultra: Es el modelo más grande y con la capacidad de realizar tareas complejas.
Pro: Un modelo optimizado para escalar gamas más amplias de tareas.
Nano: Enfocado en eficientar las tareas de IA en los dispositivos.
Asimismo, detalló que Bard, el asistente virtual usará una versión de Gemini Pro en inglés para un razonamiento, planificación y comprensión más avanzados.
De acuerdo a Google Gemini Pro superó a la versión GPT-3.5, de OpenAI, en la comprensión de insumos de diferentes tipos.
Bard con Gemini Pro está disponible para pruebas a partir de hoy mismo en más de 170 ciudades, pero sólo para interactuar por texto en inglés.
A principios del 2024 lanzarán Bard Advanced, un asistente mucho más avanzado que utilizará las capacidades de Gemini Ultra de acuerdo a Sissie Hsiao, directora general y vicepresidenta de la unidad de negocio de Google Assistant.