En mayo de 2024, Google hizo un anuncio que promete revolucionar la manera en que interactuamos con la inteligencia artificial: el lanzamiento de «Gemini Live». Este innovador modo de chat de voz, cuyo objetivo es proporcionar una interacción conversacional más fluida y natural, fue inicialmente exclusivo para los suscriptores de Gemini Advanced y en idioma inglés. Sin embargo, a partir de ahora, esta función ha comenzado a expandirse para los usuarios gratuitos del sistema operativo Android, lo que marca un hito en la democratización de la tecnología basada en inteligencia artificial.
Gemini Live permite a los usuarios participar en diálogos con la IA de Google de forma casual y amena, replicando la sensación de hablar con un amigo. Esta herramienta de chat no solo ofrece respuestas más humanas, sino que también está diseñada para facilitar el flujo de conversación. Una de sus características más destacadas es la capacidad de realizar pausas o interrumpir respuestas sin necesidad de tocar el dispositivo, lo cual permite reanudar el diálogo en cualquier momento de manera intuitiva. Además, el servicio opera en segundo plano, liberando al usuario para que realice otras actividades o incluso bloquee su teléfono, sin perder la continuidad de la conversación.
La inteligencia de Gemini Live se enriquece con su naturaleza multimodal. Esto significa que no solo comprende texto y voz, sino que también tiene la capacidad de procesar imágenes. Google ha manifestado sus intenciones de expandir estas funciones para incluir video en un futuro próximo, lo que abriría las puertas a un espectro aún más amplio de interacciones, desde consultas simples hasta la gestión de tareas más complejas.
Otro aspecto esencial de Gemini Live es la variedad de voces disponibles, que actualmente incluye diez opciones diferenciadas por rangos y tonos. Éstas son: Nova, Ursa, Vega, Pegasus, Órbita, Lyra, Orión, Dipper, Eclipse y Capella. Esta diversidad permite a los usuarios personalizar la experiencia de chat de acuerdo a sus preferencias y necesidades, asegurando que se sientan más cómodos al comunicarse con la inteligencia artificial.
Acceder a Gemini Live es sencillo: los usuarios deben buscar una forma de onda circular en la parte inferior derecha de la interfaz de su aplicación. Una vez dentro, se encuentran con dos botones principales: «Mantener» y «Finalizar», los cuales les permitirán controlar la conversación en cualquier momento. Lo más notable es que, incluso si el usuario sale de la pantalla de Gemini Live, el chat sigue activo en segundo plano, garantizando así una experiencia fluida y sin interrupciones.
Al finalizar una conversación, Gemini Live guarda automáticamente una transcripción del diálogo en la sección de historial, donde se registran tanto las preguntas del usuario como las respuestas de la IA. Esta función no solo facilita la continuidad en futuras interacciones, sino que también permite revisar temas previamente tratados.
No obstante, existe una limitación en cuanto a la integración de ciertas aplicaciones. Según el medio especializado 9to5Google, actualmente Gemini Live no permite el acceso a aplicaciones mediante extensiones de Live, como Gmail o YouTube Music. Sin embargo, se anticipa que en un futuro cercano estas integraciones se habiliten, ampliando las capacidades del servicio.
En resumen, el lanzamiento de Gemini Live representa un avance significativo en las tecnologías de inteligencia artificial aplicadas a la vida cotidiana. Con planes de incluir más idiomas y potenciar su funcionalidad, Google está bien posicionado para llevar esta innovadora herramienta a una audiencia global, brindando experiencias enriquecedoras y personalizadas que podrían cambiar la forma en que interactuamos con la tecnología.