OpenAI ha introducido una función en ChatGPT, chat de inteligencia artificial, el análisis de video en tiempo real. La nueva modalidad permitirá a los usuarios interactuar con su entorno a través de la cámara de sus teléfonos celulares. La actualización, integrada en el Modo de Voz Avanzado, se desplegará gradualmente para teléfonos Android y iOS.
La herramienta aprovecha el modelo GPT-4o, una tecnología avanzada capaz de procesar texto, audio e imágenes simultáneamente. Este desarrollo permite a ChatGPT reconocer objetos, interpretar instrucciones o resolver problemas matemáticos en tiempo real, haciendo las interacciones más naturales y fluidas.
MIRA: Adiós a las tareas domésticas: este robot plancha, cocina, limpia y cuida a tu gato
Activar la función es muy sencillo. Estando una conversación de voz, los usuarios solo deben seleccionar el ícono de la videocámara en la barra de consultas. Una vez activada, podrán apuntar la cámara hacia un objeto y realizar preguntas por voz.
Durante su presentación, OpenAI demostró cómo el sistema puede guiar en el uso de objetos cotidianos, como un kit para preparar café, ofreciendo respuestas precisas y recomendaciones adicionales.
Además del análisis de objetos físicos, la función permite explorar el contenido de las pantallas de dispositivos electrónicos. Al compartir pantalla, ChatGPT puede identificar elementos de imágenes, explicar manuales de configuración y ofrecer soluciones a problemas técnicos.
Aunque similar al ‘Project Astra’ de Google, aún en fase de prueba, esta herramienta destaca por estar lista para un lanzamiento global. Sin embargo, su disponibilidad estará limitada en países de la Unión Europea y algunas regiones vecinas debido a restricciones regulatorias.
Desde El Comercio pudimos utilizar la función desde un dispositivo iOS. De acuerdo a la compañía, irá llegando a todos los equipos paulatinamente.
La incorporación del análisis de video es parte de una serie de anuncios de OpenAI para cerrar el año. Entre ellos se incluyen Canvas, una plataforma para escritura y programación, y Sora, una herramienta capaz de generar contenido multimedia hiperrealista.
TE PUEDE INTERESAR
- Conectarse para Crecer 2024: se premió a los proyectos más innovadores del Perú
- China pone en marcha acelerador de iones pesados con capacidades avanzadas
- Científica peruana es destacada en Top 100 de la BBC 2024: “Soy la única, pero sé que muchas más seguirán pronto”
- ¿Cuál es el origen de ‘Chill Guy’, el meme que arrasa en redes sociales, y qué significa?
Contenido sugerido
Contenido GEC