ChatGPT ahora será multimodal: qué significa y cuáles son las mejoras que podrán disfrutar los usuarios

El nuevo sistema multimodal de ChatGPT presentado por OpenAI promete convertirse en el siguiente paso del desarrollo de la Inteligencia Artificial

Chatgpt

La nueva versión de ChatGPT será desplegada de manera progresiva para poder realizar las mejoras necesarias y así mitigar los riesgos de seguridad Crédito: Shutterstock

OpenAI presentó por sorpresa una nueva versión de ChatGPT que cuenta con la novedad de incorporar la capacidad de ser un sistema multimodal permitiendo así una interacción más rica y compleja entre la IA y los usuarios.

Con la nueva versión multimodal de ChatGPT ahora, no solo puedes comunicarte a través de texto, sino que también puedes aprovechar la voz y las imágenes para darle vida a tus conversaciones con esta IA. Esto abre un mundo completamente nuevo de posibilidades y usos para ChatGPT.

Voz

¿Alguna vez quisiste entablar una conversación real con una IA? Ahora es posible gracias a la capacidad de voz de ChatGPT. Imagina hablar con tu asistente mientras viajas, pedirle un cuento antes de dormir para tu familia o resolver un debate en la mesa. La voz hace que la interacción con la inteligencia artificial sea más natural y accesible que nunca.

Para comenzar a utilizar la voz, simplemente dirígete a la configuración de la aplicación móvil y habilita las conversaciones de voz. ¡Incluso puedes elegir entre cinco voces diferentes para darle un toque personal a tus interacciones!

OpenAI ha trabajado en estrecha colaboración con actores de doblaje profesionales para crear voces sintéticas realistas a partir de solo unos segundos de voz real. Esto no solo garantiza una experiencia de conversación auténtica, sino que también abre la puerta a aplicaciones creativas y centradas en la accesibilidad.

Imágenes

Ahora los usuarios pueden interactuar con ChatGPT con tan solo mostrarle una o más imágenes y obtener respuestas relevantes. ¿Tienes problemas con tu parrilla? ¿Necesitas planificar una comida con lo que tienes en el refrigerador? ¿Deseas analizar un gráfico complejo? ChatGPT puede ayudarte a hacerlo todo.

Para enfocarte en una parte específica de una imagen, utiliza la herramienta de dibujo en la aplicación móvil. Esto te permite destacar lo que deseas que ChatGPT analice con mayor detalle.

Más seguridad

OpenAI indicó que se toma muy en serio la seguridad y la responsabilidad en la inteligencia artificial. Es por eso que anunciaron que están implementando estas nuevas capacidades gradualmente. Esta estrategia les permite realizar mejoras, mitigar riesgos y preparar a todos para sistemas más potentes en el futuro.

La tecnología de voz de ChatGPT tiene un potencial increíble, pero también plantea nuevos desafíos. OpenAI se enfoca inicialmente en el chat de voz, donde han trabajado directamente con actores de voz para garantizar la autenticidad de las conversaciones. Además, están colaborando con otros, como Spotify, para expandir el alcance de esta tecnología a través de la traducción de voz en podcasts.

Para aquellos ansiosos por probar estas emocionantes capacidades, las buenas noticias son que los usuarios Plus y Enterprise podrán disfrutar de la voz e imágenes en las próximas dos semanas. OpenAI también tiene planes de implementar estas funciones para otros grupos de usuarios en el futuro cercano, lo que significa que la innovación y la accesibilidad están en constante crecimiento en el mundo de ChatGPT.

Sigue leyendo:
Qué es la “alucinación” de la inteligencia artificial y por qué es una de las fallas potencialmente más peligrosas de esta tecnología
ChatGPT es una máquina de quemar dinero: revelan cuánto cuesta mantenerlo activo
ChatGPT Enterprise: cuáles son las funciones de la nueva versión de IA de OpenAI

En esta nota

Inteligencia artificial OpenAI
Contenido Patrocinado
Enlaces patrocinados por Outbrain