Skip to content

Nuevas Capacidades de Voz e Imagen en ChatGPT: Una Interfaz Más Intuitiva


Introducción

ChatGPT está introduciendo nuevas capacidades de voz e imagen, permitiendo una interacción más intuitiva. Ahora puede tener una conversación por voz o mostrar imágenes a ChatGPT para discutir sobre ellas, enriqueciendo así la manera en que interactúa con la plataforma.

X.com - OpenAI @OpenAI

ChatGPT ya puede ver, oír y hablar. En las próximas dos semanas, los usuarios de Plus podrán mantener conversaciones de voz con ChatGPT (iOS y Android) e incluir imágenes en las conversaciones (todas las plataformas).

X.com - OpenAI @OpenAI

Utiliza tu voz para entablar una conversación de ida y vuelta con ChatGPT. Habla con él sobre la marcha, pídele un cuento para dormir o zanja un debate en la mesa.

Capacidades de Voz

Configuración y Uso

El nuevo módulo de voz permite una conversación bidireccional con su asistente. Para empezar, diríjase a Configuraciones → Nuevas Características en la aplicación móvil y active las conversaciones por voz. Esta funcionalidad es impulsada por un nuevo modelo de texto a voz, brindando una experiencia de audio cercana a la humana.

Aplicaciones Creativas

Las capacidades de voz abren un abanico de aplicaciones creativas y centradas en la accesibilidad, como solicitar historias antes de dormir o resolver debates en la mesa de cena.

Capacidades de Imagen

Integración y Operación

Ahora puede mostrar una o más imágenes a ChatGPT para obtener ayuda en diversos temas, desde planificar una comida hasta analizar gráficos complejos. La comprensión de imágenes es impulsada por los modelos multimodales GPT-3.5 y GPT-4.

Mejorando la Visión y Seguridad

Las características de visión buscan asistir en la vida cotidiana, con medidas técnicas para limitar la capacidad de ChatGPT de hacer afirmaciones directas sobre personas y respetar la privacidad.

Despliegue Gradual y Feedback

Las nuevas capacidades se desplegarán gradualmente para los usuarios Plus y Enterprise, buscando refinamiento y preparación para sistemas más avanzados en el futuro. La retroalimentación de los usuarios será crucial para mejorar las salvaguardas y mantener la herramienta útil.

Transparencia y Expansión de Acceso

Se mantiene una transparencia sobre las limitaciones del modelo, y se planea expandir el acceso a estas nuevas capacidades a otros grupos de usuarios, incluyendo desarrolladores, en las próximas semanas.

ChatGPT continúa evolucionando, y estas nuevas capacidades de voz e imagen son un paso adelante significativo hacia una interacción más intuitiva y enriquecedora para los usuarios.

Más información en OpenAI.