Appearance
Nuevas Capacidades de Voz e Imagen en ChatGPT: Una Interfaz Más Intuitiva
Introducción
ChatGPT está introduciendo nuevas capacidades de voz e imagen, permitiendo una interacción más intuitiva. Ahora puede tener una conversación por voz o mostrar imágenes a ChatGPT para discutir sobre ellas, enriqueciendo así la manera en que interactúa con la plataforma.
X.com - OpenAI @OpenAI
ChatGPT ya puede ver, oír y hablar. En las próximas dos semanas, los usuarios de Plus podrán mantener conversaciones de voz con ChatGPT (iOS y Android) e incluir imágenes en las conversaciones (todas las plataformas).
X.com - OpenAI @OpenAI
Utiliza tu voz para entablar una conversación de ida y vuelta con ChatGPT. Habla con él sobre la marcha, pídele un cuento para dormir o zanja un debate en la mesa.
Capacidades de Voz
Configuración y Uso
El nuevo módulo de voz permite una conversación bidireccional con su asistente. Para empezar, diríjase a Configuraciones → Nuevas Características en la aplicación móvil y active las conversaciones por voz. Esta funcionalidad es impulsada por un nuevo modelo de texto a voz, brindando una experiencia de audio cercana a la humana.
Aplicaciones Creativas
Las capacidades de voz abren un abanico de aplicaciones creativas y centradas en la accesibilidad, como solicitar historias antes de dormir o resolver debates en la mesa de cena.
Capacidades de Imagen
Integración y Operación
Ahora puede mostrar una o más imágenes a ChatGPT para obtener ayuda en diversos temas, desde planificar una comida hasta analizar gráficos complejos. La comprensión de imágenes es impulsada por los modelos multimodales GPT-3.5 y GPT-4.
Mejorando la Visión y Seguridad
Las características de visión buscan asistir en la vida cotidiana, con medidas técnicas para limitar la capacidad de ChatGPT de hacer afirmaciones directas sobre personas y respetar la privacidad.
Despliegue Gradual y Feedback
Las nuevas capacidades se desplegarán gradualmente para los usuarios Plus y Enterprise, buscando refinamiento y preparación para sistemas más avanzados en el futuro. La retroalimentación de los usuarios será crucial para mejorar las salvaguardas y mantener la herramienta útil.
Transparencia y Expansión de Acceso
Se mantiene una transparencia sobre las limitaciones del modelo, y se planea expandir el acceso a estas nuevas capacidades a otros grupos de usuarios, incluyendo desarrolladores, en las próximas semanas.
ChatGPT continúa evolucionando, y estas nuevas capacidades de voz e imagen son un paso adelante significativo hacia una interacción más intuitiva y enriquecedora para los usuarios.