OpenAI mejora la usabilidad de ChatGPT, introduciendo una nueva función de audio para conversaciones verbales

OpenAI mejora la usabilidad de ChatGPT, introduciendo una nueva función de audio para conversaciones verbales

OpenAI, el creador de AI Chatbot ChatGPT, lanzó hoy una nueva función de voz de chatbot para permitir la comunicación verbal. Esto es según una nueva publicación de blog publicada en la plataforma Open AI.

La compañía anunció que la nueva función de voz proporciona un tipo de interfaz nuevo y más intuitivo al permitir a los usuarios tener un chat de voz o mostrar a ChatGPT de qué están hablando.

el escribio,

Mini MBA de Tikidia (11 de septiembre – 2 de diciembre de 2023) ha comenzado; El registro continúa Elsh

Masterclass de IA en Empresas de Tekedia Abre inscripciones aquí.

Únase al sindicato Tekedia Capital Él participó en yoInvierta en las mejores startups de África aquí. La próxima sesión comienza el 2 de octubre de 2023.

«Estamos comenzando a implementar nuevas capacidades de audio y video en ChatGPT. Proporciona un tipo de interfaz nuevo y más intuitivo que le permite tener un chat de voz o mostrarle a ChatGPT de qué está hablando.

«El audio y el video le brindan más formas de usar ChatGPT en su vida. Estamos implementando audio y video en ChatGPT para usuarios Plus y Enterprise durante las próximas dos semanas. El audio está disponible en iOS y Android (regístrese en su configuración) e imágenes estarán disponibles en todas las plataformas.

OpenAI agregó que la nueva función de voz es capaz de crear voces sintéticas realistas a partir de solo unos segundos de habla real.

Meta planea atraer a una audiencia más joven con chatbots impulsados ​​por inteligencia artificial, que la empresa matriz de Facebook lanzará en sus aplicaciones de redes sociales a partir de esta semana, informó el Wall Street Journal, citando fuentes anónimas. Los bots, conocidos internamente como Gen AI Personas, tienen personalidades distintas y su principal objetivo es estimular la participación. Desde que TikTok superó a Meta en popularidad entre los adolescentes, el gigante de las redes sociales ha cambiado su enfoque hacia una audiencia más joven y lejos de la población más grande de personas mayores, dijo el periódico. Se espera que Meta anuncie los chatbots en su conferencia Meta Connect. Que comienza el miércoles. (Noticias de LinkedIn)

La compañía reveló que colaboró ​​con actores de doblaje profesionales para crear cada voz. También agregó que utilizó Whisper, un sistema de reconocimiento de voz de código abierto, para convertir las palabras habladas de los usuarios en texto.

READ  Apple lanzó Safari Technology Preview versión 156 con correcciones de errores y mejoras de rendimiento

OpenAI implementará esta función para los suscriptores de pago Plus y Enterprise en las próximas semanas. Para comenzar a usar la función de voz, los usuarios pueden dirigirse a Configuración, tocar Nuevas funciones en la aplicación móvil y elegir Chats de voz.

Una vez hecho esto, tocan el botón de auriculares ubicado en la esquina superior derecha de la pantalla de inicio y eligen su sonido preferido entre cinco sonidos diferentes.

La nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de habla real, lo que abre las puertas a muchas aplicaciones creativas centradas en la accesibilidad.

Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude.

Es por eso que se anunció que la tecnología se utilizará para activar un chat de voz para un caso de uso específico.

La introducción de la función de audio por parte de OpenAI sigue a un informe de junio de 2023, que reveló que los visitantes únicos globales al sitio web ChatGPT disminuyeron un 5,7%.

Los datos de la empresa de análisis de Internet Sameweb muestran que las visitas a sitios web globales cayeron casi un 10% en junio en comparación con mayo. Los usuarios se han quejado de que el chatbot impulsado por IA está cometiendo más errores.

Sin embargo, los informes revelaron que la disminución del interés no se debía solo a ChatGPT sino a uno de sus principales competidores, lo que demuestra que la novedad ha desaparecido para la IA del chat.

READ  El nuevo sintetizador Montage M de Yamaha contiene 400 notas polifónicas

Sin embargo, OpenAI indicó que continuará mejorando la funcionalidad de ChatGPT para mejorar la experiencia del usuario.

Presta atención, Alexa: escribir texto ya no es la única forma de interactuar con ChatGPT. OpenAI ha presentado una nueva versión que permite a los usuarios hablar en voz alta o cargar una foto para avisar a su chatbot. ChatGPT puede responder con una de cinco voces, que a veces son «casi indistinguibles de una voz humana», según un evaluador. Esta tecnología tiene mayores implicaciones para empresas como Spotify, que anunció que está trabajando con OpenAI para traducir podcasts a diferentes idiomas utilizando versiones sintéticas de las voces de los presentadores.

Las nuevas funciones de ChatGPT estarán disponibles con una suscripción paga dentro de dos semanas y de forma gratuita “poco después”, dijo la compañía. (LinkedIn)

You May Also Like

About the Author: Pino Toribio

"Fanático de Internet en general. Gurú de Twitter sin complejos. Introvertido. Lector total. Ninja de la cultura pop. Entusiasta de las redes sociales".

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *