Inicio Tecnología Chrome está mejorando en su comprensión de las pausas y puntuaciones que...

Chrome está mejorando en su comprensión de las pausas y puntuaciones que nunca dices en voz alta

28
0

Google está silenciosamente haciendo que el dictado de voz en Chrome parezca mucho más pure. Con el último Chrome 151 Beta, la compañía está introduciendo una nueva capacidad que permite que el motor de reconocimiento de voz del navegador infiera automáticamente la puntuación según la forma en que las personas hablan, eliminando la necesidad de decir explícitamente comandos como «coma» o «punto».

La actualización puede parecer menor a primera vista, pero aborda una de las mayores frustraciones con la escritura por voz: hablar de forma pure a menudo produce texto que carece de puntuación a menos que los usuarios dicten conscientemente cada signo de puntuación. Al enseñarle a Chrome a comprender las pausas, el ritmo y los patrones del habla, Google está dando un paso más para hacer que las conversaciones con las computadoras se sientan más humanas.

Chrome quiere entender cómo hablas, no sólo lo que dices

El llega una nueva característica a través de Net Speech API en Chrome 151 Beta. Google ha añadido un nuevo puntuación tácita atributo booleano al Reconocimiento de voz interfaz. Cuando está habilitado, el motor de reconocimiento de voz inserta automáticamente puntuación basada en pausas, entonación y prosodia en lugar de requerir que los usuarios digan comandos de puntuación en voz alta.

En términos prácticos, eso significa que los usuarios pueden dictar un correo electrónico, documento o mensaje en un estilo conversacional más pure mientras Chrome determina dónde pertenecen las comas, los puntos y otros signos de puntuación.

La mejora es particularmente útil para sesiones de dictado más largas en las que decir repetidamente «coma», «punto» o «signo de interrogación» interrumpe el flujo pure del habla. También podría hacer que las herramientas de transcripción basadas en navegador, las aplicaciones para tomar notas, el software program de accesibilidad y los asistentes de escritura con tecnología de inteligencia synthetic sean mucho más fluidos.

Los desarrolladores también se beneficiarán

Debido a que la característica es parte de la API Net Speech de Chrome, las aplicaciones net que dependen del reconocimiento de voz pueden implementar la funcionalidad sin tener que crear sus propios modelos de puntuación.

Google cube que la función funciona analizando las pausas del habla y la prosodia en lugar de depender únicamente de las palabras habladas, acercando el reconocimiento de voz basado en navegador a la forma en que los humanos se comunican naturalmente.

La incorporación también refleja una tendencia más amplia en todo el ecosistema de software program de Google. A medida que los modelos de lenguaje impulsados ​​por Gemini y la IA se integran cada vez más en productos como Chrome, Android y Workspace, la empresa está poniendo mayor énfasis en comprender la conversación humana pure en lugar de exigir a los usuarios que adapten su habla a las máquinas.

Chrome 151 Beta ya incluye la función para que los desarrolladores la prueben, aunque una disponibilidad más amplia dependerá del calendario de lanzamiento estable del navegador. Al igual que con muchas API experimentales, los desarrolladores determinarán en última instancia qué tan ampliamente se adopta en las aplicaciones net.

Si bien la puntuación automática no transformará la escritura por voz de la noche a la mañana, es el tipo de mejora en la calidad de vida que los usuarios probablemente notarán cada vez que dictan un mensaje o transcriben una conversación. A veces, las mayores actualizaciones no son nuevas y llamativas funciones de IA, sino pequeños cambios que hacen que la tecnología comprenda mejor cómo se comunican las personas.

fonte