Las grandes estrellas azules de la tecnología de reconocimiento de voz de la ópera

empresa noruega Ópera añade la tecnología de reconocimiento de voz de IBM a su software de navegación gratuito. La compañía, que recaudó alrededor de $18 millones en una oferta pública inicial a principios de este mes, dijo que inicialmente apuntaba a la tecnología de voz estandarizada ViaVoice de IBM a los clientes y desarrolladores de la compañía.

Aunque nos estamos acercando a la finalización del estándar Voice XML 2.0, y Opera tendrá la competencia de Microsoft con su tecnología Speech Application Language Tag, Gartner El vicepresidente de investigación, Martin Reynolds, dijo que la tecnología de voz todavía estaba fuera de su alcance.

«El reconocimiento de voz ha estado surgiendo durante casi 15 años», dijo Reynolds a El Diario del Mundo. “Hay lugares donde funciona, pero es bastante desigual. Es bastante nicho.

Inversión sabia

Opera ha logrado quitarle participación de mercado al navegador dominante Microsoft Internet Explorer con su tecnología rápida y flexible que requiere menos memoria para ejecutarse en computadoras y dispositivos portátiles. La compañía dijo que ahora está comenzando con la tecnología de reconocimiento de voz.

«La voz es el medio de comunicación más natural y efectivo», dijo el vicepresidente de ingeniería de Opera, Christen Krogh. «Al hacer que esta tecnología esté disponible para una audiencia web más amplia hoy, puede comenzar el trabajo serio de activación de voz sobre web».

Opera dijo que construiría las bibliotecas de voz de IBM en su navegador utilizando XHTML+Voice (X+V), un estándar que, según la compañía, permitirá a los desarrolladores agregar entrada y salida de voz a las páginas web con instrumentos tradicionales basados ​​en gráficos para lograr una funcionalidad vocal natural.

La compañía describió un escenario en el que la herramienta de presentación de Opera podría usarse para reemplazar Microsoft PowerPoint. Al agregar las nuevas capacidades de voz del navegador Opera, el navegador podría usarse para dar una presentación y pasar a la siguiente diapositiva simplemente proporcionando un comando de voz.

Activación de voz

Jonathan Engelsma de Motorola, editor de Revisión de VoiceXML, dijo que la separación de la plataforma y la aplicación, junto con estándares como VoiceXML que ya están en uso, permiten agregar más y más capacidades de voz fácilmente en una variedad de configuraciones.

«Puede crear aplicaciones de voz en la web sin experiencia ni maquinaria especial», dijo Engelsma a El Diario del Mundo. «Puede escribir una aplicación según las especificaciones y luego ejecutarla en varias plataformas».


Igor Jablokov, director de voz integrada en IBM y presidente del VoiceXML Forum, dijo que la nueva oferta de Opera permitirá una interacción más natural con el contenido web. Agregó que los desarrolladores podrán aprovechar su conocimiento existente para producirlo.

«Los desarrolladores también pueden comenzar a crear contenido multimodal utilizando el lenguaje de marcado X+V basado en estándares abiertos, que unifica la web visual y de voz utilizando las habilidades de desarrollo que una gran población de programadores ya posee en la actualidad», dijo Jablokov.

Decir de nuevo

Si bien estuvo de acuerdo en que la tecnología de reconocimiento de voz algún día estará a nuestro alrededor, Reynolds de Gartner dijo que la tecnología aún necesita ser refinada y respaldada en toda la industria.

«Nos encontraremos usando mucho más», dijo Reynolds. «Está sembrado e incrustado en todo tipo de cosas».

Sin embargo, Reynolds dijo que con varios lectores de reconocimiento de voz más pequeños colapsando y los que permanecen siendo conservadores, la tecnología aún no es objeto de una pelea entre sus defensores.

“Realmente no hay competencia porque todavía no hay un mercado”, dijo Reynolds.

Opera dijo que su navegador de voz incorporado de IBM estará inicialmente disponible en inglés para máquinas con Windows.

Cerrado excepto abierto

Jablokov de IBM le dijo a El Diario del Mundo que con la realización del ROI y los estándares emergentes, la tecnología de reconocimiento de voz está lista para la empresa, donde IBM visualiza el soporte de back-end necesario para integrar el habla en la infraestructura empresarial.


«Lo que ves es [that] el habla está realmente integrada”, dijo Jablokov.

Refiriéndose a una serie de anuncios sobre la tecnología de voz de IBM en la conferencia AVIOS SpeechTEK 2004, Jablokov minimizó el potencial de la tecnología SALT de Microsoft, que es propiedad de Microsoft.

“Promovemos estándares abiertos para que podamos tener este gran ecosistema para que los desarrolladores trabajen en la entrega de estas aplicaciones”, dijo Jablokov. «Aquellos [efforts] requiere buenas asociaciones para poder cumplir, y necesita estándares que estén abiertos y respaldados por WC3. Cualquier cosa más allá de eso es solo un juguete desconectado.

———————————————————————————————————————–
Esperamos que te haya gustado el contenido de nuestro Blog El Diario del Mundo, sí fue así, por favor compártelo nos ayudarías mucho para seguir publicando más contenido.

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada.