Hable, que su celular le obedece

Cuando una nota llega a la cabeza del productor musical José Gaviria la graba en su celular. "Muchas veces compongo cuando voy manejando, grabo mis propias notas de voz en el teléfono y hace una semana dicté un email; cuando revisé, me lo había escrito todo completo".

Con este mismo asombro, otros empiezan a confiar en nuevas formas de interactuar con los dispositivos a través de comandos de voz y gestos, tecnologías que ahora parecen escuchar y aspiran a ser "más humanas".

Lo confirma Luis Arturo Vargas, gerente de Producto de Samsung Colombia, quien indica que esta posibilidad no está solo en los teléfonos Galaxy, con SVoice, sino en los relojes inteligentes.

Cuando juega tenis, Luis va con el Galaxy Gear en la muñeca y deja el Note 3 (dispositivo atado al reloj) en el morral. Si entra una llamada contesta en su reloj. Usa el altavoz para hablar.

Cree que es ideal para lograr "inmediatez", y aunque por ahora no todo el mundo lo usa, allí está el futuro. De hecho empieza a verse como una opción omnipresente.

La PlayStation 4 usa comandos de voz para arrancar un juego, a la Xbox se le puede preguntar ¿qué hay en HBO?, y las Google Glass se conectan con solo activar el famoso "Ok Google Now", que también está presente en el Moto X, en el que este comando juega como el eje central.

Pocos se resisten a pedirle a Siri, la asistente inteligente por voz de Apple, que le publique un tuit, le describa el clima o le lea el mail. A veces se espera algo más. "Siri, me amas?, a lo que ella ( o él, porque la voz ya se puede configurar como masculina, responde: "Digamos que... tienes toda mi admiración".

La tecnología de procesamiento de lenguaje natural ha estado por décadas, pero compañías como Microsoft, Apple, Google, Dragon y Nuance, decidieron que era la hora de acercarlas al usuario.

De hecho esta última compañía es la responsable de dar vida a Siri, que se lanzó con el iPhone 4S en octubre de 2011. Recientemente CNN logró encontrar a Susan Bennet, la voz detrás de la asistente inteligente. Bennet vive en Atlanta y ha prestado su voz para compañías telefónicas y aerolíneas desde 1970.

No en público
Sin embargo, todo tiene su contexto. Para David González, gerente de Intel para el Cono Norte, los sensores de movimiento y reconocimiento de voz, sin duda requieren mayor procesamiento, reconoce que todavía están en fase experimentación y no aplican para todas las situaciones.

No se concibe "ordenar" al teléfono en un contexto social y resulta incómodo hacerlo en un ascensor. Privacidad se impone, aunque "se genera una computación más amigable porque hay múltiples formas de interactuar con ella".

Como confirma Carolina Escobar, gerente de Habilitación Tecnológica de Intel, los ultrabook con procesadores de cuarta generación que vendrán en 2014, tendrán pantalla multitáctil y funcionarán con aplicaciones de control de voz como Dragon.

Mientras usted trabaja será más fácil ordenarle poner una canción o publicar una foto en Facebook, sin necesidad de buscar el contenido en su biblioteca de archivos.

Algunos expertos como el economista Tyler Cowen le ponen un toque de ironía a este inevitable tecnológico. El autor del libro Average is over, escribió en una columna para The New York Times, que llegará un punto en el que los dispositivos recogerán tanta información de sus hábitos, preferencias y contactos, que si se le hace caso cuando sugiere algo tan personal como "ahora bese a su esposa", será visto como una marioneta de su teléfono, y si se revela a seguir la "sugerencia" parecerá perder al compañero de vida.

Otros autores como Erik Brynjolfsson y Andrew McAfee en su libro Race against the machine, creen que muchos empleos y oficios se perderán gracias a la automatización o las tecnologías de reconocimiento de voz, por citar dos.

La adopción masiva de esta última por parte del consumidor aún está por verse. La relación hombre-máquina no siempre ha sido fluida ni eficiente, pero por lo menos, ahora no resulta tan frustrante. Con ello se espera un avance sin tregua.

OPCIONES
¿QUÉ SE PUEDE HACER?

Pregunte por direcciones. Ideal cuando va manejando.
Deje que le lean su email. Lee los últimos que han llegado.
Dicte notas rápidas o cree recordatorios.
Agende una cita o una horapara levantarse.
Publique un tuit.
Busque en internet el significado de una palabra o concepto. Google tiene una búsqueda por voz aún para el PC.
Manejar el celular. activar el wifi por ejemplo o abrir aplicaciones.

ANÁLISIS
El reto está en "entender" el contexto humano
MIGUEL BELLO
Docente y diseñador de servicios y experiencias físicas y digitales

En las ultimas dos décadas han existido sistemas de reconocimiento de voz bastante mediocres. Con la tecnología derivada de dispositivos iOS y Android esto se ha mejorado, aunque persiste cierta torpeza.

No es perfecta, comete errores de interpretación; requiere un gran poder de procesamiento, por lo tanto, incrementa consumo de batería. Acentos, edad, género, condiciones como la gripa, todo esto cambia la forma en la que suena nuestra voz. Interrupciones inesperadas como "Hmm o ahh"; o silencios generan confusión en el sistema. Muchas palabras suenan similar pero se escriben y significan diferente. Hay muchos extranjerismos que no son reconocidos si el dispositivo esta configurado para un único idioma. Muchos servicios no están habilitados en todos los países. Por ejemplo iOS no puede buscar restaurantes en Colombia tal como lo hace en E.U. Una de las grandes discusiones es si el mercado masivo adoptará las Google Glass, un nuevo esquema de "tecnología vestible". Al no contar con un medio de entrada como una pantalla táctil o un teclado, la voz se convierte en el medio principal para interactuar con el dispositivo. En la medida que este tipo de gadgets se hagan más populares, la industria se verá forzada a mejorar radicalmente el reconocimiento de voz. Sin duda, la voz es un medio natural de comunicación humana con grandes potencialidades para ser usada en procesos de comunicación con máquinas, incluso más que teclear o tocar una pantalla. Hay que preguntarse si el mercado está preparado para usar este nuevo tipo de interacción. El reto máximo es el reconocimiento del "significado". Un ejemplo extremo: entender el sarcasmo. En el momento en que estas tecnologías permitan interpretar las palabras más allá de su definición en el diccionario y lograr comunicarnos con nuestros dispositivos de la forma natural que lo hacemos con otros seres humanos, el potencial de la aplicación será enorme.

EN DEFINITIVA

Los comandos de voz y gestuales crean nuevas formas, más intuitivas y amigables, de interacción con los teléfonos inteligentes y dispositivos de la tecnología.

Se ha producido un error al procesar la plantilla.

Invocation of method 'get' in  class [Ljava.lang.String; threw exception java.lang.ArrayIndexOutOfBoundsException at VM_global_iter.vm[line 2204, column 56]