Hablemos, iPhone

Apple ha popularizado algunas revoluciones en la forma en que usamos las computadoras personales en su época: la interfaz gráfica, el mouse y la pantalla táctil, por ejemplo. El próximo martes podría ver a la compañía agregar a esa lista de hitos en la interacción hombre-máquina al permitir que los usuarios controlen una computadora al tener una conversación con ella.

El nuevo jefe de Apple, Tim Cook, subirá al escenario en la sede de la empresa en California para anunciar las últimas actualizaciones de los productos de la empresa. La invitación de Apple al evento dice que sólo hablemos del iPhone, pero los rumores de Internet han decidido que Cook anunciará dos cosas: un quinto modelo del iPhone; y un Asistente activado por voz para dispositivos iPhone y iPad, basado en una aplicación impresionante llamada Siri que fue comprada por Apple el año pasado (ver aquí para una de las predicciones más plausibles).

Es posible que no obtengamos ninguno de estos, pero de los dos, el segundo es el más interesante. Puede que me arrepienta de haber dicho esto, pero hay pocas actualizaciones de hardware significativas que Apple podría agregar al iPhone 5. Algunas cosas mejorarán gradualmente; más resolución (cámara), más rápida (procesador) o más grande (pantalla), pero no queda mucho por agregar que tenga sentido.

Por otro lado, simplificar la configuración de las invitaciones del calendario o encontrar una película cercana con solo conversar con su iPhone o iPad abriría nuevos caminos. También es el tipo de revolución alcanzable por la que se conoce a Apple.

La fórmula es simple: tome un montón de tecnología ingeniosa que nunca ha cumplido su promesa, reconsidere para qué sirve, haga un trabajo duro en secreto y luego libere una experiencia natural y retrospectivamente obvia que redefine lo que pueden hacer las computadoras.

Las interfaces de iPad y iPhone son buenos ejemplos de esto. Las pantallas táctiles, los navegadores móviles y las tabletas ya existían, pero Apple los juntó y alteró la trayectoria de la informática personal.

La lamentable historia del reconocimiento de voz, el control de voz y los asistentes virtuales (¿recuerda Clippy?) Es la materia prima perfecta para este enfoque. Todos han existido durante décadas y tienen el potencial de ser mucho mejores que presionar botones o una pantalla. Nunca nadie se ha acercado a darse cuenta de ese potencial.

Cuando Siri debutó en 2009, parecía ser la mejor esperanza hasta ahora de cambiar eso. Fue el engendro de un proyecto de inteligencia artificial financiado por DARPA y algunas ideas inteligentes sobre la integración de varias herramientas, como mapas, reseñas de restaurantes y reserva de entradas para películas, y la convertimos en una de nuestras 10 tecnologías para observar en 2009. Un usuario podría tener conversaciones de ida y vuelta que comiencen con declaraciones complejas como 'Me gustaría un lugar romántico para la comida italiana cerca de mi oficina'.

Siri contenía varias ideas técnicas inteligentes, pero lo que es más importante, las condensó en una interfaz de conversación funcional y fácil de entender que fue realmente útil. Apple podría llevar esto un paso más allá al hacer que la tecnología sea más robusta e integrarla con el sistema operativo iPad y iPhone. Si lo hacen, la humilde aplicación Siri sería promovida al rol de Asistente, un asistente personal con el que hablas en un lenguaje normal y te ayuda con la mayoría de las cosas para las que usas tu teléfono o tableta. En esencia, sería la personalidad de su teléfono.

Como se señalará en muchos hilos de discusión, si esto sucede, Google estuvo (más o menos) allí primero. El sistema operativo Android de la empresa tiene una acciones de voz función que permite a los usuarios presionar y mantener presionado un botón y solicitar direcciones a un negocio local, o dictar un mensaje de texto. Sin embargo, carece de poder para realizar acciones más allá de su teléfono, como reservar un restaurante. Más importante aún, no tiene una interfaz de conversación inteligente.

Sólo invitados: Apple envió este mensaje a los periodistas antes del evento del martes.

Las acciones de voz en Android se sienten como una característica técnica, no como una nueva forma de interactuar con las computadoras. Assistant podría y debería ser un paquete mucho más cohesivo. Si llega el martes, probablemente condensará una gran cantidad de tecnología en una cosa simple: una interfaz de computadora con la que conversas. Si se hace bien, eso podría hacer que Apple cambie una vez más lo que significa usar una computadora.

Apple no realiza estos trucos de forma gratuita y, sin embargo, es notoriamente controladora. Si aparece el Asistente, solo estará disponible en dispositivos Apple para impulsar las ventas. Cualquier servicio externo con el que se conecte será aprobado cuidadosamente. No me sorprendería saber que Apple obtiene una parte de todo lo que se vende a través del Asistente, ya sean entradas para el cine o reservas en restaurantes. Aún así, al igual que el iPhone y otras ideas disruptivas de Apple, no pasará mucho tiempo antes de que los competidores lancen imitaciones.

Sin embargo, quedan preguntas en mi mente acerca de los límites que Apple le habrá puesto al Asistente para que esté a la altura de los altos estándares de la empresa. Crear una interfaz basada en voz es fácil, pero crear una que, en palabras de Steve Jobs, simplemente funcione no lo es.

El hecho es que el reconocimiento de voz tiene que hacer trampa para ser realmente preciso sin un entrenamiento previo extenso de su voz. Necesita precognición de lo que va a decir. La aplicación móvil de búsqueda por voz de Google, por ejemplo, es increíblemente precisa porque se basa en montones de datos sobre frases que buscan las personas. El Asistente de Apple debería estar bien al recibir pedidos relacionados con cosas de las que sabe que podrías hablar, como tu calendario, contactos o listas de reproducción de música. Sin embargo, transcribir el habla, como un mensaje de correo electrónico, cuando se puede decir literalmente cualquier cosa, es otro asunto, y será interesante ver si Apple lo hace parte de su sistema. He encontrado que las acciones de voz de Google son exasperantes de usar para redactar mensajes, y no puedo imaginar a Apple lanzando un producto con tanto potencial para molestar a los usuarios.

Lograr el equilibrio entre potencia y confiabilidad podría ser la decisión de diseño más difícil involucrada en la construcción de algo como Assistant. Es el tipo de decisión en la que se destacó Steve Jobs, por ejemplo, cuando puso el iPad en espera y lanzó una versión más pequeña en forma de teléfono primero. El martes, podemos echar un vistazo a lo bien que el sucesor de Jobs negocia la misma compensación entre lo que podría lanzarse y lo que se encuentra con la marca única de perfeccionismo centrado en la experiencia de Apple.



esconder