Menú principal

Mostrando entradas con la etiqueta Oye Siri. Mostrar todas las entradas
Mostrando entradas con la etiqueta Oye Siri. Mostrar todas las entradas

jueves, 22 de noviembre de 2018

Algunos coches ya pueden integrar Siri

Según Volkswagen América, ya está disponible la integración del famoso asistente de Apple en VW Car-Net. Si todavía no conoces el servicio Car-Net, este es un servicio que permite a los conductores ejecutar aplicaciones de su móvil a través de CarPlay y Android Auto. Por suerte para aquellos conductores que posean un vehículo con servicio Car-Net y un dispositivo que corra iOS 12 podrán usar algunos comandos de voz para realizar comprobaciones en su vehículo o para controlar su dispositivo móvil mientras conduzcan.

Con esta integración podremos encender los intermitentes, bloquear las puertas, calcular la autonomía o la carga de la batería y muchas cosas más. También será posible personalizar las interacciones a tu gusto como el control de la climatización o cual es la ubicación del vehículo. Otra de las integraciones utilizadas por la marca es Verizon Connect, este servicio se utiliza para realizar llamadas de emergencia, detección automática de fallos, asistencia en carretera y la localización de vehículos robados. Sin embargo es un servicio de pago que dispone de un periodo de prueba de seis meses al adquirir un coche de la marca.

Figura 1: Siri integrado en Car-Net

A parte de la comodidad, esta integración está enfocada a la seguridad al volante, la posibilidad de realizar o coger llamadas mientras conduces sin preocuparte de darle a un botón o poder controlar el climatizador de tu coche solo con la voz puede reducir el número de distracciones al volante y  con ello el número de accidentes de tráfico.

“Constantemente buscamos formas innovadoras a la hora de hacer que Car-Net sea más útil y relevante. La integración de Siri ayudará a nuestros conductores a mantener la vista en la carretera y las manos en el volante” ha dicho Abdallah Shanti, Vicepresidente y jefe de información de la marca alemana en América.

sábado, 20 de enero de 2018

¿Quieres saber cómo funciona la IA detrás de "Oye Siri" y qué ocurre con tu información?

Siri es el asistente personal de Apple muy utilizado en los países de habla inglesa pero que poco a poco se está comenzando a utilizar más en otros idiomas, como por ejemplo el español. Detrás de esta apariencia de simple asistente se esconde toda una potente maquinaria creada con avanzadas técnicas de IA capaz de evolucionar y aprender del usuario. Nosotros nos preguntamos cómo funciona pero además, también queremos saber qué pasa con todas esas frases que le has dicho a Siri.

Siri se lanzó en 2011 como la aplicación estrella de su iOS versión 5. Siri está disponible en varios idiomas, como el sueco o el malayo. Inicialmente fue creada en 2007 por el grupo SRI, partiendo de un proyecto CALO sobre el cual está, nada más y nada menos, que DARPA (departamento de defensa de los EEUU).  Apple compró finalmente Siri a la compañía el 28 de abril de 2010.

Para activar Siri no es necesario pulsar ningún botón, sólo tenemos que decir "Oye Siri" ("Hey Siri" en inglés). Cuando dices "Oye Siri" al micrófono de tu iPhone o Apple Watch, un programa analiza la forma de onda de tu voz y la convierte en pequeños trozos (0.2 segundos de audio) creando un patrón. Este patrón resultante es analizado por una Deep Neural Network (DNN) la cual asigna a cada patrón acústico resultante una probabilidad (puntuación) de similitud con otros tipos de patrones base almacenados previamente por Siri.

Figura 1. Flujo del proceso de activación de Siri. Fuente.

La parte más importante de Siri es el modelo acústico, ya que es el encargado de procesar cada trozo de audio y compararlo con los modelos previamente almacenados. La DNN del modelo acústico ha recibido un proceso de entrenamiento utilizando cientos de variantes del idioma correspondiente utilizando miles de frases de entrenamiento, analizando todos los parámetros de las frases obtenidas. Para entrenar estos modelos, Apple utiliza herramientas muy conocidas como Theano, Tensorflow y el software de reconocimiento de audio llamado Kaldi. A continuación podemos ver los diferentes estados de la señal acústica recibida cuando recibe la frase "Hey Siri What ...":

Figura 2. Fases del proceso de análisis de la frase "Hey Siri What ...". Fuente.

En la sección del gráfico marcada con el número 1 en rojo, podemos ver la forma de onda captada directamente por el micrófono equivalente a la frase "Hey Siri What ...". Las partes más brillantes que se observan en la imagen son las que tienen mayor volumen de voz. La sección marcada con el número 2, muestra el resultado final de realizar un proceso de ajuste y limpieza de la señal captada en la fase 1 del proceso. La número 3 muestra en verde los diferentes valores numéricos asignados a cada trozo de la frase introducida después de compararlos con los diferentes patrones que Siri tiene almacenados. La sección número 4 muestra la evolución del procesamiento final aplicado por el modelo acústico hasta conseguir una puntuación. Esta puntuación finalmente se compara con unos patrones los cuales decidirán activar o no Siri. Este mismo proceso se aplica también para el resto de frases recibidas después de la activación. Este tema es bastante complejo y extenso para poder explicarlo en profundidad en este artículo pero puedes obtener más información en este enlace.

Pero ¿qué ocurre con la información que guarda Siri?. Apple genera una serie de números aleatorios para asociar los ficheros de voz recibidos para de esa forma mantener anónima la identidad del usuario. Estas frases se reutilizarán posteriormente para entrenar la DNN que hemos mencionado antes para ir creando mejores patrones los cuales ayudarán a Siri a ir ajustando su nivel de compresión de la información recibida. Apple puede guardar esta información un máximo de dos años. Pasado ese tiempo Apple tiene la obligación de eliminarlos (seis meses más tiempo que otros servicios similares de empresas como Google o Microsoft). De todas formas, los problemas legales referentes al uso y desarrollo de Siri siguen siendo un quebradero de cabeza, tanto para Apple como para el usuario final.

Entrada destacada

Proteger tu cuenta de Google y de Gmail con Latch Cloud TOTP #Latch #Gmail #Google

La semana pasada se liberó la nueva versión de Latch y nuestro compañero Chema Alonso hizo un repaso de todo ello en su artículo Latch...

Otras historias relacionadas

Entradas populares