Apple quiere que Siri "aprenda" a leer los labios: así es el futuro del reconocimiento de voz, según una patente

Omid Armin Agrtdozlpyw Unsplash
Sin comentarios Facebook Twitter Flipboard E-mail

Siri, el asistente virtual de Apple que permite controlar nuestros dispositivos con la voz, tendrá una importante actualización en el futuro. Apple se encuentra trabajando en una función para hacer que Siri pueda leer los labios usando sensores de movimiento.

Así es como lo revela una nueva solicitud de patente de Apple, donde se ve como sería un programa patentado de lectura de labios. La nueva función no requiere el uso de una cámara, por lo que es probable que la tecnología se integre no solo en iPhones sino también en otros dispositivos de Apple.

Así funciona el sistema que propone Apple

Presentada en enero de 2023, la patente llamada "Detección de palabras clave usando un sensor de movimiento” describe un sistema completo para determinar el movimiento que coincide con una frase o una sola palabra.

Siri podría usar sensores de movimiento como acelerómetros y giroscopios para detectar los movimientos y vibraciones de la boca, la cara, la cabeza y el cuello del usuario cuando habla. Estos datos se compararían con una base de datos de referencia para encontrar una coincidencia con una palabra o frase, como "Hey Siri", "skip" o "next song".

Diagrama Imagen descriptiva de la patente de Apple
"Los datos se reciben de un sensor de movimiento, por ejemplo, registrando el movimiento de un usuario mientras el usuario emite una entrada hablada"
"Se determina si una parte de los datos de movimiento coincide con los datos de referencia para un conjunto de una o más palabras (por ejemplo, una palabra o frase)"
Menciona la patente.

Se observa que esto funcionará bien con comandos simples, como "Hola, Siri" o "Siguiente pista". Si el usuario dice una frase más compleja, el sistema puede encender el micrófono por adelantado para un mejor reconocimiento.

Qué supone el desarrollo de esta tecnología

Pexels Cottonbro Studio 8090258

Además de detección de movimiento de la que hemos hablado, sabemos que Apple se encuentra desarrollando su propia inteligencia artificial: Ajax. De momento no hay planes sobre cuales dispositivos de la marca integrarían esta función.

Según detalla AppleInsider, el proceso de "detección de palabras clave" supone un gasto gasto de energía y capacidad de procesamiento incluso cuando el usuario no está utilizando el control de voz activamente. Esto podría suponer un problema de rendimiento sobre el cual Apple ya se encuentra trabajando.

Abordando esta preocupación, Apple propone apagar los micrófonos que un dispositivo usa para escuchar continuamente. Esto además de mejorar la eficiencia energética, evitaría la necesidad de micrófonos activos lo cual supondría también un impacto positivo a la privacidad del usuario. La etapa actual del desarrollo y lanzamiento de estas funciones sigue sin revelarse.

Comentarios cerrados
Inicio