Header Ads

Como Alexa ouve para as palavras de Wake

O Alexa está sempre ouvindo, mas não gravando continuamente. Ele não envia nada para os servidores na nuvem até ouvir você dizer a palavra de ativação (Alexa, Echo ou Computer). Mas ouvir palavras de ativação é mais difícil do que você imagina.

O hardware do Echo não é tão inteligente. Sem a internet, qualquer solicitação ou pergunta que você fizer falhará. Isso ocorre porque seus comandos são enviados para a nuvem para interpretação e decisões. A Amazon não quer que todas as conversas que você tem na frente de um alto-falante inteligente sejam gravadas, mas apenas os comandos que você dá ao alto-falante inteligente. Por esse motivo, a empresa emprega uma palavra para despertar a atenção do interlocutor inteligente. Para conseguir isso, a Amazon usa uma combinação de microfones ajustados, um buffer de memória curto e treinamento de rede neural.

Microfones de ajuste fino Sua voz

Palestrantes do assistente de voz, como Echo e Echo Dot, normalmente têm vários microfones integrados. O Echo Dot, por exemplo, tem sete. Esse array fornece aos dispositivos várias habilidades, desde ouvir comandos falados longamente até separar o ruído de fundo das vozes.

O último é especialmente útil para a detecção de wake-word. Usando seus vários microfones, o Echo pode identificar sua localização em relação ao local onde está sentado e ouvir nessa direção enquanto ignora o restante da sala.

Você vê isso em ação sempre que usa a palavra de ativação. Fique ao lado de um Echo ou Echo Dot e diga a palavra wake. Observe que o anel se acende em azul escuro e, em seguida, um azul mais claro, enquanto ele circula e aponta para você. Agora, mova vários passos para o lado e diga a palavra wake mais uma vez. Observe que as luzes azul-claras seguem você.

Sabendo onde você está, ajuda o dispositivo a se concentrar melhor em você e a reduzir os ruídos vindos de outros lugares.

Memória curta evita que o falante se mantenha Demasiado

Os dispositivos de eco têm muito espaço de armazenamento, mas não usam muito. De acordo com Rohit Prasad, vice-presidente da Amazon e cientista-chefe do Alexa Artificial Intelligence, um Echo só pode armazenar fisicamente alguns segundos de áudio.

Ao reduzir sua capacidade, a Amazon não só lhe dá mais privacidade ( é um lugar a menos que sua voz é armazenada), mas também impede que o Echo ouça conversas inteiras, limitando seu foco para encontrar a palavra de ativação.

Imagine que você tinha um cassete de três segundos e um gravador. Suponhamos que, depois de chegar ao fim, a fita voltasse para o início, repetidamente. Se você começou a gravar uma conversa, tudo o que você disse há quatro segundos seria apagado e imediatamente gravado. Isso é o que um Amazon Echo faz.

Ele grava continuamente, mas limpa tudo o que acabou de gravar ao mesmo tempo. Esse curto período de atenção significa que tudo o que pode ouvir é a palavra “Alexa” e não muito mais. Três segundos, no entanto, são longos o suficiente para que essa palavra seja gravada, examinada e usada apropriadamente.

O Treinamento da Rede Neural Ajuda com Correspondência de Padrões

Por fim, a Amazon depende do treinamento da rede neural para ensinar ao Echo como combinar padrões. Assim como outras formas de aprendizado de máquina, a Amazon treina seus algoritmos alimentando-a de instância após instância da palavra Alexa (ou Computer, ou Echo, dependendo de qual palavra de ativação a empresa está treinando).

Algoritmos, e por que eles fazem as pessoas desconfortáveis?

A idéia é cobrir cada inflexão e sotaque, mas também o contexto. A Amazon quer que seu Echo reconheça a diferença quando você estiver conversando com ela, quando estiver falando sobre isso ou, talvez, quando estiver falando com uma pessoa chamada Alexa. Os microfones direcionais também ajudam com esse objetivo.

Com cada palavra que o Echo ouve, ele executa o áudio por meio de camadas de algoritmos. Cada camada é projetada para excluir falsos positivos, procurando por sons ou pistas de contexto. Se uma verificação de camada passar, a palavra vai para a próxima. Finalmente, quando o dispositivo local decide que ouviu a palavra wake, ele começa a gravar e transmitir o áudio para os servidores em nuvem da Amazon. A Amazon emprega quatro algoritmos: um para cada palavra de ativação (Alexa, Computer, Echo) e um para o Alexa Guard, que trata sons específicos, como quebra de vidro, como uma palavra de ativação.

ocorre a correspondência, a Amazon ainda executa verificações mais complicadas. Você notou que, quando alguém fala a palavra Alexa em um programa de TV ou em um comercial, geralmente não obtém uma resposta do seu Echo? Isso porque a Amazon também faz uma verificação na nuvem.

Cloud Checks descarta alguns pontos positivos falsos

Quando as empresas criam comerciais que apresentam o Alexa, elas podem enviar o áudio para a Amazon. A empresa executa o áudio por meio de algoritmos de correspondência de padrões semelhantes usados ​​para identificar a palavra de ativação. Depois que a instância exata for totalmente catalogada, ela será adicionada a um banco de dados.

Como parte do processo ao alcançar a nuvem, seu Echo inclui informações sobre a palavra de ativação ouvida e verifica esse banco de dados. Sempre que encontrar uma correspondência, a Amazon instrui seu Echo a ignorar a palavra de ativação, desligar e descartar qualquer áudio gravado.

Além disso, a Amazon verifica se há instâncias da palavra de ativação faladas simultaneamente. Nem toda empresa envia áudio para a Amazon, então a empresa criou uma nova solução de backup. Após a verificação de uma correspondência de banco de dados, a empresa compara a impressão da palavra de ativação com quaisquer outras instâncias que chegam ao mesmo tempo. É improvável que duas pessoas que dizem Alexa soem exatamente iguais, então se houver uma correspondência, a Amazon sabe que é provável que seja um comercial ou programa de TV e ignora a solicitação.

Apesar de todas as verificações, falsos positivos ainda ocorrer. Você pode ouvir o que seu Echo gravou no centro de privacidade da Amazon e provavelmente encontrará pelo menos um falso positivo no grupo. Mas a tecnologia está sendo continuamente aprimorada e, eventualmente, a Amazon gostaria que ela funcionasse sem uma palavra de ativação.

LEIA PRÓXIMO & rsaquo; Como marcar uma assinatura Amazon Prime barata para Prime Day & rsaquo; Como Transmitir o UFC Fight Night 155 de Randamie vs. Ladd Online & rsaquo; Como acelerar sua conexão com a Internet & rsaquo; Como adicionar o Alexa ao seu Smart Mirror & rsaquo; Como criptografar e descriptografar arquivos com GPG no Linux

Via: How to Geek

Nenhum comentário