Header Ads

Alexa, Siri e Google não entendem uma palavra que você diz

Assistentes de voz como Alexa, Google Assistant e Siri percorreram um longo caminho nos últimos anos. Mas, apesar de todas as melhorias, uma coisa as impede: elas não entendem você. Eles confiam demais em comandos de voz específicos.

Reconhecimento de voz é apenas um truque de mágica

Assistentes de voz não entendem você. Na verdade não, de qualquer maneira. Quando você fala com um Google Home ou o Amazon Echo, ele basicamente converte suas palavras em uma string de texto e as compara aos comandos esperados. Se encontrar uma correspondência exata, segue um conjunto de instruções. Se isso não acontecer, ele procura uma alternativa do que fazer com base nas informações que possui e, se isso não funcionar, você recebe uma mensagem de falha como “Sinto muito, mas não sei . ”É pouco mais do que magias de mágica que o levam a pensar que entende.

Ele não pode usar pistas contextuais para fazer o melhor palpite, ou mesmo usar um entendimento de tópicos similares para informar suas decisões. . Também não é difícil enganar os assistentes de voz. Enquanto você pode perguntar a Alexa “Você trabalha para a NSA?” E obter uma resposta, se você perguntar “Você faz secretamente parte da NSA?”, Você recebe uma resposta “Eu não conheço essa” (pelo menos na tempo desta escrita).

Os humanos, que genuinamente entendem a fala, não funcionam assim. Suponha que você pergunte a um humano: “O que é esse klarvain no céu? O que é arqueado, e cheio de cores listradas como vermelho, laranja, amarelo e, azul.”Apesar klarvain ser uma palavra inventada, a pessoa que você pediu poderia provavelmente descobrir a partir do contexto que você está descrevendo um arco-íris.

Enquanto você poderia argumentar que um humano está convertendo a fala em idéias, um humano pode então aplicar conhecimento e compreensão para concluir uma resposta. Se você perguntar a um humano se ele secretamente trabalha para a NSA, ele lhe dará uma resposta sim ou não, mesmo que essa resposta seja uma mentira. Um ser humano não diria "eu não conheço esse" para uma pergunta como essa. Que os seres humanos podem mentir é algo que vem com a compreensão real.

Assistentes voz não pode ir além de sua programação

assistentes de voz são, em última análise limitada a parâmetros esperados programados, e vagando fora deles vai quebrar o processo. Esse fato é exibido quando dispositivos de terceiros chegam para jogar. Normalmente, o comando para interagir com aqueles é muito pesado, totalizando Um exemplo exata seria “contar fabricante do dispositivo para comandar argumento opcional.”: “Diga Whirlpool para interromper o secador” Para um exemplo ainda mais difícil de lembrar, o Alexa Genebra habilidade controla alguns fornos GE. Um usuário da habilidade precisa lembrar de “dizer a Genebra” e não “contar à GE”, então o resto do comando. E enquanto você pode pedir para pré-aquecer o forno a 350 graus, você não pode seguir com uma solicitação para aumentar a temperatura em outros 50 graus. Um ser humano pode seguir essas solicitações.

A Amazon e o Google trabalharam arduamente para superar esses obstáculos, e isso mostra. Onde uma vez você teve que seguir a seqüência acima para controlar uma trava inteligente, agora você pode dizer “trancar a porta da frente”. Alexa costumava ser confundida por “conte-me uma piada de cachorro”, mas peça uma hoje e ela funcionará. Eles adicionaram variações aos comandos que você usa, mas no final você ainda precisa saber o comando certo a ser dito. Você precisa usar a sintaxe correta, na ordem correta.

E se você acha que isso soa muito como uma linha de comando, você não está errado.

Os assistentes de voz são Linha de Comandos Extravagantes

Uma Linha de Comando é definida de forma restrita para executar tarefas simples, mas somente se você conhecer a sintaxe apropriada. Se você sair dessa sintaxe correta e digitar dyr em vez de dir, o prompt de comando fornecerá uma mensagem de erro. Você pode usar aliases para obter comandos mais fáceis de lembrar, mas é necessário ter uma ideia de quais eram os comandos originais, como eles funcionam e como usar aliases com eficiência. Se você não dedicar seu tempo para aprender os comandos dentro e fora da linha de comando, você nunca terá muito a ganhar com isso.

Os assistentes por voz não são diferentes. Você precisa saber a maneira correta de dizer um comando ou fazer uma pergunta. E você precisa saber como configurar grupos para o Google e o Alexa, por que agrupar seus dispositivos é essencial e como nomear seus dispositivos inteligentes. Se você não seguir essas etapas necessárias, sentirá a frustração de pedir ao seu assistente de voz para desligar o estudo, apenas para ser perguntado, "qual estudo" deve ser desativado.

Mesmo quando você usa a sintaxe correta na ordem correta, o processo pode falhar. Ou com a resposta errada emitida ou um resultado surpreendente. Duas Casas do Google na mesma casa podem fornecer informações meteorológicas para localizações ligeiramente diferentes, mesmo que tenham acesso às mesmas informações da conta de utilizador e à ligação à Internet.

No exemplo acima, o comando "Definir um temporizador por meia hora" é dado. O hub inicial do Google criou um cronômetro chamado "Hora" e perguntou por quanto tempo o cronômetro deveria ser. E ainda repetindo o mesmo comando três outras vezes funcionou corretamente e criou um temporizador de 30 minutos. Usar o comando "Definir um temporizador por 30 minutos" funciona corretamente em uma base mais consistente.

Embora a conversa com um Google Home ou Echo possa ser mais fluida, os assistentes de voz e as linhas de comando trabalham mesmo caminho. Talvez você não precise aprender um novo idioma, mas precisa aprender um novo dialeto.

A compreensão estreita dos assistentes por voz limitará o crescimento

Nada disso impede que assistentes de voz como Google Assistant e Alexa trabalhem bem o suficiente (embora Cortana seja uma história diferente). Google Assistant e Alexa e pesquise on-line em busca de perguntas com decência, embora não surpreenda que o Google seja melhor na pesquisa e possa responder a perguntas básicas como conversões de medição e matemática simples. Com uma casa inteligente configurada corretamente e um usuário bem treinado, a maioria dos comandos domésticos inteligentes funcionará como pretendido. Mas isso veio através do trabalho e esforço, não da compreensão intelectual.

Timers e Alarms costumavam ser simplistas. Ao longo do tempo, a nomeação foi adicionada e, em seguida, a capacidade de adicionar tempo a um timer. Eles mudaram de simplista para mais complicado. Os assistentes de voz podem responder a mais perguntas e cada dia traz novas habilidades e recursos. Mas isso não é um produto do autocrescimento que vem do aprendizado e da compreensão.

E nada disso fornece a capacidade inerente de usar o que se conhece para alcançar o desconhecido. Para cada comando e pergunta que funciona, sempre haverá três que não funcionam. Sem um avanço em A.I. que concede uma capacidade humana de compreensão, os assistentes de voz não são assistentes. São apenas linhas de comando de voz - úteis no cenário certo, mas limitadas aos cenários que foram programados para entender.

Em outras palavras: as máquinas estão aprendendo coisas, mas não conseguem entendê-las. / p>

RELACIONADOS: O problema com a IA: as máquinas estão aprendendo as coisas, mas não conseguem entendê-las

Via: How to Geek

Nenhum comentário