Este alto-falante inteligente LIDAR imagina Alexa com olhos
O LIDAR pode ser mais conhecido agora por ajudar carros autônomos (e enfurecer Elon Musk), mas a mesma tecnologia pode melhorar a maneira como interagimos com alto-falantes inteligentes, sugere uma equipe de pesquisadores apoiados pela Intel. O SurfaceSight especula sobre o potencial de dispositivos de IoT mais úteis quando eles entendem o que está ao redor deles, incluindo reconhecimento de objetos e mãos.
O objetivo era dar aos palestrantes inteligentes existentes e aos aplicativos que eles geram algum conhecimento da situação. Ao empilhar um Amazon Echo ou o Google Home Mini em cima de um sensor LIDAR compacto, os pesquisadores Gierad Laput e Chris Harrison, da Universidade Carnegie Mellon, demonstraram como os dispositivos poderiam fazer inferências com base na forma e no movimento sobre o que estava por perto. Eles apresentarão suas descobertas no ACM CHI 2019 hoje.
O LIDAR usa lasers para identificação de alcance, refletindo efetivamente a luz não visível de objetos e construindo um mapa de nuvem de pontos baseado no tempo necessário para que a luz seja refletida de volta. Embora seja comumente associado a projetos de carros autônomos, onde a capacidade de criar um plano em tempo real da área circundante é útil para evitar tráfego ou pedestres, também é comumente usado em robótica, com UAVs e outros aplicativos.
Importante, também está se movendo para o reino da acessibilidade relativa. Embora o LIDAR de alta gama e alta precisão para aplicações automotivas ainda seja relativamente caro - algo que os fabricantes estão procurando mudar com novos processos de produção - sensores menores e mais acessíveis estão disponíveis. O SurfaceSight, por exemplo, conta com uma unidade abaixo de US $ 100, e os pesquisadores especulam que a disponibilidade mais ampla de LIDAR de estado sólido só reduzirá ainda mais isso.
Para o SurfaceSight, os aplicativos são variados. Uma possibilidade é usar os dedos e as mãos para fazer a entrada do gesto; alternativamente, um alto-falante inteligente pode rastrear quando um smartphone é colocado na mesa próxima e depois reconhecê-lo automaticamente como o usuário que deseja transmitir música.
Como o SurfaceSight também pode estimar o caminho que uma pessoa está enfrentando, ele pode priorizar o reconhecimento de comandos quando o usuário é apontado ativamente na direção do falante . Isso, sugere-se, poderia ajudar em situações em que os comandos de voz não podem ser ouvidos em áudio de fundo. Áreas de fronteira definidas, apenas dentro das quais os gestos são reconhecidos, também são suportadas, e elas podem ser estabelecidas por gestos manuais.
O plano de reconhecimento também não precisa ser horizontal. Em outra demonstração, o SurfaceSight podia rastrear o movimento contra uma parede, com um LIDAR integrado a um termostato inteligente. Isso poderia reconhecer batidas, furtos e movimentos circulares contra a parede, efetivamente transformando a superfície em uma almofada de controle estendida. Pense ao longo das linhas do Google Soli, mas em maior escala.
Onde o SurfaceSight realmente fica interessante é como ele usa o LIDAR para reconhecer objetos. A equipe treinou o sensor em diferentes objetos da cozinha, como balanças e copos de medição, bem como itens de oficina, como ferramentas. Uma receita de várias etapas poderia usar o LIDAR para rastrear qual parte está sendo concluída, avançando automaticamente. Alternativamente, o movimento poderia estar ligado a pedidos verbais para dar mais contexto, como sacudir um copo de medição e, ao mesmo tempo, perguntar “quantas onças são necessárias?”
O LIDAR tem suas desvantagens , claro. Para começar, há a questão da oclusão: o sensor depende da linha de visão. Objetos diferentes que possuem o mesmo perfil também podem confundir o SurfaceSight. Os pesquisadores sugerem que uma combinação de câmera ou até mesmo códigos de barras refletivos poderiam ser usados para diferenciá-los, com o alto-falante inteligente também alertando os usuários para que organizem a área ao redor, se quiserem que o sistema funcione de forma eficaz.
É importante ressaltar que, embora o LIDAR possa ser altamente preciso, ele também possui vantagens de privacidade que, digamos, os sistemas de visão computacional baseados em câmera não oferecem. Um sensor LIDAR não diferencia entre pessoas diferentes ou pode ser usado para capturar fotos em casa, por exemplo.
É justo dizer que os palestrantes inteligentes estão no nível de commodity agora, com a Amazon e o Google competindo entre si até o preço mais acessível. Embora ambas as empresas apostem que a voz é o principal método preferido de interação, elas o fazem à custa de outras modalidades. O cozimento no LIDAR pode não ser a única maneira de resolver isso, mas não há como negar que um dispositivo de estilo hub em casa poderia ser muito mais útil se soubesse o que você estava fazendo, não apenas o que você estava dizendo.
Via: Slash Gear
Nenhum comentário