Sistemas de visão inspirados pela visão humana


De acordo com um artigo publicado em 21 de fevereiro de 2007 na Technology Review, um grupo de neurocientistas do MIT desenvolveu um modelo de computador que imita o sistema de visão humana para detectar e reconhecer com precisão objetos como carros e motocicletas, em uma rua movimentada. De acordo com Thomas Serre, neurocientista do MIT, esses tipos de sistemas de visão poderão em breve ser usados ​​em sistemas de vigilância ou em sensores inteligentes que alertam os motoristas sobre a presença de pedestres ou outros objetos.

Durante anos, os pesquisadores tentaram imitar os sistemas de visão biológica, devido à sua perfeição. Mas ensinar um computador a classificar objetos acabou sendo mais complicado do que parecia, diz Serre, que fez o trabalho com Tomaso Poggio. Primeiro, para reconhecer um tipo específico de objeto, o computador precisa de um modelo ou representação computacional específica desse objeto específico, que é o que permite ao computador distinguir, por exemplo, um carro de objetos que não sejam carros. No entanto, o modelo precisa ser flexível o suficiente para acomodar todos os diferentes tipos de carros em diferentes ângulos e posições e sob diferentes condições de iluminação.

A melhor forma de o conseguir é treinar um algoritmo de aprendizagem com uma série de imagens para extrair as características que têm em comum. Serre e Poggio acreditam que o sistema de visão humano segue uma abordagem semelhante, mas que depende de uma hierarquia de camadas sucessivas no córtex visual. As primeiras camadas da crosta detectariam, portanto, as características mais simples de um objeto e as últimas combinariam essas informações para formar nossa percepção do objeto como um todo.

Para testar sua teoria, Serre e Poggio trabalharam com Stanley Bileschi do MIT e Lior Wolf da Universidade de Tel Aviv, Israel, para criar um modelo de computador com 10 milhões de unidades computacionais, projetado para se comportar como grupos de neurônios. do córtex visual. Como no córtex visual, as unidades são divididas em camadas.

Primeiro, as unidades mais simples extraem recursos rudimentares da cena (por exemplo, perfis orientados), analisando grupos muito pequenos de pixels. As unidades mais complexas analisam porções maiores da imagem e reconhecem características relacionadas ao tamanho ou posição dos objetos. A cada camada sucessiva, características cada vez mais complexas são extraídas, como a distância entre duas partes de um objeto ou os diferentes ângulos de orientação dessas partes. Isso permite que você reconheça o mesmo objeto de diferentes ângulos.

Quando testaram o sistema, seus resultados foram muito bons, podendo competir com os melhores sistemas do mercado. Além disso, devido à sua capacidade de aprendizagem, quanto mais imagens você analisa, mais precisos são os resultados.
No momento, o sistema foi projetado apenas para analisar imagens estáticas. No entanto, segundo Serre, o processo é semelhante ao do sistema de visão humana, em que uma parte do sistema é responsável pelas formas e outra pelo movimento. A equipe agora está trabalhando na incorporação de um sistema paralelo que funciona com vídeos.

Fonte: Technology Review


Vídeo: MIOPIA, HIPERMETROPIA e ASTIGMATISMO - Óptica da VISÃO - Aula 18 - Prof. Boaro


Artigo Anterior

Frases de páscoa

Próximo Artigo

1 dia em Dubrovnik O que ver e aonde ir?