Câmeras bioinspiradas e IA ajudam os motoristas a detectar pedestres e obstáculos com mais rapidez – SofolFreelancer


A imagem mostra informações de cores da câmera colorida e eventos (pontos azuis e vermelhos) da câmera de eventos gerados por um pedestre correndo.

A inteligência artificial (IA) combinada com uma nova câmera de inspiração biológica consegue uma detecção de pedestres e obstáculos 100 vezes mais rápida do que as câmeras automotivas atuais. Este passo importante para a visão computacional e a IA alcançado pelos pesquisadores pode melhorar muito a segurança dos sistemas automotivos e dos carros autônomos.

É o pesadelo de todo motorista: um pedestre saindo na frente do carro aparentemente do nada, deixando apenas uma fração de segundo para frear ou virar o volante e evitar o pior. Alguns carros agora possuem sistemas de câmeras que podem alertar o motorista ou ativar a frenagem de emergência. Mas estes sistemas ainda não são suficientemente rápidos ou fiáveis ​​e terão de melhorar drasticamente se quiserem ser utilizados em veículos autónomos onde não há ninguém ao volante.

Agora, Daniel Gehrig e Davide Scaramuzza, do Departamento de Informática da Universidade de Zurique (UZH), combinaram uma nova câmera de inspiração biológica com IA para desenvolver um sistema que pode detectar obstáculos ao redor de um carro com muito mais rapidez do que os sistemas atuais e usando menos recursos computacionais. poder.

A maioria das câmeras atuais são baseadas em quadros, o que significa que tiram fotos em intervalos regulares. Aqueles usados ​​atualmente para assistência ao motorista em carros normalmente capturam de 30 a 50 quadros por segundo e uma rede neural artificial pode ser treinada para reconhecer objetos em suas imagens – pedestres, bicicletas e outros carros. “Mas se algo acontecer durante os 20 ou 30 milissegundos entre dois instantâneos, a câmera pode perceber tarde demais. A solução seria aumentar a taxa de quadros, mas isso se traduz em mais dados que precisam ser processados ​​em tempo real e mais computacionais poder”, diz Daniel Gehrig, primeiro autor do artigo.

As câmeras de eventos são uma inovação recente baseada em um princípio diferente. Em vez de uma taxa de quadros constante, eles possuem pixels inteligentes que registram informações sempre que detectam movimentos rápidos. “Dessa forma, elas não têm ponto cego entre os frames, o que permite detectar obstáculos com mais rapidez. Também são chamadas de câmeras neuromórficas porque imitam a forma como o olho humano percebe as imagens”, diz Davide Scaramuzza, chefe do Grupo de Robótica e Percepção. Mas eles têm suas próprias deficiências: podem perder coisas que se movem lentamente e suas imagens não são facilmente convertidas no tipo de dados usados ​​para treinar o algoritmo de IA.

Gehrig e Scaramuzza criaram um sistema híbrido que combina o melhor dos dois mundos: inclui uma câmera padrão que coleta 20 imagens por segundo, uma taxa de quadros relativamente baixa em comparação com as atualmente em uso. Suas imagens são processadas por um sistema de IA, denominado rede neural convolucional, que é treinado para reconhecer carros ou pedestres. Os dados da câmera de eventos são acoplados a um tipo diferente de sistema de IA, denominado rede neural gráfica assíncrona, que é particularmente adequada para analisar dados 3-D que mudam ao longo do tempo. As detecções da câmera de evento são usadas para antecipar as detecções da câmera padrão e também aumentar seu desempenho. “O resultado é um detector visual que pode detectar objetos tão rapidamente quanto uma câmera padrão que captura 5.000 imagens por segundo, mas requer a mesma largura de banda que uma câmera padrão de 50 quadros por segundo”, diz Daniel Gehrig.

A equipe testou seu sistema contra as melhores câmeras e algoritmos visuais atualmente no mercado automotivo, descobrindo que ele leva a detecções cem vezes mais rápidas, ao mesmo tempo que reduz a quantidade de dados que devem ser transmitidos entre a câmera e o computador de bordo, bem como o cálculo computacional. potência necessária para processar as imagens sem afetar a precisão. Crucialmente, o sistema pode detectar com eficácia carros e pedestres que entram no campo de visão entre dois quadros subsequentes da câmera padrão, proporcionando segurança adicional tanto para o motorista quanto para os participantes do trânsito – o que pode fazer uma enorme diferença, especialmente em altas velocidades.

Segundo os cientistas, o método poderá se tornar ainda mais poderoso no futuro, integrando câmeras com sensores LiDAR, como os usados ​​em carros autônomos. “Sistemas híbridos como este podem ser cruciais para permitir a condução autónoma, garantindo a segurança sem levar a um crescimento substancial de dados e poder computacional”, afirma Davide Scaramuzza.

Literatura:

Daniel Gehrig, Davide Scaramuzza. Visão automotiva de baixa latência com câmeras de eventos. Natureza. 29 de maio de 2024. DOI: 10.1038/s41586’024 -07409-w

Leave a Reply