Dados Sintéticos: O futuro do ADAS para desenvolvimento de modelos de IA de VEs
Javier Salado
No cenário em constante evolução da tecnologia de veículos elétricos, a maioria dos EVs no mercado já tem algum nível de Advanced Driver Assistance Systems (ADAS) ou capacidades de direção autônoma (AD). Esses sistemas funcionam usando uma combinação de câmeras externas e internas, sensores e software de processamento de visão para analisar seus arredores e responder adequadamente. O objetivo desses sistemas de assistência e autônomos é criar estradas mais seguras, inteligentes e eficientes.
Para mergulhar nessa jornada transformadora, é essencial primeiro entender os níveis de autonomia pelos quais os veículos estão progredindo, conhecidos como níveis SAE, que vão de L0 (assistência básica ao motorista) a L5 (automação total).
A Tesla é um exemplo desse paradigma, tornou-se sinônimo de tecnologia automotiva avançada, particularmente no espaço ADAS e direção autônoma. O Autopilot da Tesla combina controle de cruzeiro adaptativo e sistemas de manutenção de faixa para fornecer automação L1 e L2. Além disso, o pacote Full Self-Driving (FSD) da Tesla dá um passo mais perto da autonomia L3, com recursos como Navigate on Autopilot, que pode lidar com rampas de entrada e saída de rodovias.
Na outra ponta do espectro de autonomia, empresas de robotaxi como a Waymo estão expandindo os limites da autonomia L4. A Waymo implantou uma frota de veículos totalmente autônomos em cidades selecionadas para serviços de compartilhamento de viagens. Esses veículos podem operar em áreas geográficas definidas, fornecendo viagens a passageiros sem motoristas humanos.
O sucesso de empresas como a Waymo ressalta o potencial dos veículos autônomos na transformação da mobilidade urbana. No entanto, atingir a autonomia L4 exigiu treinamento extensivo, testes e validação dos sistemas de percepção que permitem que esses veículos naveguem em ambientes complexos com segurança.
EV’s e sistemas de percepção
Quanto maior o nível de autonomia que os EVs desejam atingir, mais sofisticados seus sistemas de percepção precisam ser e melhor precisa ser sua compreensão do mundo real. Primeiro, eles precisam de diferentes fontes de informação por meio de diferentes sensores, como câmeras, LiDAR e radar. Por sua vez, os cérebros por trás de cada ADAS e sistema de direção autônoma (AD) que dão suporte aos diferentes níveis de autonomia são modelos de aprendizado de máquina (ML) que consomem essas informações, esses dados vindos dos sensores, para resolver problemas específicos de visão computacional. Detecção e reconhecimento de objetos, rastreamento de linhas de estrada, estimativa de distância e comportamento do motorista são alguns desses problemas que, uma vez resolvidos, ajudam os EVs a entender os mundo ao seu redor para tomar a decisão certa em cada situação.
A chave para o sucesso desses sistemas de percepção é o desempenho do modelo ML na resolução de diferentes problemas. O objetivo durante o desenvolvimento é ter o mais alto desempenho ao validar e testar o sistema em cenários do mundo real. Existem várias métricas para medir o desempenho dos modelos ML, as mais amplamente utilizadas para o tipo de problemas para automotivo (classificação) são precisão e recall que se concentram em minimizar falsos positivos e falsos negativos, respectivamente. Agora, quais botões os engenheiros de aprendizado de máquina têm para melhorar o desempenho do modelo? DADOS. Os dados usados no processo de ajuste de hiperparâmetros do modelo.
Este é um processo iterativo usando um conjunto de dados dividido em conjuntos de treinamento, validação e teste. Simplificando, pode parecer assim:
● Primeiro, você treina o modelo com o conjunto de treinamento e o valida com o conjunto de validação
● Itere até encontrar um conjunto de hiperparâmetros do modelo que forneça o melhor desempenho do modelo no conjunto de validação (com base nas métricas que você decidiu, precisão e recall, por exemplo). Treine o modelo usando conjuntos de treinamento e validação
● Medir o desempenho usando o conjunto de teste (dados que o modelo não viu durante o processo)
● Se você estiver obtendo o desempenho que seu sistema precisa, você pode implantá-lo
● Se não, você pode verificar se o modelo está superajustado ou se está tendo dificuldades para executar com algum caso específico. Você precisa analisar seu conjunto de dados e encontrar lacunas que você pode precisar preencher
Portanto, os dados que você usa são a chave para o processo e podem fazer seu modelo funcionar em níveis que são aceitáveis para seus sistemas ou não. É importante lembrar que para sistemas ADAS ou AD de EVs, um desempenho ruim pode ter implicações fatais.
Oé falar de dados
Quais são os dados que você precisa para treinar, validar e testar os sistemas ADAS e AD de EVs? Onde você obtém esses dados preciosos necessários para obter o melhor desempenho do seu sistema? A resposta mais óbvia é obtê-los do mundo real. Na verdade, é isso que a maioria das pessoas faz: equipa um carro com todos os sensores que capturarão os dados e começa a dirigi-lo salvando tudo o que os sensores veem.
Depois de milhares de quilômetros capturando dados, agora você precisa selecionar esses dados e anotá-los. Os modelos de ML ADAS e sistemas de percepção AD precisam de grandes quantidades de imagens ou vídeos, e eles precisam ser variados e anotados com descrições do que há nessas imagens, então durante o treinamento e validação os modelos de ML “sabem” o que estão vendo. Com essas informações, eles podem aprender a resolver um problema de classificação, por exemplo. Anotações ou dados de verdade básica não são capturados pelos sensores, eles são criados por humanos ou aplicativos que entendem as imagens. Dados de verdade básica típicos para um problema de classificação são caixas delimitadoras, eles significam “esta área específica na imagem é um carro”. Dependendo do problema, os dados de verdade básica que você precisa são diferentes, um sistema de percepção que estima distâncias precisa saber a distância dos objetos que vê durante o treinamento, então caixas delimitadoras não são suficientes.
Todo esse processo de captura, curadoria e anotação é muito custoso e demorado. Na verdade, se você tiver que iterar o ajuste de hiperparâmetros e precisar de mais dados, terá que fazer tudo de novo. Isso pode prejudicar seriamente seu processo de desenvolvimento.
Ovamos falar sobre dados sintéticos
E se você pudesse gerar todos os dados que quiser automaticamente com base em um conjunto de especificações, totalmente anotadas com toda a verdade básica de que você precisa para seu problema de percepção específico? É exatamente isso que os dados sintéticos podem fornecer. É a promessa de gerar dados que simulam cenários e sensores do mundo real, permitindo que os modelos de ML do sistema de percepção aprendam e se adaptem mais rapidamente. Isso acelera o desenvolvimento e a validação de ADAS e sistemas autônomos, tornando-os mais seguros e confiáveis.
A criação de dados sintéticos é uma combinação de computação gráfica 3D com tecnologias de simulação baseadas em física, fornecendo um novo campo para cientistas de dados criarem exatamente os dados de que precisam quando precisam, com dados de verdade terrestre perfe