Nomadic levanta US$ 8,4 milhões para resolver a crise oculta de dados dos veículos autônomos

Nomadic levanta US$ 8,4 milhões para resolver a crise oculta de dados dos veículos autônomos

Nomadic levanta US$ 8,4M para converter gravações de sensores de AVs e robôs em conjuntos de dados estruturados usando aprendizado profundo, enfrentando um gargalo que limita o desenvolvimento de sistemas autônomos.

9 min readApr 23, 2026

Veículos autônomos e robôs geram mais dados de sensores do que a maioria das organizações consegue usar. A Nomadic levantou US$ 8,4 milhões em investimento inicial para resolver isso — construindo uma camada de infraestrutura que converte gravações brutas de AVs e robôs em conjuntos de dados estruturados e pesquisáveis usando aprendizado profundo, enfrentando um gargalo que limita silenciosamente o ritmo do desenvolvimento de sistemas autônomos em toda a indústria.

Índice


O que a Nomadic realmente faz?

A Nomadic está construindo uma plataforma de infraestrutura de dados que transforma gravações brutas de vídeo e sensores capturadas por veículos autônomos e robôs em conjuntos de dados estruturados e consultáveis. Em vez de manter gravações brutas armazenadas — caras para guardar, quase impossíveis de pesquisar — o sistema da Nomadic usa modelos de aprendizado profundo para etiquetar, classificar e indexar esses dados para que engenheiros possam realmente encontrar o que precisam.

De acordo com o TechCrunch, a rodada de US$ 8,4 milhões posiciona a Nomadic como infraestrutura para o stack mais amplo de Physical AI — não apenas para programas de AVs, mas para qualquer sistema robótico que gere fluxos contínuos de sensores que precisam ser transformados em sinal de treinamento.

Pense como a diferença entre um armazém cheio de caixas não etiquetadas e um sistema de inventário totalmente indexado. A gravação existe de qualquer forma, mas apenas uma versão é operacionalmente útil. Essa analogia se desfaz em escala — o problema com dados de AVs não é apenas a etiquetagem, é o volume combinado com o custo da anotação humana e a escassez de casos extremos críticos de segurança enterrados em horas de gravações rotineiras.


Por que os dados de AVs e robôs são tão difíceis de gerenciar?

Um único veículo autônomo pode gerar entre 1 e 40 terabytes de dados brutos de sensores por dia, dependendo de seu conjunto de sensores — câmeras, LiDAR, radar, IMU. Uma pequena frota de dez veículos em operação contínua produz mais dados por semana do que a maioria dos pipelines de dados empresariais foi projetada para lidar.

O problema se agrava em duas direções. Primeiro, os custos de armazenamento se acumulam rapidamente quando dados em escala de petabyte precisam ser retidos para treinamento de modelos, auditorias de segurança e revisão regulatória. Segundo, e mais importante, a maior parte desses dados é operacionalmente inerte — não podem ser consultados, filtrados ou extraídos sem um esforço significativo de etiquetagem manual.

Para equipes de robótica especificamente, isso cria um ciclo de feedback doloroso:

  1. Implantar robôs em campo
  2. Coletar enormes volumes de dados de sensores
  3. Lutar para extrair os cenários de falha específicos, casos extremos ou eventos de domínio necessários para melhorar o modelo
  4. A iteração de treinamento desacelera
  5. O desempenho da implantação estagna

Os fluxos de trabalho de anotação humana — a solução tradicional — não escalam economicamente. Os custos de etiquetagem para conjuntos de dados de direção autônoma historicamente ficam entre US$ 0,05 e US$ 0,50 por quadro, e uma única hora de vídeo a 30fps contém 108.000 quadros. A economia desencoraja ativamente as equipes a aproveitar todo o exaustão de dados de suas frotas.


Como funciona a abordagem de aprendizado profundo da Nomadic?

O sistema central da Nomadic aplica modelos de aprendizado profundo a gravações brutas para extrair automaticamente estrutura semântica dos fluxos de sensores. Em vez de exigir que engenheiros etiquetem manualmente as gravações antes que se tornem pesquisáveis, a plataforma infere o que está acontecendo em uma cena, etiqueta eventos e objetos, e organiza a saída em forma consultável.

A implicação prática é significativa: equipes de robótica e AVs podem emitir consultas em linguagem natural ou estruturadas — "mostre-me todas as instâncias em que o veículo se aproximou de um pedestre a menos de 2 metros na chuva" — e encontrar clipes relevantes em milhões de horas de gravação sem revisão manual.

Essa abordagem espelha o que os bancos de dados vetoriais modernos fazem para texto não estruturado, mas aplicado a dados de sensores multimodais, incluindo vídeo, nuvens de pontos e fluxos de IMU. O modelo de aprendizado profundo atua como uma camada de anotação automática, reduzindo drasticamente o custo por exemplo etiquetado e aumentando a densidade de sinal extraível dos dados existentes.

Nomadic vs. Abordagens Tradicionais de Pipeline de Dados

AbordagemCusto de AnotaçãoVelocidade de ConsultaEscalabilidadeRecuperação de Casos Extremos
Etiquetagem manual humanaAlto (US$ 0,05–US$ 0,50/quadro)LentaRuimDependente do revisor
Etiquetagem automática baseada em regrasBaixoRápidaModeradaPerde eventos novos
Aprendizado profundo da NomadicBaixo–MédioRápidaAltaForte em categorias treinadas
Nenhum pipeline (armazenamento bruto)NenhumNenhumAlto (custo)Zero

A ressalva que vale a pena notar: a anotação baseada em aprendizado profundo herda quaisquer pontos cegos existentes na distribuição de treinamento do modelo. Para casos extremos raros e críticos de segurança — exatamente os eventos mais valiosos para treinamento — um modelo que não viu exemplos suficientes ainda pode falhar em identificá-los de forma confiável. A proposta de valor de longo prazo da Nomadic provavelmente dependerá de quão bem seus modelos generalizam em diversas implantações de robôs e veículos.


O que isso significa para a robótica e automação

O gargalo de dados que a Nomadic está atacando não é exclusivo dos veículos autônomos. É o mesmo problema enfrentado por AMRs (robôs móveis autônomos) em armazéns, robôs de inspeção industrial, sistemas de automação agrícola e programas de robôs humanoides — qualquer sistema de IA corporificada que gere dados perceptuais contínuos no mundo real.

Para equipes que operam ou adquirem frotas de robôs, isso importa de duas maneiras concretas.

Velocidade de treinamento: A taxa na qual um sistema robótico melhora é diretamente limitada pela rapidez com que as equipes podem extrair sinal de treinamento significativo dos dados de implantação. Infraestrutura que acelera esse ciclo — mesmo por um fator de 2–3× — comprime a linha do tempo de melhoria proporcionalmente.

Inteligência de frota em escala: À medida que as frotas de robôs crescem, o valor operacional desses dados de sensores vai além do treinamento de modelos. Dados estruturados desbloqueiam detecção de anomalias, sinais de manutenção preditiva e benchmarking de desempenho entre unidades — transformando a própria frota de robôs em um sistema continuamente autodocumentado.

Para operadores considerando implantações de robôs usados ou reformados — onde as configurações de sensores podem variar e os conjuntos de dados pré-existentes são menos curados — plataformas como a Nomadic se tornam particularmente relevantes. Alimentar dados de campo de robôs industriais usados de volta em pipelines de treinamento estruturados tem sido historicamente um processo manual e caro. A infraestrutura de estruturação automática muda essa equação.

O valor de US$ 8,4 milhões da rodada inicial também sinaliza para onde o investimento em infraestrutura está fluindo no stack de Physical AI. O hardware — os próprios robôs — recebe a atenção. Mas a camada de dados entre a implantação e a melhoria do modelo é cada vez mais onde a vantagem competitiva é construída e onde o capital está começando a se concentrar.

Operadores avaliando cobots usados à venda ou montando programas de automação em pequena escala devem considerar os custos do pipeline de dados no custo total de implantação — uma questão que a Nomadic está diretamente se posicionando para responder.


Perguntas Frequentes

A Nomadic é uma empresa de infraestrutura de dados que usa aprendizado profundo para converter gravações brutas de sensores de veículos autônomos e robôs em conjuntos de dados estruturados e pesquisáveis. Ela resolve o problema de escalabilidade dos dados de sistemas autônomos — onde volumes imensos de gravações são gerados em campo, mas permanecem operacionalmente inúteis sem anotação manual cara.

Quanto dado um veículo autônomo gera por dia?

Um único veículo autônomo normalmente gera entre 1 e 40 terabytes de dados brutos de sensores por dia, dependendo de sua configuração de câmeras, LiDAR e radar. Uma frota de dez veículos pode acumular centenas de terabytes semanalmente, tornando o processamento manual economicamente inviável em escala.

Como a abordagem de aprendizado profundo da Nomadic difere da etiquetagem manual?

A etiquetagem manual custa entre US$ 0,05 e US$ 0,50 por quadro, tornando-se proibitivamente cara em escala de frota. A Nomadic aplica modelos de aprendizado profundo para etiquetar e indexar automaticamente as gravações, permitindo que engenheiros consultem grandes conjuntos de dados sem revisão humana quadro a quadro — reduzindo significativamente o custo de anotação e o tempo até o insight.

O gargalo de dados afeta robôs além dos veículos autônomos?

Sim. Qualquer sistema de IA corporificada — AMRs de armazém, robôs de inspeção, automação agrícola, plataformas humanoides — gera dados contínuos de sensores que enfrentam os mesmos desafios de estruturação e recuperação. O problema escala com o tamanho da frota e as horas de operação, independentemente da aplicação robótica específica.

O que esse financiamento significa para o ecossistema mais amplo de Physical AI?

A rodada inicial de US$ 8,4 milhões sinaliza o crescente reconhecimento dos investidores de que a camada de infraestrutura de dados — não apenas hardware ou modelos centrais de IA — é um gargalo crítico no desenvolvimento de sistemas autônomos. O investimento em infraestrutura de pipelines de dados é um indicador líder de programas de implantação de Physical AI em maturação.


O exaustão de dados de sistemas autônomos sempre foi enorme. A peça que faltava tem sido a infraestrutura para transformá-lo em sinal utilizável. A abordagem da Nomadic — aplicar aprendizado profundo como uma camada de estruturação automática — aborda uma restrição que afeta todas as organizações que implantam robôs ou veículos em escala. O financiamento inicial não resolverá o problema da noite para o dia, mas marca uma aposta direcional clara de que a camada de dados é onde a próxima vantagem competitiva em Physical AI será construída.

A infraestrutura de pipeline de dados é o gargalo que limita a melhoria da sua frota de robôs — ou o hardware ainda é a restrição?

Artigos relacionados

Participe da discussão

Is data pipeline infrastructure the bottleneck limiting your robot fleet — or is hardware still the constraint?

Mais artigos

🍪 🍪 Preferências de cookies

Usamos cookies para medir o desempenho. Política de Privacidade