Nomadic залучає $8,4 млн, щоб вирішити приховану кризу даних автономних транспортних засобів (2026)

Автономні транспортні засоби та роботи генерують більше сенсорних даних, ніж більшість організацій може реально використати. Компанія Nomadic залучила $8,4 мільйона початкового фінансування, щоб це виправити — створюючи інфраструктурний рівень, який перетворює сирі відеозаписи AV та роботів у структуровані набори даних, які можна шукати, за допомогою глибокого навчання, вирішуючи вузьке місце, яке непомітно обмежує темпи розвитку автономних систем у всій галузі.

Зміст

Що насправді робить Nomadic?
Чому даними AV та роботів так важко керувати?
Як працює підхід глибокого навчання Nomadic?
Що це означає для робототехніки та автоматизації?
Поширені запитання

Що насправді робить Nomadic?

Nomadic будує платформу інфраструктури даних, яка перетворює сирі відеозаписи та сенсорні дані, зібрані автономними транспортними засобами та роботами, у структуровані набори даних, що підлягають пошуку. Замість того, щоб сирі матеріали лежали в сховищі — дорого зберігати, майже неможливо шукати — система Nomadic використовує моделі глибокого навчання для тегування, класифікації та індексації цих даних, щоб інженери могли знайти те, що їм потрібно.

Згідно з TechCrunch, раунд початкового фінансування на $8,4 мільйона позиціонує Nomadic як інфраструктуру для ширшого стеку Physical AI — не лише для програм AV, але й для будь-якої роботизованої системи, яка генерує безперервні потоки сенсорних даних, які потрібно перетворити на навчальний сигнал.

Думайте про це як про різницю між складом з немаркованими коробками та повністю індексованою системою інвентаризації. Записи існують в обох випадках, але лише одна версія є операційно корисною. Ця аналогія руйнується в масштабі — проблема з даними AV полягає не лише в маркуванні, а й у величезному обсязі в поєднанні з вартістю людської анотації та розрідженістю критичних для безпеки граничних випадків, похованих у годинах рутинних записів.

Чому даними AV та роботів так важко керувати?

Один автономний транспортний засіб може генерувати від 1 до 40 терабайт сирих сенсорних даних на день, залежно від комплекту датчиків — камери, LiDAR, радар, IMU. Невеликий парк з десяти транспортних засобів, що працюють безперервно, виробляє більше даних за тиждень, ніж більшість корпоративних конвеєрів даних були розроблені для обробки.

Проблема посилюється в двох напрямках. По-перше, витрати на зберігання швидко накопичуються, коли дані обсягом у петабайти мають зберігатися для навчання моделей, аудитів безпеки та регуляторних перевірок. По-друге, і що важливіше, більшість цих даних операційно інертні — їх неможливо запитувати, фільтрувати або витягувати без значних ручних зусиль з маркування.

Для команд робототехніки це створює болісний зворотний зв'язок:

Розгортання роботів у полі
Збір величезних обсягів сенсорних даних
Спроби витягти конкретні сценарії відмов, граничні випадки або доменні події, необхідні для покращення моделі
Ітерація навчання сповільнюється
Продуктивність розгортання стагнує

Людські робочі процеси анотації — традиційне рішення — не масштабуються економічно. Витрати на маркування для наборів даних автономного водіння історично коливалися між $0,05 і $0,50 за кадр, а одна година відео з частотою 30 кадрів/с містить 108 000 кадрів. Економіка активно відштовхує команди від використання повного вихідного потоку даних своїх парків.

Як працює підхід глибокого навчання Nomadic?

Основна система Nomadic застосовує моделі глибокого навчання до сирих даних, щоб автоматично витягувати семантичну структуру з потоків сенсорів. Замість того, щоб вимагати від інженерів ручного маркування даних, перш ніж вони стануть доступними для пошуку, платформа визначає, що відбувається в сцені, тегує події та об'єкти й організовує вихідні дані у форму, яку можна запитувати.

Практичний наслідок є значним: команди робототехніки та AV можуть виконувати запити природною мовою або структуровані — "покажи всі випадки, коли транспортний засіб наближався до пішохода на відстань менше 2 метрів під дощем" — і отримувати відповідні кліпи з мільйонів годин запису без ручного перегляду.

Цей підхід нагадує те, що сучасні векторні бази даних роблять з неструктурованим текстом, але застосований до мультимодальних сенсорних даних, включаючи відео, хмари точок та потоки IMU. Модель глибокого навчання діє як автоматичний шар анотації, значно зменшуючи вартість кожного поміченого прикладу, одночасно збільшуючи щільність витяжного сигналу з наявних даних.

Nomadic проти традиційних підходів до конвеєра даних

Підхід	Вартість анотації	Швидкість запиту	Масштабованість	Відновлення граничних випадків
Ручне людське маркування	Висока ($0,05–$0,50/кадр)	Повільна	Низька	Залежить від рецензента
Автоматичне тегування на основі правил	Низька	Швидка	Помірна	Пропускає нові події
Глибоке навчання Nomadic	Низька–Середня	Швидка	Висока	Сильна за навченими категоріями
Відсутній конвеєр (сире зберігання)	Відсутня	Відсутня	Висока (вартість)	Нульова

Варто зазначити застереження: анотація на основі глибокого навчання успадковує будь-які сліпі плями, які існують у розподілі навчальних даних моделі. Для рідкісних, критичних для безпеки граничних випадків — саме тих подій, які найбільш цінні для навчання — модель, яка не бачила достатньо прикладів, все ще може не змогти надійно їх виявити. Довгострокова ціннісна пропозиція Nomadic, ймовірно, залежить від того, наскільки добре її моделі узагальнюються для різноманітних розгортань роботів і транспортних засобів.

Що це означає для робототехніки та автоматизації

Вузьке місце даних, яке атакує Nomadic, не є унікальним для автономних транспортних засобів. Це та сама проблема, з якою стикаються складські AMR (автономні мобільні роботи), промислові інспекційні роботи, системи автоматизації сільського господарства та програми гуманоїдних роботів — будь-яка втілена система ШІ, яка генерує безперервні перцептивні дані в реальному світі.

Для команд, які експлуатують або закуповують роботизовані парки, це має значення у двох конкретних аспектах.

Швидкість навчання: Темп, з яким роботизована система покращується, безпосередньо обмежується тим, наскільки швидко команди можуть витягувати значущий навчальний сигнал з даних розгортання. Інфраструктура, яка прискорює цей цикл — навіть у 2–3 рази — пропорційно стискає часові рамки покращення.

Інтелект парку в масштабі: Зі зростанням роботизованих парків операційна цінність цих сенсорних даних виходить за межі навчання моделей. Структуровані дані відкривають можливості для виявлення аномалій, сигналів прогнозного обслуговування та порівняльного аналізу продуктивності між одиницями — перетворюючи сам роботизований парк на систему, яка безперервно само документується.

Для операторів, які розглядають можливість використання вживаних або відновлених роботів — де конфігурації датчиків можуть відрізнятися, а існуючі набори даних менш куровані — такі платформи, як Nomadic, стають особливо актуальними. Подача польових даних від уживаних промислових роботів назад у структуровані конвеєри навчання історично була ручним, дорогим процесом. Автоматизована інфраструктура структурування змінює цю логіку.

Цифра початкового фінансування в $8,4 мільйона також сигналізує про те, куди спрямовуються інвестиції в інфраструктуру в стеку Physical AI. Апаратне забезпечення — самі роботи — привертає увагу. Але рівень даних між розгортанням і покращенням моделі все частіше стає місцем, де будується конкурентна перевага і де починає концентруватися капітал.

Оператори, які оцінюють уживані коботи для продажу або створюють невеликі програми автоматизації, повинні враховувати витрати на інфраструктуру даних у загальну вартість розгортання — питання, на яке Nomadic безпосередньо позиціонується, щоб відповісти.

Поширені запитання

Nomadic — це компанія з інфраструктури даних, яка використовує глибоке навчання для перетворення сирих сенсорних даних від автономних транспортних засобів і роботів у структуровані набори даних, які можна шукати. Вона вирішує проблему масштабування даних автономних систем, де величезні обсяги матеріалів генеруються в полі, але залишаються операційно непридатними без дорогої ручної анотації.

Скільки даних генерує автономний транспортний засіб на день?

Один автономний транспортний засіб зазвичай генерує від 1 до 40 терабайт сирих сенсорних даних на день, залежно від конфігурації камери, LiDAR та радара. Парк з десяти транспортних засобів може накопичувати сотні терабайт щотижня, що робить ручну обробку економічно недоцільною в масштабі.

Чим підхід глибокого навчання Nomadic відрізняється від ручного маркування?

Ручне маркування коштує від $0,05 до $0,50 за кадр, що робить його надзвичайно дорогим у масштабі парку. Nomadic застосовує моделі глибокого навчання для автоматичного тегування та індексації матеріалів, дозволяючи інженерам виконувати запити по великих наборах даних без покадрового перегляду — значно зменшуючи вартість анотації та час отримання інсайтів.

Чи впливає проблема вузького місця даних на роботів, окрім автономних транспортних засобів?

Так. Будь-яка втілена система ШІ — складські AMR, інспекційні роботи, сільськогосподарська автоматизація, гуманоїдні платформи — генерує безперервні сенсорні дані, які стикаються з тими ж викликами структурування та пошуку. Проблема масштабується з розміром парку та робочими годинами незалежно від конкретного роботизованого застосування.

Що це фінансування означає для ширшої екосистеми Physical AI?

Початковий раунд на $8,4 мільйона сигналізує про зростаюче визнання інвесторами того, що рівень інфраструктури даних — не лише апаратне забезпечення або базові моделі ШІ — є критичним вузьким місцем у розробці автономних систем. Інвестиції в інфраструктуру конвеєрів даних є провідним індикатором дозрівання програм розгортання Physical AI.

Вихідні дані автономних систем завжди були величезними. Відсутньою частиною була інфраструктура, щоб перетворити їх на придатний сигнал. Підхід Nomadic — застосування глибокого навчання як автоматичного шару структурування — вирішує обмеження, яке впливає на кожну організацію, що розгортає роботів або транспортні засоби в масштабі. Початкове фінансування не вирішить проблему за одну ніч, але воно позначає чітку спрямовану ставку на те, що рівень даних — це те місце, де будується наступний конкурентний край у Physical AI.

Чи є інфраструктура конвеєра даних вузьким місцем, яке обмежує покращення вашого роботизованого парку — чи апаратне забезпечення все ще є обмеженням?