Nomadic získal 8,4 milionu dolarů na řešení skryté datové krize autonomních vozidel

Nomadic získal 8,4 milionu dolarů na řešení skryté datové krize autonomních vozidel

Nomadic získal 8,4M $ na převod surových AV a robotických dat do strukturovaných datových sad pomocí hlubokého učení.

8 min readApr 23, 2026

Autonomní vozidla a roboty generují více senzorových dat, než většina organizací dokáže skutečně využít. Společnost Nomadic získala 8,4 milionu dolarů v seed financování, aby to napravila – buduje infrastrukturní vrstvu, která pomocí hlubokého učení převádí surová videa a záznamy z AV a robotů do strukturovaných, prohledávatelných datových sad. Tím řeší úzké místo, které tiše omezuje tempo vývoje autonomních systémů napříč celým odvětvím.

Obsah


Co Nomadic vlastně dělá?

Nomadic vyvíjí platformu datové infrastruktury, která převádí surová videa a senzorová data zachycená autonomními vozidly a roboty do strukturovaných, dotazovatelných datových sad. Místo aby surové záběry ležely v úložišti – drahé na udržování, téměř nemožné prohledávat – Nomadicův systém pomocí modelů hlubokého učení taguje, klasifikuje a indexuje data, takže inženýři mohou skutečně najít, co potřebují.

Podle TechCrunch staví seed kolo ve výši 8,4 milionu dolarů Nomadic jako infrastrukturu pro širší Physical AI stack – nejen pro AV programy, ale pro jakýkoli robotický systém generující kontinuální senzorové toky, které je třeba přeměnit na trénovací signál.

Představte si to jako rozdíl mezi skladištěm plným neoznačených krabic a plně indexovaným inventárním systémem. Záběry existují v obou případech, ale pouze jedna verze je provozně užitečná. Tato analogie se v měřítku rozpadá – problém s AV daty není jen označování, ale jejich obrovský objem v kombinaci s náklady na lidské anotování a řídkostí bezpečnostně kritických hraničních případů pohřbených uvnitř hodin rutinních záznamů.


Proč jsou data z AV a robotů tak obtížně spravovatelná?

Jediné autonomní vozidlo může vygenerovat mezi 1 a 40 terabajty surových senzorových dat denně v závislosti na své senzorové výbavě – kamery, LiDAR, radar, IMU. Malá flotila deseti vozidel při nepřetržitém provozu produkuje za týden více dat, než je většina podnikových datových pipeline navržena zpracovat.

Problém se znásobuje ve dvou směrech. Zaprvé, náklady na úložiště rychle rostou, když je třeba uchovávat data v měřítku petabajtů pro trénování modelů, bezpečnostní audity a regulativní přezkum. Zadruhé, a to je důležitější, většina těchto dat je provozně inertní – nelze je dotazovat, filtrovat ani z nich získávat informace bez značného manuálního označování.

Pro robotické týmy to konkrétně vytváří bolestivou zpětnou vazbu:

  1. Nasazení robotů v terénu
  2. Sběr obrovského množství senzorových dat
  3. Boj s extrakcí konkrétních selhání, hraničních případů nebo doménově specifických událostí potřebných ke zlepšení modelu
  4. Zpomalení trénovacích iterací
  5. Stagnace výkonu nasazení

Tradiční řešení – pracovní postupy lidského anotování – nejsou ekonomicky škálovatelná. Náklady na označování datových sad pro autonomní řízení se historicky pohybovaly mezi 0,05 a 0,50 dolaru za snímek a jedna hodina videa při 30 fps obsahuje 108 000 snímků. Ekonomika aktivně odrazuje týmy od využití plného datového výdechu svých flotil.


Jak funguje přístup Nomadic založený na hlubokém učení?

Základní systém Nomadic aplikuje modely hlubokého učení na surové záběry, aby automaticky extrahoval sémantickou strukturu ze senzorových toků. Místo aby inženýři museli ručně označovat záběry, než se stanou prohledávatelnými, platforma odvozuje, co se ve scéně děje, taguje události a objekty a organizuje výstup do dotazovatelné podoby.

Praktický dopad je významný: robotické a AV týmy mohou zadávat dotazy v přirozeném jazyce nebo strukturované dotazy – „ukaž mi všechny případy, kdy se vozidlo přiblížilo k chodci na méně než 2 metry za deště“ – a získat relevantní klipy z milionů hodin záběrů bez ručního procházení.

Tento přístup se podobá tomu, co moderní vektorové databáze dělají pro nestrukturovaný text, ale aplikovaný na multimodální senzorová data zahrnující video, mračna bodů a IMU toky. Model hlubokého učení funguje jako automatická anotační vrstva, dramaticky snižuje náklady na označený příklad a zároveň zvyšuje hustotu extrahovatelného signálu z existujících dat.

Nomadic vs. tradiční přístupy k datovým pipeline

PřístupNáklady na anotaciRychlost dotazováníŠkálovatelnostVyhledání hraničních případů
Ruční lidské označováníVysoké (0,05–0,50 $/snímek)PomaláŠpatnáZávisí na hodnotiteli
Pravidlové automatické tagováníNízkéRychláStředníPřehlíží nové události
Nomadic hluboké učeníNízké–středníRychláVysokáSilné u trénovaných kategorií
Žádná pipeline (surové úložiště)ŽádnéŽádnáVysoká (náklady)Nulové

Za zmínku stojí upozornění: anotace založená na hlubokém učení dědí všechna slepá místa, která existují v trénovací distribuci modelu. U vzácných, bezpečnostně kritických hraničních případů – právě těch událostí, které jsou pro trénování nejcennější – model, který neviděl dostatek příkladů, je může stále nespolehlivě nacházet. Dlouhodobá hodnotová nabídka Nomadic pravděpodobně závisí na tom, jak dobře jeho modely generalizují napříč různorodými nasazeními robotů a vozidel.


Co to znamená pro robotiku a automatizaci

Datové úzké místo, které Nomadic řeší, není unikátní pro autonomní vozidla. Je to stejný problém, kterému čelí skladové AMR (autonomní mobilní roboty), průmyslové inspekční roboty, zemědělské automatizační systémy a programy humanoidních robotů – jakýkoli vtělený AI systém, který generuje kontinuální percepční data v reálném světě.

Pro týmy provozující nebo pořizující flotily robotů to má dva konkrétní dopady.

Rychlost trénování: Rychlost, s jakou se robotický systém zlepšuje, je přímo omezena tím, jak rychle mohou týmy extrahovat smysluplný trénovací signál z provozních dat. Infrastruktura, která tento cyklus zrychlí – byť jen 2–3× – úměrně zkrátí čas potřebný ke zlepšení.

Inteligence flotily v měřítku: Jak flotily robotů rostou, provozní hodnota těchto senzorových dat přesahuje trénování modelů. Strukturovaná data umožňují detekci anomálií, prediktivní údržbu a benchmarking výkonu napříč jednotkami – čímž se samotná flotila robotů stává kontinuálně sebedokumentujícím systémem.

Pro provozovatele zvažující nasazení použitých nebo repasovaných robotů – kde se konfigurace senzorů mohou lišit a existující datové sady jsou méně kurátorsky zpracované – se platformy jako Nomadic stávají obzvláště relevantními. Zpětné zapojení dat z terénu z použitých průmyslových robotů do strukturovaných trénovacích pipeline bylo dosud ručním, nákladným procesem. Automatizovaná strukturovací infrastruktura tuto rovnici mění.

Částka 8,4 milionu dolarů v seed kole také signalizuje, kam směřují investice do infrastruktury v Physical AI stacku. Hardware – samotné roboty – získává pozornost. Ale datová vrstva mezi nasazením a zlepšováním modelu je stále více místem, kde se buduje konkurenční výhoda a kde se začíná koncentrovat kapitál.

Provozovatelé hodnotící použité coboty na prodej nebo budující malé automatizační programy by měli zahrnout náklady na datové pipeline do celkových nákladů na nasazení – otázka, na kterou se Nomadic přímo snaží odpovědět.


Často kladené otázky

Nomadic je společnost zabývající se datovou infrastrukturou, která pomocí hlubokého učení převádí surové senzorové záběry z autonomních vozidel a robotů do strukturovaných, prohledávatelných datových sad. Řeší problém škálování dat autonomních systémů – kde se v terénu generuje obrovské množství záběrů, které zůstávají provozně nepoužitelné bez nákladného ručního označování.

Kolik dat vygeneruje autonomní vozidlo denně?

Jedno autonomní vozidlo typicky vygeneruje mezi 1 a 40 terabajty surových senzorových dat denně v závislosti na konfiguraci kamer, LiDARu a radaru. Flotila deseti vozidel může týdně nashromáždit stovky terabajtů, což činí ruční zpracování v měřítku ekonomicky neudržitelným.

Jak se liší přístup Nomadic založený na hlubokém učení od ručního označování?

Ruční označování stojí mezi 0,05 a 0,50 dolaru za snímek, což je v měřítku flotily neúměrně drahé. Nomadic aplikuje modely hlubokého učení k automatickému tagování a indexování záběrů, což umožňuje inženýrům dotazovat se napříč velkými datovými sadami bez snímek po snímku lidské revize – výrazně snižuje náklady na anotaci a čas k získání informací.

Ovlivňuje problém s datovým úzkým hrdlem i roboty mimo autonomní vozidla?

Ano. Jakýkoli vtělený AI systém – skladové AMR, inspekční roboty, zemědělská automatizace, humanoidní platformy – generuje kontinuální senzorová data, která čelí stejným výzvám strukturování a vyhledávání. Problém se škáluje s velikostí flotily a provozními hodinami bez ohledu na konkrétní robotickou aplikaci.

Co znamená toto financování pro širší Physical AI ekosystém?

Seed kolo ve výši 8,4 milionu dolarů signalizuje rostoucí uznání investorů, že vrstva datové infrastruktury – nejen hardware nebo základní AI modely – je kritickým úzkým místem ve vývoji autonomních systémů. Investice do datových pipeline je předním indikátorem dozrávajících programů nasazení Physical AI.


Datový výfuk autonomních systémů byl vždy obrovský. Chybějícím kouskem byla infrastruktura k jeho přeměně na použitelný signál. Přístup Nomadic – aplikace hlubokého učení jako automatické strukturovací vrstvy – řeší omezení, které ovlivňuje každou organizaci nasazující roboty nebo vozidla v měřítku. Seed financování problém nevyřeší přes noc, ale označuje jasnou směrovou sázku, že datová vrstva je místem, kde se buduje další konkurenční výhoda v Physical AI.

Je datová pipeline infrastruktura úzkým místem limitujícím zlepšování vaší robotické flotily – nebo je stále omezením hardware?

Související články

Zapojte se do diskuse

Is data pipeline infrastructure the bottleneck limiting your robot fleet — or is hardware still the constraint?

Další články

🍪 🍪 Předvolby cookies

Používáme cookies k měření výkonu. Zásady ochrany osobních údajů