نومادیک ۸٫۴ میلیون دلار برای حل بحران داده پنهان خودروهای خودران جذب کرد

نومادیک ۸٫۴ میلیون دلار برای حل بحران داده پنهان خودروهای خودران جذب کرد

نومادیک ۸٫۴ میلیون دلار برای تبدیل فیلم‌های خام خودروهای خودران و ربات‌ها به داده‌های ساختاریافته با یادگیری عمیق جذب کرد تا گلوگاه داده را حل کند.

9 min readApr 23, 2026

خودروهای خودران و ربات‌ها داده‌های حسگری بیشتری تولید می‌کنند که بیشتر سازمان‌ها قادر به استفاده از آن نیستند. نومادیک ۸٫۴ میلیون دلار سرمایه اولیه جذب کرده است تا این مشکل را حل کند — ایجاد یک لایه زیرساختی که با استفاده از یادگیری عمیق، فیلم‌های خام خودروهای خودران و ربات‌ها را به مجموعه داده‌های ساختاریافته و قابل جستجو تبدیل می‌کند و گلوگاهی را که بی‌سروصدا سرعت توسعه سیستم‌های خودمختار را در سراسر صنعت محدود می‌کند، برطرف می‌سازد.

فهرست مطالب


نومادیک دقیقاً چه کاری انجام می‌دهد؟

نومادیک در حال ساخت یک پلتفرم زیرساخت داده است که فیلم‌های خام و داده‌های حسگری ضبط‌شده توسط خودروهای خودران و ربات‌ها را به مجموعه داده‌های ساختاریافته و قابل پرس‌وجو تبدیل می‌کند. به جای ذخیره‌سازی فیلم‌های خام — که نگهداری آن‌ها پرهزینه و جستجو در آن‌ها تقریباً غیرممکن است — سیستم نومادیک از مدل‌های یادگیری عمیق برای برچسب‌زنی، طبقه‌بندی و نمایه‌سازی آن داده‌ها استفاده می‌کند تا مهندسان بتوانند به راحتی آنچه را که نیاز دارند پیدا کنند.

به گزارش TechCrunch، دور سرمایه‌گذاری اولیه ۸٫۴ میلیون دلاری نومادیک را به عنوان زیرساخت برای پشته هوش مصنوعی فیزیکی گسترده‌تر قرار می‌دهد — نه فقط برای برنامه‌های خودروهای خودران، بلکه برای هر سیستم رباتیکی که جریان‌های حسگری پیوسته تولید می‌کند و باید به سیگنال آموزشی تبدیل شوند.

این را مانند تفاوت بین انباری از جعبه‌های بدون برچسب و یک سیستم موجودی کامل نمایه‌سازی شده در نظر بگیرید. فیلم‌ها در هر دو حالت وجود دارند، اما فقط یک نسخه از نظر عملیاتی مفید است. این قیاس در مقیاس بزرگ از کار می‌افتد — مشکل داده‌های خودروهای خودران فقط برچسب‌زنی نیست، بلکه حجم عظیم به همراه هزینه برچسب‌زنی انسانی و پراکندگی موارد حاشیه‌ای ایمنی-بحرانی که در میان ساعت‌ها فیلم معمولی مدفون شده‌اند، است.


چرا مدیریت داده‌های خودروهای خودران و ربات‌ها اینقدر سخت است؟

یک خودروی خودران بسته به مجموعه حسگرهای خود — دوربین‌ها، LiDAR، رادار، IMU — می‌تواند روزانه بین ۱ تا ۴۰ ترابایت داده حسگری خام تولید کند. یک ناوگان کوچک ده خودرویی که به صورت مداوم کار می‌کند، در هفته بیش از آنچه که بیشتر خطوط لوله داده سازمانی برای مدیریت طراحی شده‌اند، داده تولید می‌کند.

مشکل در دو جهت تشدید می‌شود. اول، هزینه‌های ذخیره‌سازی زمانی که داده‌ها در مقیاس پتابایت باید برای آموزش مدل، ممیزی ایمنی و بررسی نظارتی نگهداری شوند، به سرعت انباشته می‌شود. دوم و مهم‌تر، بیشتر آن داده‌ها از نظر عملیاتی بی‌حرکت هستند — بدون تلاش قابل توجه برچسب‌زنی دستی نمی‌توان آن‌ها را پرس‌وجو، فیلتر یا استخراج کرد.

برای تیم‌های رباتیک به طور خاص، این یک حلقه بازخورد دردناک ایجاد می‌کند:

  1. استقرار ربات‌ها در میدان
  2. جمع‌آوری حجم عظیمی از داده‌های حسگری
  3. تقلا برای استخراج سناریوهای شکست خاص، موارد حاشیه‌ای یا رویدادهای حوزه-خاص مورد نیاز برای بهبود مدل
  4. کند شدن تکرار آموزش
  5. رکود عملکرد استقرار

گردش کار برچسب‌زنی انسانی — راه‌حل سنتی — از نظر اقتصادی مقیاس‌پذیر نیست. هزینه‌های برچسب‌زنی برای مجموعه داده‌های رانندگی خودران در گذشته بین ۰٫۰۵ تا ۰٫۵۰ دلار به ازای هر فریم بوده است، و یک ساعت ویدیو با نرخ ۳۰ فریم بر ثانیه شامل ۱۰۸,۰۰۰ فریم است. این اقتصاد به طور فعال تیم‌ها را از استفاده از کل داده‌های خروجی ناوگان خود بازمی‌دارد.


رویکرد یادگیری عمیق نومادیک چگونه کار می‌کند؟

سیستم اصلی نومادیک مدل‌های یادگیری عمیق را بر روی فیلم‌های خام اعمال می‌کند تا به طور خودکار ساختار معنایی را از جریان‌های حسگری استخراج کند. به جای اینکه مهندسان مجبور باشند قبل از قابل جستجو شدن فیلم‌ها را به صورت دستی برچسب‌گذاری کنند، پلتفرم آنچه را که در یک صحنه اتفاق می‌افتد استنباط می‌کند، رویدادها و اشیاء را برچسب‌گذاری می‌کند و خروجی را به فرم قابل پرس‌وجو سازماندهی می‌کند.

پیامد عملی قابل توجه است: تیم‌های رباتیک و خودروهای خودران می‌توانند پرس‌وجوهای زبان طبیعی یا ساختاریافته صادر کنند — "همه مواردی را نشان بده که خودرو در باران با فاصله کمتر از ۲ متر به یک عابر پیاده نزدیک شده است" — و کلیپ‌های مرتبط را از میلیون‌ها ساعت فیلم بدون بررسی دستی استخراج کنند.

این رویکرد شبیه کاری است که پایگاه‌های داده برداری مدرن برای متن بدون ساختار انجام می‌دهند، اما برای داده‌های حسگری چندوجهی شامل ویدیو، ابر نقاط، و جریان‌های IMU اعمال می‌شود. مدل یادگیری عمیق به عنوان یک لایه برچسب‌زنی خودکار عمل می‌کند و به طور چشمگیری هزینه هر مثال برچسب‌گذاری شده را کاهش می‌دهد و در عین حال چگالی سیگنال قابل استخراج از داده‌های موجود را افزایش می‌دهد.

نومادیک در مقابل رویکردهای سنتی خط لوله داده

رویکردهزینه برچسب‌زنیسرعت جستجومقیاس‌پذیریبازیابی موارد حاشیه‌ای
برچسب‌زنی دستی انسانیبالا (۰٫۰۵–۰٫۵۰ دلار/فریم)کندضعیفوابسته به بازبین
برچسب‌زنی خودکار مبتنی بر قانونپایینسریعمتوسطرویدادهای جدید را از دست می‌دهد
یادگیری عمیق نومادیکپایین-متوسطسریعبالاقوی برای دسته‌بندی‌های آموزش‌دیده
بدون خط لوله (ذخیره‌سازی خام)هیچهیچبالا (هزینه)صفر

نکته قابل توجه: برچسب‌زنی مبتنی بر یادگیری عمیق هرگونه نقاط کوری که در توزیع آموزشی مدل وجود دارد را به ارث می‌برد. برای موارد حاشیه‌ای نادر و ایمنی-بحرانی — دقیقاً همان رویدادهایی که برای آموزش ارزشمندترین هستند — مدلی که نمونه‌های کافی ندیده است ممکن است همچنان نتواند آن‌ها را به طور قابل اعتماد استخراج کند. ارزش‌آفرینی بلندمدت نومادیک احتمالاً به میزان خوب تعمیم مدل‌هایش در میان استقرارهای مختلف رباتیک و خودرویی بستگی دارد.


این برای رباتیک و اتوماسیون چه معنایی دارد؟

گلوگاه داده‌ای که نومادیک به آن حمله می‌کند منحصر به خودروهای خودران نیست. این همان مشکلی است که ربات‌های متحرک خودکار (AMR) انبار، ربات‌های بازرسی صنعتی، سیستم‌های اتوماسیون کشاورزی و برنامه‌های ربات‌های انسان‌نما با آن روبرو هستند — هر سیستم هوش مصنوعی مجسمی که در دنیای واقعی داده‌های ادراکی پیوسته تولید می‌کند.

برای تیم‌هایی که ناوگان رباتیک را اداره یا خریداری می‌کنند، این موضوع به دو روش مشخص اهمیت دارد.

سرعت آموزش: سرعت بهبود یک سیستم رباتیک مستقیماً با سرعت استخراج سیگنال آموزشی معنادار از داده‌های استقرار محدود می‌شود. زیرساختی که این حلقه را تسریع می‌کند — حتی با ضریب ۲–۳× — جدول زمانی بهبود را به نسبت فشرده می‌کند.

هوش ناوگان در مقیاس: با رشد ناوگان رباتیک، ارزش عملیاتی آن داده‌های حسگری فراتر از آموزش مدل گسترش می‌یابد. داده‌های ساختاریافته تشخیص ناهنجاری، سیگنال‌های تعمیرات پیش‌بینی و محک‌گذاری عملکرد در بین واحدها را ممکن می‌سازد — و خود ناوگان رباتیک را به یک سیستم مستندساز پیوسته تبدیل می‌کند.

برای اپراتورهایی که استقرار ربات‌های دست دوم یا بازسازی‌شده را در نظر می‌گیرند — جایی که پیکربندی حسگرها ممکن است متفاوت باشد و مجموعه داده‌های از پیش موجود کمتر مدیریت شده‌اند — پلتفرم‌هایی مانند نومادیک به طور خاص مرتبط می‌شوند. تغذیه داده‌های میدانی از ربات‌های صنعتی دست دوم به خطوط لوله آموزشی ساختاریافته در گذشته فرآیندی دستی و پرهزینه بوده است. زیرساخت ساختاریافته خودکار این معادله را تغییر می‌دهد.

رقم سرمایه‌گذاری اولیه ۸٫۴ میلیون دلاری همچنین نشان می‌دهد که سرمایه‌گذاری زیرساختی در کجای پشته هوش مصنوعی فیزیکی جریان دارد. سخت‌افزار — خود ربات‌ها — توجه را جلب می‌کند. اما لایه داده بین استقرار و بهبود مدل به طور فزاینده‌ای جایی است که مزیت رقابتی ساخته می‌شود و سرمایه در آن متمرکز می‌شود.

اپراتورهایی که ربات‌های همکار دست دوم برای فروش را ارزیابی می‌کنند یا برنامه‌های اتوماسیون کوچک‌مقیاس می‌سازند باید هزینه‌های خط لوله داده را در هزینه کل استقرار لحاظ کنند — سؤالی که نومادیک مستقیماً خود را برای پاسخ به آن موقعیت‌دهی می‌کند.


سؤالات متداول

نومادیک چیست و چه مشکلی را حل می‌کند؟

نومادیک یک شرکت زیرساخت داده است که از یادگیری عمیق برای تبدیل فیلم‌های حسگری خام خودروهای خودران و ربات‌ها به مجموعه داده‌های ساختاریافته و قابل جستجو استفاده می‌کند. این شرکت مشکل مقیاس‌پذیری داده‌های سیستم‌های خودمختار را حل می‌کند — جایی که حجم عظیمی از فیلم‌ها در میدان تولید می‌شوند اما بدون برچسب‌زنی دستی پرهزینه از نظر عملیاتی قابل استفاده نیستند.

یک خودروی خودران روزانه چقدر داده تولید می‌کند؟

یک خودروی خودران معمولاً بسته به پیکربندی دوربین، LiDAR و رادار خود روزانه بین ۱ تا ۴۰ ترابایت داده حسگری خام تولید می‌کند. یک ناوگان ده خودرویی می‌تواند هفتگی صدها ترابایت داده انباشته کند و پردازش دستی را در مقیاس بزرگ از نظر اقتصادی غیرممکن سازد.

رویکرد یادگیری عمیق نومادیک چه تفاوتی با برچسب‌زنی دستی دارد؟

برچسب‌زنی دستی بین ۰٫۰۵ تا ۰٫۵۰ دلار به ازای هر فریم هزینه دارد و آن را در مقیاس ناوگان بسیار پرهزینه می‌کند. نومادیک مدل‌های یادگیری عمیق را برای برچسب‌زنی و نمایه‌سازی خودکار فیلم‌ها اعمال می‌کند و مهندسان را قادر می‌سازد بدون نیاز به بررسی دستی فریم‌به‌فریم در مجموعه داده‌های بزرگ جستجو کنند — به طور قابل توجهی هزینه برچسب‌زنی و زمان دستیابی به بینش را کاهش می‌دهد.

آیا مشکل گلوگاه داده ربات‌های فراتر از خودروهای خودران را نیز تحت تأثیر قرار می‌دهد؟

بله. هر سیستم هوش مصنوعی مجسمی — AMRهای انبار، ربات‌های بازرسی، اتوماسیون کشاورزی، پلتفرم‌های انسان‌نما — داده‌های حسگری پیوسته‌ای تولید می‌کند که با همان چالش‌های ساختاریابی و بازیابی روبرو است. این مشکل صرف‌نظر از کاربرد خاص رباتیک با اندازه ناوگان و ساعات عملیاتی مقیاس می‌شود.

این سرمایه‌گذاری برای اکوسیستم گسترده‌تر هوش مصنوعی فیزیکی چه معنایی دارد؟

دور سرمایه‌گذاری اولیه ۸٫۴ میلیون دلاری نشان‌دهنده شناخت رو به رشد سرمایه‌گذاران است که لایه زیرساخت داده — نه فقط سخت‌افزار یا مدل‌های اصلی هوش مصنوعی — یک گلوگاه بحرانی در توسعه سیستم‌های خودمختار است. سرمایه‌گذاری زیرساختی در خطوط لوله داده یک شاخص پیشرو برای برنامه‌های استقرار بالغ هوش مصنوعی فیزیکی است.


داده‌های خروجی سیستم‌های خودمختار همیشه عظیم بوده است. قطعه گمشده زیرساختی برای تبدیل آن به سیگنال قابل استفاده بوده است. رویکرد نومادیک — اعمال یادگیری عمیق به عنوان یک لایه ساختاریابی خودکار — محدودیتی را برطرف می‌کند که هر سازمان استقراردهنده ربات یا خودرو در مقیاس را تحت تأثیر قرار می‌دهد. سرمایه‌گذاری اولیه مشکل را یکشبه حل نمی‌کند، اما یک شرط جهت‌گیری واضح را نشان می‌دهد که لایه داده جایی است که لبه رقابتی بعدی در هوش مصنوعی فیزیکی ساخته می‌شود.

آیا زیرساخت خط لوله داده گلوگاهی است که بهبود ناوگان رباتیک شما را محدود می‌کند — یا هنوز سخت‌افزار محدودیت است؟

مقالات مرتبط

به بحث بپیوندید

Is data pipeline infrastructure the bottleneck limiting your robot fleet — or is hardware still the constraint?

مقالات بیشتر

🍪 🍪 تنظیمات کوکی

ما از کوکی‌ها برای سنجش عملکرد استفاده می‌کنیم. سیاست حفظ حریم خصوصی