خودروهای خودران و رباتها دادههای حسگری بیشتری تولید میکنند که بیشتر سازمانها قادر به استفاده از آن نیستند. نومادیک ۸٫۴ میلیون دلار سرمایه اولیه جذب کرده است تا این مشکل را حل کند — ایجاد یک لایه زیرساختی که با استفاده از یادگیری عمیق، فیلمهای خام خودروهای خودران و رباتها را به مجموعه دادههای ساختاریافته و قابل جستجو تبدیل میکند و گلوگاهی را که بیسروصدا سرعت توسعه سیستمهای خودمختار را در سراسر صنعت محدود میکند، برطرف میسازد.
فهرست مطالب
- نومادیک دقیقاً چه کاری انجام میدهد؟
- چرا مدیریت دادههای خودروهای خودران و رباتها اینقدر سخت است؟
- رویکرد یادگیری عمیق نومادیک چگونه کار میکند؟
- این برای رباتیک و اتوماسیون چه معنایی دارد؟
- سؤالات متداول
نومادیک دقیقاً چه کاری انجام میدهد؟
نومادیک در حال ساخت یک پلتفرم زیرساخت داده است که فیلمهای خام و دادههای حسگری ضبطشده توسط خودروهای خودران و رباتها را به مجموعه دادههای ساختاریافته و قابل پرسوجو تبدیل میکند. به جای ذخیرهسازی فیلمهای خام — که نگهداری آنها پرهزینه و جستجو در آنها تقریباً غیرممکن است — سیستم نومادیک از مدلهای یادگیری عمیق برای برچسبزنی، طبقهبندی و نمایهسازی آن دادهها استفاده میکند تا مهندسان بتوانند به راحتی آنچه را که نیاز دارند پیدا کنند.
به گزارش TechCrunch، دور سرمایهگذاری اولیه ۸٫۴ میلیون دلاری نومادیک را به عنوان زیرساخت برای پشته هوش مصنوعی فیزیکی گستردهتر قرار میدهد — نه فقط برای برنامههای خودروهای خودران، بلکه برای هر سیستم رباتیکی که جریانهای حسگری پیوسته تولید میکند و باید به سیگنال آموزشی تبدیل شوند.
این را مانند تفاوت بین انباری از جعبههای بدون برچسب و یک سیستم موجودی کامل نمایهسازی شده در نظر بگیرید. فیلمها در هر دو حالت وجود دارند، اما فقط یک نسخه از نظر عملیاتی مفید است. این قیاس در مقیاس بزرگ از کار میافتد — مشکل دادههای خودروهای خودران فقط برچسبزنی نیست، بلکه حجم عظیم به همراه هزینه برچسبزنی انسانی و پراکندگی موارد حاشیهای ایمنی-بحرانی که در میان ساعتها فیلم معمولی مدفون شدهاند، است.
چرا مدیریت دادههای خودروهای خودران و رباتها اینقدر سخت است؟
یک خودروی خودران بسته به مجموعه حسگرهای خود — دوربینها، LiDAR، رادار، IMU — میتواند روزانه بین ۱ تا ۴۰ ترابایت داده حسگری خام تولید کند. یک ناوگان کوچک ده خودرویی که به صورت مداوم کار میکند، در هفته بیش از آنچه که بیشتر خطوط لوله داده سازمانی برای مدیریت طراحی شدهاند، داده تولید میکند.
مشکل در دو جهت تشدید میشود. اول، هزینههای ذخیرهسازی زمانی که دادهها در مقیاس پتابایت باید برای آموزش مدل، ممیزی ایمنی و بررسی نظارتی نگهداری شوند، به سرعت انباشته میشود. دوم و مهمتر، بیشتر آن دادهها از نظر عملیاتی بیحرکت هستند — بدون تلاش قابل توجه برچسبزنی دستی نمیتوان آنها را پرسوجو، فیلتر یا استخراج کرد.
برای تیمهای رباتیک به طور خاص، این یک حلقه بازخورد دردناک ایجاد میکند:
- استقرار رباتها در میدان
- جمعآوری حجم عظیمی از دادههای حسگری
- تقلا برای استخراج سناریوهای شکست خاص، موارد حاشیهای یا رویدادهای حوزه-خاص مورد نیاز برای بهبود مدل
- کند شدن تکرار آموزش
- رکود عملکرد استقرار
گردش کار برچسبزنی انسانی — راهحل سنتی — از نظر اقتصادی مقیاسپذیر نیست. هزینههای برچسبزنی برای مجموعه دادههای رانندگی خودران در گذشته بین ۰٫۰۵ تا ۰٫۵۰ دلار به ازای هر فریم بوده است، و یک ساعت ویدیو با نرخ ۳۰ فریم بر ثانیه شامل ۱۰۸,۰۰۰ فریم است. این اقتصاد به طور فعال تیمها را از استفاده از کل دادههای خروجی ناوگان خود بازمیدارد.
رویکرد یادگیری عمیق نومادیک چگونه کار میکند؟
سیستم اصلی نومادیک مدلهای یادگیری عمیق را بر روی فیلمهای خام اعمال میکند تا به طور خودکار ساختار معنایی را از جریانهای حسگری استخراج کند. به جای اینکه مهندسان مجبور باشند قبل از قابل جستجو شدن فیلمها را به صورت دستی برچسبگذاری کنند، پلتفرم آنچه را که در یک صحنه اتفاق میافتد استنباط میکند، رویدادها و اشیاء را برچسبگذاری میکند و خروجی را به فرم قابل پرسوجو سازماندهی میکند.
پیامد عملی قابل توجه است: تیمهای رباتیک و خودروهای خودران میتوانند پرسوجوهای زبان طبیعی یا ساختاریافته صادر کنند — "همه مواردی را نشان بده که خودرو در باران با فاصله کمتر از ۲ متر به یک عابر پیاده نزدیک شده است" — و کلیپهای مرتبط را از میلیونها ساعت فیلم بدون بررسی دستی استخراج کنند.
این رویکرد شبیه کاری است که پایگاههای داده برداری مدرن برای متن بدون ساختار انجام میدهند، اما برای دادههای حسگری چندوجهی شامل ویدیو، ابر نقاط، و جریانهای IMU اعمال میشود. مدل یادگیری عمیق به عنوان یک لایه برچسبزنی خودکار عمل میکند و به طور چشمگیری هزینه هر مثال برچسبگذاری شده را کاهش میدهد و در عین حال چگالی سیگنال قابل استخراج از دادههای موجود را افزایش میدهد.
نومادیک در مقابل رویکردهای سنتی خط لوله داده
| رویکرد | هزینه برچسبزنی | سرعت جستجو | مقیاسپذیری | بازیابی موارد حاشیهای |
|---|---|---|---|---|
| برچسبزنی دستی انسانی | بالا (۰٫۰۵–۰٫۵۰ دلار/فریم) | کند | ضعیف | وابسته به بازبین |
| برچسبزنی خودکار مبتنی بر قانون | پایین | سریع | متوسط | رویدادهای جدید را از دست میدهد |
| یادگیری عمیق نومادیک | پایین-متوسط | سریع | بالا | قوی برای دستهبندیهای آموزشدیده |
| بدون خط لوله (ذخیرهسازی خام) | هیچ | هیچ | بالا (هزینه) | صفر |
نکته قابل توجه: برچسبزنی مبتنی بر یادگیری عمیق هرگونه نقاط کوری که در توزیع آموزشی مدل وجود دارد را به ارث میبرد. برای موارد حاشیهای نادر و ایمنی-بحرانی — دقیقاً همان رویدادهایی که برای آموزش ارزشمندترین هستند — مدلی که نمونههای کافی ندیده است ممکن است همچنان نتواند آنها را به طور قابل اعتماد استخراج کند. ارزشآفرینی بلندمدت نومادیک احتمالاً به میزان خوب تعمیم مدلهایش در میان استقرارهای مختلف رباتیک و خودرویی بستگی دارد.
این برای رباتیک و اتوماسیون چه معنایی دارد؟
گلوگاه دادهای که نومادیک به آن حمله میکند منحصر به خودروهای خودران نیست. این همان مشکلی است که رباتهای متحرک خودکار (AMR) انبار، رباتهای بازرسی صنعتی، سیستمهای اتوماسیون کشاورزی و برنامههای رباتهای انساننما با آن روبرو هستند — هر سیستم هوش مصنوعی مجسمی که در دنیای واقعی دادههای ادراکی پیوسته تولید میکند.
برای تیمهایی که ناوگان رباتیک را اداره یا خریداری میکنند، این موضوع به دو روش مشخص اهمیت دارد.
سرعت آموزش: سرعت بهبود یک سیستم رباتیک مستقیماً با سرعت استخراج سیگنال آموزشی معنادار از دادههای استقرار محدود میشود. زیرساختی که این حلقه را تسریع میکند — حتی با ضریب ۲–۳× — جدول زمانی بهبود را به نسبت فشرده میکند.
هوش ناوگان در مقیاس: با رشد ناوگان رباتیک، ارزش عملیاتی آن دادههای حسگری فراتر از آموزش مدل گسترش مییابد. دادههای ساختاریافته تشخیص ناهنجاری، سیگنالهای تعمیرات پیشبینی و محکگذاری عملکرد در بین واحدها را ممکن میسازد — و خود ناوگان رباتیک را به یک سیستم مستندساز پیوسته تبدیل میکند.
برای اپراتورهایی که استقرار رباتهای دست دوم یا بازسازیشده را در نظر میگیرند — جایی که پیکربندی حسگرها ممکن است متفاوت باشد و مجموعه دادههای از پیش موجود کمتر مدیریت شدهاند — پلتفرمهایی مانند نومادیک به طور خاص مرتبط میشوند. تغذیه دادههای میدانی از رباتهای صنعتی دست دوم به خطوط لوله آموزشی ساختاریافته در گذشته فرآیندی دستی و پرهزینه بوده است. زیرساخت ساختاریافته خودکار این معادله را تغییر میدهد.
رقم سرمایهگذاری اولیه ۸٫۴ میلیون دلاری همچنین نشان میدهد که سرمایهگذاری زیرساختی در کجای پشته هوش مصنوعی فیزیکی جریان دارد. سختافزار — خود رباتها — توجه را جلب میکند. اما لایه داده بین استقرار و بهبود مدل به طور فزایندهای جایی است که مزیت رقابتی ساخته میشود و سرمایه در آن متمرکز میشود.
اپراتورهایی که رباتهای همکار دست دوم برای فروش را ارزیابی میکنند یا برنامههای اتوماسیون کوچکمقیاس میسازند باید هزینههای خط لوله داده را در هزینه کل استقرار لحاظ کنند — سؤالی که نومادیک مستقیماً خود را برای پاسخ به آن موقعیتدهی میکند.
سؤالات متداول
نومادیک چیست و چه مشکلی را حل میکند؟
نومادیک یک شرکت زیرساخت داده است که از یادگیری عمیق برای تبدیل فیلمهای حسگری خام خودروهای خودران و رباتها به مجموعه دادههای ساختاریافته و قابل جستجو استفاده میکند. این شرکت مشکل مقیاسپذیری دادههای سیستمهای خودمختار را حل میکند — جایی که حجم عظیمی از فیلمها در میدان تولید میشوند اما بدون برچسبزنی دستی پرهزینه از نظر عملیاتی قابل استفاده نیستند.
یک خودروی خودران روزانه چقدر داده تولید میکند؟
یک خودروی خودران معمولاً بسته به پیکربندی دوربین، LiDAR و رادار خود روزانه بین ۱ تا ۴۰ ترابایت داده حسگری خام تولید میکند. یک ناوگان ده خودرویی میتواند هفتگی صدها ترابایت داده انباشته کند و پردازش دستی را در مقیاس بزرگ از نظر اقتصادی غیرممکن سازد.
رویکرد یادگیری عمیق نومادیک چه تفاوتی با برچسبزنی دستی دارد؟
برچسبزنی دستی بین ۰٫۰۵ تا ۰٫۵۰ دلار به ازای هر فریم هزینه دارد و آن را در مقیاس ناوگان بسیار پرهزینه میکند. نومادیک مدلهای یادگیری عمیق را برای برچسبزنی و نمایهسازی خودکار فیلمها اعمال میکند و مهندسان را قادر میسازد بدون نیاز به بررسی دستی فریمبهفریم در مجموعه دادههای بزرگ جستجو کنند — به طور قابل توجهی هزینه برچسبزنی و زمان دستیابی به بینش را کاهش میدهد.
آیا مشکل گلوگاه داده رباتهای فراتر از خودروهای خودران را نیز تحت تأثیر قرار میدهد؟
بله. هر سیستم هوش مصنوعی مجسمی — AMRهای انبار، رباتهای بازرسی، اتوماسیون کشاورزی، پلتفرمهای انساننما — دادههای حسگری پیوستهای تولید میکند که با همان چالشهای ساختاریابی و بازیابی روبرو است. این مشکل صرفنظر از کاربرد خاص رباتیک با اندازه ناوگان و ساعات عملیاتی مقیاس میشود.
این سرمایهگذاری برای اکوسیستم گستردهتر هوش مصنوعی فیزیکی چه معنایی دارد؟
دور سرمایهگذاری اولیه ۸٫۴ میلیون دلاری نشاندهنده شناخت رو به رشد سرمایهگذاران است که لایه زیرساخت داده — نه فقط سختافزار یا مدلهای اصلی هوش مصنوعی — یک گلوگاه بحرانی در توسعه سیستمهای خودمختار است. سرمایهگذاری زیرساختی در خطوط لوله داده یک شاخص پیشرو برای برنامههای استقرار بالغ هوش مصنوعی فیزیکی است.
دادههای خروجی سیستمهای خودمختار همیشه عظیم بوده است. قطعه گمشده زیرساختی برای تبدیل آن به سیگنال قابل استفاده بوده است. رویکرد نومادیک — اعمال یادگیری عمیق به عنوان یک لایه ساختاریابی خودکار — محدودیتی را برطرف میکند که هر سازمان استقراردهنده ربات یا خودرو در مقیاس را تحت تأثیر قرار میدهد. سرمایهگذاری اولیه مشکل را یکشبه حل نمیکند، اما یک شرط جهتگیری واضح را نشان میدهد که لایه داده جایی است که لبه رقابتی بعدی در هوش مصنوعی فیزیکی ساخته میشود.
آیا زیرساخت خط لوله داده گلوگاهی است که بهبود ناوگان رباتیک شما را محدود میکند — یا هنوز سختافزار محدودیت است؟










به بحث بپیوندید
Is data pipeline infrastructure the bottleneck limiting your robot fleet — or is hardware still the constraint?