Nomadic huy động 8,4 triệu USD để giải quyết cuộc khủng hoảng dữ liệu ẩn của xe tự hành (2026)

Xe tự hành và robot tạo ra nhiều dữ liệu cảm biến hơn hầu hết các tổ chức có thể sử dụng. Nomadic đã huy động được 8,4 triệu USD vốn hạt giống để khắc phục điều đó — xây dựng một lớp hạ tầng chuyển đổi cảnh quay thô từ AV và robot thành các tập dữ liệu có cấu trúc, có thể tìm kiếm được bằng deep learning, giải quyết một nút thắt thầm lặng đang hạn chế tốc độ phát triển của các hệ thống tự hành trong toàn ngành.

Mục lục

Nomadic thực sự làm gì?
Tại sao dữ liệu AV và robot lại khó quản lý đến vậy?
Phương pháp deep learning của Nomadic hoạt động như thế nào?
Điều này có ý nghĩa gì đối với robot và tự động hóa?
Câu hỏi thường gặp

Nomadic thực sự làm gì?

Nomadic đang xây dựng một nền tảng hạ tầng dữ liệu biến cảnh quay video và cảm biến thô từ xe tự hành và robot thành các tập dữ liệu có cấu trúc, có thể truy vấn. Thay vì để cảnh quay thô nằm trong kho lưu trữ — tốn kém để giữ và gần như không thể tìm kiếm — hệ thống của Nomadic sử dụng các mô hình deep learning để gắn thẻ, phân loại và lập chỉ mục dữ liệu đó để các kỹ sư có thể thực sự tìm thấy thứ họ cần.

Theo TechCrunch, vòng hạt giống 8,4 triệu USD đặt Nomadic vào vị trí hạ tầng cho ngăn xếp Physical AI rộng hơn — không chỉ cho các chương trình AV, mà còn cho bất kỳ hệ thống robot nào tạo ra luồng cảm biến liên tục cần được chuyển thành tín hiệu huấn luyện.

Hãy nghĩ về nó như sự khác biệt giữa một kho hàng đầy những hộp không nhãn và một hệ thống kiểm kê được lập chỉ mục đầy đủ. Cảnh quay tồn tại trong cả hai trường hợp, nhưng chỉ một phiên bản là hữu ích về mặt vận hành. Sự tương tự đó có thể không hoàn hảo khi mở rộng quy mô — vấn đề với dữ liệu AV không chỉ là gắn nhãn, mà còn là khối lượng cực lớn kết hợp với chi phí chú thích thủ công và sự thưa thớt của các trường hợp biên an toàn quan trọng bị chôn vùi trong hàng giờ cảnh quay thông thường.

Tại sao dữ liệu AV và robot lại khó quản lý đến vậy?

Một xe tự hành duy nhất có thể tạo ra từ 1 đến 40 terabyte dữ liệu cảm biến thô mỗi ngày, tùy thuộc vào bộ cảm biến — camera, LiDAR, radar, IMU. Một đội xe nhỏ gồm mười chiếc hoạt động liên tục tạo ra nhiều dữ liệu hơn mỗi tuần so với hầu hết các đường ống dữ liệu doanh nghiệp được thiết kế để xử lý.

Vấn đề càng trầm trọng hơn theo hai hướng. Thứ nhất, chi phí lưu trữ tăng nhanh khi dữ liệu ở quy mô petabyte phải được giữ lại để huấn luyện mô hình, kiểm tra an toàn và xem xét quy định. Thứ hai, và quan trọng hơn, hầu hết dữ liệu đó là trơ về mặt vận hành — không thể truy vấn, lọc hoặc khai thác mà không có nỗ lực gắn nhãn thủ công đáng kể.

Đối với các nhóm robot nói riêng, điều này tạo ra một vòng phản hồi đau đớn:

Triển khai robot tại hiện trường
Thu thập khối lượng dữ liệu cảm biến khổng lồ
Vật lộn để trích xuất các kịch bản thất bại cụ thể, các trường hợp biên hoặc sự kiện theo miền cần thiết để cải thiện mô hình
Vòng lặp huấn luyện chậm lại
Hiệu suất triển khai đình trệ

Quy trình chú thích thủ công — giải pháp truyền thống — không mở rộng được về mặt kinh tế. Chi phí gắn nhãn cho các tập dữ liệu xe tự hành trong lịch sử dao động từ 0,05 đến 0,50 USD mỗi khung hình, và một giờ video ở 30 khung hình/giây chứa 108.000 khung hình. Kinh tế học này thực sự không khuyến khích các nhóm tận dụng toàn bộ lượng dữ liệu xả ra từ đội xe của họ.

Phương pháp deep learning của Nomadic hoạt động như thế nào?

Hệ thống cốt lõi của Nomadic áp dụng các mô hình deep learning vào cảnh quay thô để tự động trích xuất cấu trúc ngữ nghĩa từ các luồng cảm biến. Thay vì yêu cầu các kỹ sư phải gắn nhãn thủ công cảnh quay trước khi nó có thể tìm kiếm được, nền tảng sẽ suy luận điều gì đang xảy ra trong một cảnh, gắn thẻ sự kiện và đối tượng, và tổ chức đầu ra thành dạng có thể truy vấn.

Ý nghĩa thực tế rất đáng kể: các nhóm robot và AV có thể đưa ra các truy vấn bằng ngôn ngữ tự nhiên hoặc có cấu trúc — "hiển thị tất cả các trường hợp xe tiếp cận người đi bộ ở khoảng cách dưới 2 mét trong điều kiện mưa" — và lấy ra các clip liên quan từ hàng triệu giờ cảnh quay mà không cần xem xét thủ công.

Cách tiếp cận này tương tự như những gì cơ sở dữ liệu vector hiện đại làm cho văn bản phi cấu trúc, nhưng được áp dụng cho dữ liệu cảm biến đa phương thức bao gồm video, đám mây điểm và luồng IMU. Mô hình deep learning hoạt động như một lớp chú thích tự động, giảm đáng kể chi phí cho mỗi ví dụ được gắn nhãn đồng thời tăng mật độ tín hiệu có thể trích xuất từ dữ liệu hiện có.

Nomadic so với các phương pháp đường ống dữ liệu truyền thống

Phương pháp	Chi phí chú thích	Tốc độ truy vấn	Khả năng mở rộng	Nhớ lại trường hợp biên
Gắn nhãn thủ công	Cao (0,05–0,50 USD/khung)	Chậm	Kém	Phụ thuộc vào người đánh giá
Gắn thẻ tự động dựa trên quy tắc	Thấp	Nhanh	Trung bình	Bỏ lỡ sự kiện mới
Deep learning của Nomadic	Thấp–Trung bình	Nhanh	Cao	Mạnh đối với các danh mục đã huấn luyện
Không có đường ống (lưu trữ thô)	Không	Không	Cao (chi phí)	Không

Lưu ý quan trọng: chú thích dựa trên deep learning kế thừa mọi điểm mù tồn tại trong phân phối huấn luyện của mô hình. Đối với các trường hợp biên an toàn quan trọng hiếm gặp — chính xác là những sự kiện có giá trị nhất cho huấn luyện — một mô hình chưa thấy đủ ví dụ có thể vẫn không thể lấy ra chúng một cách đáng tin cậy. Đề xuất giá trị dài hạn của Nomadic có thể phụ thuộc vào mức độ tổng quát hóa của các mô hình của họ trên nhiều loại robot và xe triển khai khác nhau.

Điều này có ý nghĩa gì đối với robot và tự động hóa

Nút thắt dữ liệu mà Nomadic đang tấn công không chỉ riêng gì xe tự hành. Đó cũng chính là vấn đề mà các AMR (robot di động tự động) trong kho, robot kiểm tra công nghiệp, hệ thống tự động hóa nông nghiệp và các chương trình robot hình người phải đối mặt — bất kỳ hệ thống AI nhập thể nào tạo ra dữ liệu tri giác liên tục trong thế giới thực.

Đối với các đội vận hành hoặc mua sắm đội robot, điều này có ý nghĩa theo hai cách cụ thể.

Tốc độ huấn luyện: Tốc độ cải thiện của một hệ thống robot bị ràng buộc trực tiếp bởi tốc độ mà các đội có thể trích xuất tín hiệu huấn luyện có ý nghĩa từ dữ liệu triển khai. Hạ tầng tăng tốc vòng lặp đó — thậm chí chỉ 2–3 lần — sẽ nén khoảng thời gian cải thiện tương ứng.

Trí thông minh đội xe ở quy mô lớn: Khi đội robot phát triển, giá trị vận hành của dữ liệu cảm biến đó mở rộng ra ngoài huấn luyện mô hình. Dữ liệu có cấu trúc mở khóa phát hiện bất thường, tín hiệu bảo trì dự đoán và đo điểm chuẩn hiệu suất giữa các đơn vị — biến chính đội robot thành một hệ thống tự ghi chép liên tục.

Đối với các nhà vận hành đang xem xét triển khai robot đã qua sử dụng hoặc tân trang — nơi cấu hình cảm biến có thể khác nhau và các tập dữ liệu có sẵn ít được quản lý hơn — các nền tảng như Nomadic trở nên đặc biệt phù hợp. Việc đưa dữ liệu hiện trường từ robot công nghiệp đã qua sử dụng trở lại các đường ống huấn luyện có cấu trúc trước đây là một quá trình thủ công và tốn kém. Hạ tầng cấu trúc tự động thay đổi cách tính đó.

Con số hạt giống 8,4 triệu USD cũng cho thấy nơi đầu tư hạ tầng đang chảy vào trong ngăn xếp Physical AI. Phần cứng — chính robot — thu hút sự chú ý. Nhưng lớp dữ liệu giữa triển khai và cải thiện mô hình ngày càng là nơi lợi thế cạnh tranh được xây dựng và nơi vốn bắt đầu tập trung.

Các nhà vận hành đang đánh giá cobot đã qua sử dụng để bán hoặc xây dựng các chương trình tự động hóa quy mô nhỏ nên tính chi phí đường ống dữ liệu vào tổng chi phí triển khai — một câu hỏi mà Nomadic đang trực tiếp định vị để trả lời.

Câu hỏi thường gặp

Nomadic là một công ty hạ tầng dữ liệu sử dụng deep learning để chuyển đổi cảnh quay cảm biến thô từ xe tự hành và robot thành các tập dữ liệu có cấu trúc, có thể tìm kiếm. Nó giải quyết vấn đề mở rộng của dữ liệu hệ thống tự hành — nơi khối lượng lớn cảnh quay được tạo ra tại hiện trường nhưng vẫn không thể sử dụng về mặt vận hành nếu không có chú thích thủ công tốn kém.

Một xe tự hành tạo ra bao nhiêu dữ liệu mỗi ngày?

Một xe tự hành điển hình thường tạo ra từ 1 đến 40 terabyte dữ liệu cảm biến thô mỗi ngày, tùy thuộc vào cấu hình camera, LiDAR và radar. Một đội gồm mười xe có thể tích lũy hàng trăm terabyte hàng tuần, làm cho xử lý thủ công trở nên không khả thi về mặt kinh tế ở quy mô lớn.

Phương pháp deep learning của Nomadic khác với gắn nhãn thủ công như thế nào?

Gắn nhãn thủ công có chi phí từ 0,05 đến 0,50 USD mỗi khung hình, khiến nó trở nên đắt đỏ không thể chấp nhận ở quy mô đội xe. Nomadic áp dụng các mô hình deep learning để tự động gắn thẻ và lập chỉ mục cảnh quay, cho phép các kỹ sư truy vấn qua các tập dữ liệu lớn mà không cần xem xét thủ công từng khung hình — giảm đáng kể chi phí chú thích và thời gian đến thông tin chi tiết.

Vấn đề nút thắt dữ liệu có ảnh hưởng đến robot ngoài xe tự hành không?

Có. Bất kỳ hệ thống AI nhập thể nào — AMR trong kho, robot kiểm tra, tự động hóa nông nghiệp, nền tảng hình người — đều tạo ra dữ liệu cảm biến liên tục đối diện với cùng thách thức cấu trúc và truy xuất. Vấn đề mở rộng theo quy mô đội xe và giờ hoạt động bất kể ứng dụng robot cụ thể nào.

Khoản tài trợ này có ý nghĩa gì đối với hệ sinh thái Physical AI rộng hơn?

Vòng hạt giống 8,4 triệu USD báo hiệu sự công nhận ngày càng tăng của nhà đầu tư rằng lớp hạ tầng dữ liệu — không chỉ phần cứng hay mô hình AI cốt lõi — là một nút thắt quan trọng trong phát triển hệ thống tự hành. Đầu tư hạ tầng vào đường ống dữ liệu là một chỉ báo hàng đầu của các chương trình triển khai Physical AI đang trưởng thành.

Lượng dữ liệu xả ra từ các hệ thống tự hành luôn rất lớn. Mảnh ghép còn thiếu là hạ tầng để biến nó thành tín hiệu có thể sử dụng. Cách tiếp cận của Nomadic — áp dụng deep learning như một lớp cấu trúc tự động — giải quyết một ràng buộc ảnh hưởng đến mọi tổ chức triển khai robot hoặc xe ở quy mô lớn. Khoản tài trợ hạt giống sẽ không giải quyết vấn đề qua đêm, nhưng nó đánh dấu một cược hướng đi rõ ràng rằng lớp dữ liệu là nơi lợi thế cạnh tranh tiếp theo trong Physical AI được xây dựng.

Hạ tầng đường ống dữ liệu có phải là nút thắt hạn chế sự cải thiện của đội robot của bạn — hay phần cứng vẫn là ràng buộc?

Nomadic huy động 8,4 triệu USD để giải quyết cuộc khủng hoảng dữ liệu ẩn của xe tự hành