MIT تبتكر ذكاءً اصطناعياً يرى عبر الجدران لحل مشكلة إدراك روبوتات المستودعات (2026)

استخدم باحثو MIT الذكاء الاصطناعي التوليدي لإعادة بناء الأجسام ثلاثية الأبعاد المخفية من انعكاسات الإشارات اللاسلكية، مما مكّن الروبوتات من الرؤية عبر الجدران والصناديق والتغليف. بإذن من الباحثين.

تعاني الروبوتات العاملة في المستودعات والمنازل الذكية من نقطة عمياء أساسية: أي شيء تحجبه الكاميرات ببساطة غير موجود بالنسبة لها. الآن، وظف باحثو MIT الذكاء الاصطناعي التوليدي لإصلاح ذلك، باستخدام إشارات لاسلكية بموجات مليمترية ونماذج ذكاء اصطناعي مدربة خصيصًا لإعادة بناء الأجسام المخفية والغرف بأكملها بدقة تفوق الطرق السابقة بنسبة تقارب 20% — دون استخدام كاميرا واحدة.

لماذا تعاني رؤية الروبوتات المعتمدة على الكاميرات من ضعف هيكلي
كيف يعيد Wave-Former بناء الأجسام المخفية عبر الجدران
RISE: رسم خرائط لغرف كاملة من رادار واحد
مشكلة بيانات التدريب — وكيف حلها MIT
ما يعنيه هذا لروبوتات المستودعات والروبوتات الصناعية
أسئلة شائعة

لماذا تعاني رؤية الروبوتات المعتمدة على الكاميرات من ضعف هيكلي

يفشل الإدراك المعتمد على الكاميرات في الروبوتات بمجرد أن يخرج جسم عن خط الرؤية — خلف العبوة، تحت الحطام، أو حول الزاوية. هذه ليست حالة نادرة؛ بل هي واقع تشغيلي يومي في المستودعات ومراكز الخدمات اللوجستية والبيئات المنزلية حيث تحتاج الروبوتات إلى تحديد موقع وتحديد هوية وقبض أجسام لا تستطيع رؤيتها مباشرة.

الحلول البديلة الحالية — كاميرات متعددة، الضوء المهيكل، LiDAR — جميعها تشترك في نفس القيد: فهي تتطلب مسارًا بصريًا واضحًا. بمجرد دخول الورق المقوى، الحوائط الجافة، البلاستيك، أو حتى القماش الكثيف في المعادلة، يصبح الروبوت أعمى فعليًا. يؤدي هذا القيد إلى أخطاء مكلفة في عمليات التنفيذ، بما في ذلك التعرف الخاطئ على العناصر المعبأة وفشل القبض الذي يوقف خطوط الإنتاج.

قضت مجموعة Signal Kinetics في MIT بقيادة الأستاذ المشارك فاضل عديب أكثر من عقد في بناء بدائل باستخدام إشارات رادار الموجات المليمترية (mmWave) — نفس نطاق التردد المستخدم في Wi-Fi الحديث — والتي تخترق العوائق الشائعة وتنعكس عن الأجسام المخفية. كان التحدي، حتى الآن، أن هذه الانعكاسات كانت غير مكتملة للغاية لتكون مفيدة في المناولة الدقيقة.

كيف يعيد Wave-Former بناء الأجسام المخفية عبر الجدران

يجمع Wave-Former، النظام الجديد من MIT، بين رادار mmWave ونموذج ذكاء اصطناعي توليدي لإعادة بناء الشكل ثلاثي الأبعاد الكامل للأجسام المخفية خلف العوائق — محققًا تحسنًا في الدقة يقارب 20% مقارنة بأفضل الطرق السابقة عبر حوالي 70 جسمًا يوميًا بما في ذلك العلب والصناديق والأواني والفواكه.

المشكلة الفيزيائية الأساسية هي الانعكاس المرآوي (specularity): إشارات mmWave تنعكس عن الأسطح في اتجاه واحد، مثل الضوء عن المرآة. مستشعر الرادار يلتقط فقط الانعكاسات الموجهة إليه، مما يعني أن السطح العلوي للجسم الخفي يكون مرئيًا جزئيًا بينما جوانبه وسفله غير مرئية فعليًا. حاولت الأنظمة السابقة تفسير هذه السحب النقطية غير المكتملة باستخدام قواعد فيزيائية فقط — وهو نهج محدود جوهريًا.

تعمل خط أنابيب Wave-Former على ثلاث مراحل. أولاً، يبني إعادة بناء جزئية للجسم الخفي من انعكاسات mmWave الخام. ثانيًا، يُغذي هذا الشكل الجزئي إلى نموذج ذكاء اصطناعي توليدي مُدرَّب على التنبؤ بالإكمالات المعقولة. ثالثًا، يُحسِّن السطح بشكل متكرر حتى يتقارب إلى إعادة بناء كامل ثلاثي الأبعاد. النتيجة: لا تستطيع الروبوتات اكتشاف الجسم الخفي فحسب، بل تفهم هندسته بشكل كافٍ لتخطيط قبضة موثوقة.

وفقًا لتغطية Robohub للبحث، تم التحقق من صحة النظام عبر أجسام مخفية خلف أو تحت الورق المقوى والخشب والحوائط الجافة والبلاستيك والقماش — وهي المواد نفسها الموجودة في بيئات المستودعات والخدمات اللوجستية الحقيقية.

RISE: رسم خرائط لغرف كاملة من رادار واحد

النظام الثاني من MIT، RISE (فهم المشاهد الداخلية بالرادار)، يعيد بناء تخطيطات الغرف بالكامل — بما في ذلك وضع الأثاث — باستخدام انعكاسات من رادار mmWave واحد ثابت. يحقق دقة مكانية تعادل تقريبًا ضعف دقة التقنيات الحالية ولا يتطلب منصة استشعار متحركة.

تتطلب معظم الأساليب الحالية لإعادة بناء المشاهد اللاسلكية رادارًا مثبتًا على روبوت متحرك لمسح البيئة — وهو قيد تشغيلي كبير. يتبع RISE نهجًا مختلفًا: فهو يستغل الانعكاسات متعددة المسارات الناتجة عن حركة البشر بشكل طبيعي في الغرفة.

عندما يتحرك شخص، ترتد إشارات mmWave عنه، ثم تنعكس مرة أخرى عن الجدران والأثاث قبل العودة إلى الرادار. هذه الصدى الثانوي — الذي يُتخلص منه عادةً كضوضاء تحت تسمية "إشارات شبحية" — في الواقع يرمّز معلومات مكانية عن تخطيط الغرفة. مع تحرك الشخص، تتغير الإشارات الشبحية، وتكشف مواقعها المتغيرة عن هندسة الأسطح المحيطة.

يعيد نظام RISE بناء المشاهد الداخلية بالكامل من خلال استغلال انعكاسات الإشارات اللاسلكية عن البشر المتحركين في الغرفة. بإذن من الباحثين.

تم التحقق من صحة RISE على أكثر من 100 مسار بشري تم التقاطها بواسطة رادار ثابت واحد. الجانب المتعلق بالخصوصية ملحوظ أيضًا: على عكس أنظمة الكاميرات، لا يلتقط رادار mmWave صورًا مرئية للأفراد، مما يجعله قابلاً للنشر في البيئات التي تواجه فيها الكاميرات عوائق تنظيمية أو تتعلق بالموافقة.

مشكلة بيانات التدريب — وكيف حلها MIT

العائق الأساسي لأي نموذج ذكاء اصطناعي في هذا المجال هو ندرة البيانات: لا توجد مجموعة بيانات mmWave كبيرة بما يكفي لتدريب نموذج توليدي من الصفر. كان حل MIT هو محاكاة فيزياء mmWave فوق مجموعات بيانات رؤية حاسوبية كبيرة الحجم — أي تعليم الذكاء الاصطناعي لغة الرادار دون الحاجة إلى بيانات تدريب خاصة بالرادار.

يتطلب تدريب النماذج التوليدية الكبيرة مثل GPT أو Claude مجموعات بيانات بملايين أو مليارات الأمثلة. مجموعات بيانات أبحاث mmWave أصغر بعدة مراتب. جمع بيانات رادار كافية من العالم الحقيقي كان سيستغرق، كما يوضح مساعد البحث في MIT Maisy Lam، "سنوات".

كان الحل البديل للفريق هو التكيف الاصطناعي: أخذوا مجموعات بيانات رؤية حاسوبية كبيرة قائمة وفرضوا حسابياً الخصائص الفيزيائية لانعكاسات mmWave — الانعكاس المرآوي، خصائص الضوضاء، هندسة الإشارة — على بيانات الصور. أنشأ هذا مجموعة تدريب اصطناعية لكنها دقيقة فيزيائيًا يمكن للنموذج التوليدي التعلم منها.

يمثل هذا النهج نمطًا أوسع ناشئًا في أبحاث الذكاء الاصطناعي الفيزيائي: استخدام المحاكاة المستنيرة فيزيائيًا لبدء تدريب الذكاء الاصطناعي حيث تكون البيانات الحقيقية نادرة أو مكلفة في جمعها. نفس المبدأ يكمن وراء الكثير من التقدم في تعلم المناولة الآلية، حيث أصبح النقل من المحاكاة إلى الواقع نموذجًا مهيمنًا.

النظام	المهمة	مصدر الإشارة	تحسين الدقة	تكوين المستشعر
Wave-Former	إعادة بناء ثلاثي الأبعاد للأجسام المخفية	انعكاسات mmWave عن الأجسام	~20% أفضل من أحدث الطرق	رادار متحرك أو ثابت
RISE	إعادة بناء مشهد غرفة كامل	انعكاسات mmWave عن البشر المتحركين	~ضعف دقة أحدث الطرق	رادار ثابت واحد

ما يعنيه هذا لروبوتات المستودعات والروبوتات الصناعية

بالنسبة لمشتري ومهندسي الروبوتات، يعالج هذان النظامان مشكلتين تشغيليتين مختلفتين ولكن بنفس القدر من الإلحاح: التحقق من العناصر المعبأة في حاويات مختومة، وتمكين الروبوتات من فهم البيئات الديناميكية دون تغطية استشعار كاملة.

التنفيذ والتحقق من العبوة

لا تستطيع روبوتات المستودعات حاليًا تأكيد ما بداخل صندوق مختوم دون فتحه. قدرة Wave-Former على إعادة بناء هندسة الأجسام ثلاثية الأبعاد عبر الورق المقوى والبلاستيك تعالج التحقق قبل الشحن مباشرة — وهي نقطة ألم كبيرة في تنفيذ التجارة الإلكترونية، حيث تولد معدلات الإرجاع من الطلبات الخاطئة تكاليف كبيرة. روبوت مزود بإدراك mmWave يمكنه التحقق من وجود العنصر وهندسته التقريبية قبل إغلاق الصندوق، دون إبطاء الخط.

النشر الذكي للروبوتات التعاونية والمركبات الذاتية الحركة

قدرة RISE على رسم خرائط الغرفة باستخدام رادار واحد لها مضامين فورية على المركبات الذاتية الحركة (AMRs) والروبوتات التعاونية المنشورة في مساحات مشتركة مع البشر. تتطلب الأساليب الحالية لتتبع البشر إما تغطية كاميرات كثيفة (مع مخاوف الخصوصية المرتبطة) أو أجهزة استشعار مثبتة على الروبوت المتحرك نفسه. ردار ثابت يبني نموذجًا مكانيًا حيًا للغرفة — بما في ذلك مواقع البشر — من تحليل الإشارات الشبحية يمكن أن يتيح تشغيل روبوتات تعاونية أكثر أمانًا واستجابة في البيئات الديناميكية.

بالنسبة للفرق التي تقيم الروبوتات لهذه التطبيقات، من الجدير استكشاف الروبوتات الصناعية المستعملة و الروبوتات التعاونية المتاحة حالياً على Botmarket مع متابعة تقدم أنظمة الإدراك مثل Wave-Former نحو التكامل التجاري.

الجدول الزمني للنشر

كلا النظامين في مرحلة بحثية، مع تقديم النتائج في مؤتمر IEEE حول الرؤية الحاسوبية والتعرف على الأنماط. البحث مدعوم من NSF ومختبر MIT Media وAmazon — حيث أن الأخير إشارة مهمة على الاهتمام التجاري. الهدف التالي المعلن للفريق هو بناء نماذج أساسية للإشارات اللاسلكية، مماثلة لـ GPT أو Gemini للغة، والتي ستمثل تغييرًا جذريًا في قابلية تعميم هذا النهج عبر البيئات وأنواع الأجسام.

أسئلة شائعة

ما هو Wave-Former وكيف يعمل؟

Wave-Former هو نظام طورته MIT يستخدم إشارات رادار الموجات المليمترية (mmWave) لإعادة بناء الشكل ثلاثي الأبعاد للأجسام المخفية خلف عوائق مثل الورق المقوى والحوائط الجافة والبلاستيك. يبني إعادة بناء جزئية من انعكاسات الرادار، ثم يستخدم نموذج ذكاء اصطناعي توليدي لإكمال الهندسة المفقودة. في الاختبارات عبر حوالي 70 جسمًا يوميًا، حقق دقة أفضل بنسبة تقارب 20% مقارنة بأفضل الطرق السابقة.

كيف يعيد RISE بناء الغرف بدون كاميرات؟

يستخدم RISE رادار mmWave ثابتًا واحدًا ويستغل 'الإشارات الشبحية' — انعكاسات ثانوية ترتد من البشر المتحركين في الغرفة ثم من الأثاث والجدران المحيطة. بتتبع كيف تتغير هذه الانعكاسات متعددة المسارات مع تحرك الشخص، يستنتج نموذج ذكاء اصطناعي توليدي التخطيط المكاني للغرفة بأكملها. أظهر RISE دقة مكانية تعادل تقريبًا ضعف دقة تقنيات إعادة بناء المشاهد اللاسلكية الحالية عبر أكثر من 100 مسار اختبار.

ما هي العوائق التي يمكن لإشارات mmWave اختراقها؟

الإشارات المليمترية — نفس نطاق التردد المستخدم في Wi-Fi — تخترق المواد غير المعدنية الشائعة بما في ذلك الورق المقوى والخشب والحوائط الجافة والبلاستيك والقماش. لا تخترق المعدن بشكل فعال. هذا يجعلها مناسبة لبيئات المستودعات حيث تُعبأ البضائع في الورق المقوى والبلاستيك، ولكن أقل قابلية للتطبيق في العبوات الصناعية شديدة التمعدن.

هل تحافظ هذه التقنية على الخصوصية أفضل من الكاميرات؟

نعم. رادار mmWave لا يلتقط صورًا مرئية للأشخاص في البيئة — فهو يكتشف فقط انعكاسات الإشارة. قدرة RISE على رسم خرائط الغرفة تستخدم حركة البشر كمصدر إشارة دون تسجيل أي بيانات بصرية قابلة للتحديد، مما يعطيها ميزة مهمة على رسم الخرائط المكانية المعتمدة على الكاميرات في النشر الحساس للخصوصية مثل المستشفيات أو المنازل أو أماكن العمل المنظمة.

متى ستكون هذه التقنية متاحة في الروبوتات التجارية؟

كلا من Wave-Former وRISE حاليًا في مرحلة بحثية، مع تقديم أوراق بحثية في CVPR. Amazon من بين الشركاء الممولين، مما يشير إلى اهتمام تجاري نشط. أشار فريق MIT إلى أن بناء نماذج أساسية للإشارات اللاسلكية هي أولوية التطوير التالية. التكامل التجاري في أنظمة المستودعات أو الروبوتات التعاونية قد يكون على بعد سنوات، لكن المسار نحو الأجهزة القابلة للنشر واضح.

يمثل هذا البحث واحدًا من أكثر التقدمات العملية في إدراك الروبوتات خلال العام الماضي — ليس تحسنًا هامشيًا في المعايير، بل تحولًا معماريًا حقيقيًا في كيفية نمذجة الروبوتات للعالم من حولها. لم يعد الذكاء الاصطناعي التوليدي مجرد أداة لغة أو صورة؛ بل أصبح محرك الاستدلال الذي يسمح للأنظمة المادية بالتفكير فيما لا يمكنها ملاحظته مباشرة.

هل يمكن لنظام إدراك الغرفة برادار واحد أن يغير طريقة نشرك للروبوتات التعاونية أو المركبات الذاتية الحركة في منشأتك؟