Investor mengucurkan $6.1 miliar ke robot humanoid dalam satu tahun terakhir — empat kali lipat total tahun sebelumnya. Lonjakan modal itu bukan berasal dari motor yang lebih baik atau aktuator yang lebih murah. Melainkan dari terobosan fundamental dalam cara robot belajar, yang perlahan terbangun sejak 2015 dan kini telah menjadikan robot fiksi-ilmiah sebagai target rekayasa yang masuk akal.
- Mengapa Pembelajaran Robot Mengubah Segalanya Setelah 2015
- Dari Aturan ke Penguatan: Era Simulasi
- Bagaimana Model Fondasi Memberi Robot Akal Sehat
- Batas yang Masih Menahan Industri
- Apa Artinya bagi Pembeli Robotika dan Pasar Perangkat Keras
- Pertanyaan yang Sering Diajukan
Mengapa Pembelajaran Robot Mengubah Segalanya Setelah 2015
Untuk sebagian besar sejarah robotika, kecerdasan berarti aturan — ribuan instruksi buatan tangan yang ditulis oleh insinyur untuk mencakup setiap situasi yang dapat diperkirakan. Lengan robot yang melipat pakaian memerlukan logika eksplisit untuk orientasi lengan, kekakuan kain, deteksi kerah, dan puluhan kasus tepi. Kumpulan aturan itu meledak dalam kompleksitas sebelum akhirnya menjadi andal.
Pendekatan itu menghasilkan robot industri yang dapat diandalkan untuk lingkungan terstruktur — jalur pengelasan, sel pick-and-place, sistem konveyor — tetapi tidak bisa digeneralisasi. Pindahkan lengan yang sama ke konteks berbeda, ubah pencahayaan, perkenalkan bentuk objek baru, dan performa langsung runtuh.
Kesenjangan antara apa yang bisa dilakukan robot dan apa yang diimpikan para peneliti tetap lebar. Kemudian, sekitar tahun 2015, metodologinya bergeser.
Menurut pendalaman MIT Technology Review tentang sejarah kontemporer pembelajaran robot, perubahan pentingnya adalah beralih dari pengkodean aturan ke trial and error berbasis data — dan kemudian, setelah 2022, ke model fondasi AI yang belajar dari data berskala internet, bukan hanya simulasi buatan tangan.
Dari Aturan ke Penguatan: Era Simulasi
Sekitar tahun 2015, laboratorium robotika terkemuka mulai mengganti aturan buatan tangan dengan pembelajaran penguatan (RL) — metode pelatihan di mana agen AI menerima sinyal hadiah untuk tindakan sukses dan sinyal penalti untuk kegagalan, lalu melakukan jutaan iterasi untuk menemukan strateginya sendiri.
Proyek Dactyl milik OpenAI, tangan robot berjari lima yang dilatih sepenuhnya dalam simulasi, menunjukkan baik kekuatan maupun keterbatasan utama pendekatan ini. Dactyl belajar memanipulasi kubus kecil dengan berlatih di dalam lingkungan digital — pada dasarnya mesin fisika virtual — sebelum digunakan pada perangkat keras nyata. Masalahnya: bahkan perbedaan kecil antara dunia simulasi dan realitas fisik menyebabkan performa menurun drastis.
Solusi rekayasanya adalah randomisasi domain — sengaja memperkenalkan variasi acak di jutaan lingkungan pelatihan simulasi. Koefisien gesekan, kondisi pencahayaan, warna objek, dan tekstur permukaan semuanya divariasikan secara acak sehingga kebijakan yang terlatih cukup kokoh untuk menangani kekacauan dunia nyata. Teknik ini bekerja cukup baik sehingga Dactyl akhirnya bisa memecahkan Kubus Rubik — meskipun hanya 60% dari waktu pada acak standar, turun menjadi 20% pada konfigurasi yang lebih sulit.
Angka-angka itu penting untuk memahami di mana bidang ini berdiri saat itu. RL yang dilatih simulasi menghasilkan ketangkasan yang benar-benar mengesankan, tetapi keandalannya tidak mencukupi untuk penerapan komersial. OpenAI menutup divisi robotikanya pada tahun 2021, mencerminkan langit-langit yang telah dicapai teknik ini.
Kesenjangan Simulasi-ke-Nyata: Tantangan Teknis Utama
| Tantangan | Deskripsi | Mitigasi yang Digunakan |
|---|---|---|
| Ketidakcocokan visual | Warna dan tekstur berbeda dari simulasi | Randomisasi domain |
| Sifat fisik | Gesekan, deformasi tidak dimodelkan sempurna | Parameter fisika diacak |
| Kebisingan sensor | Sensor nyata memperkenalkan latensi dan kesalahan | Injeksi kebisingan dalam pelatihan |
| Keausan mekanis | Aktuator menurun seiring waktu | Tidak diselesaikan oleh sim-ke-nyata saja |
Bagaimana Model Fondasi Memberi Robot Akal Sehat
Kedatangan model bahasa besar mengubah robotika lebih dalam daripada kemajuan perangkat keras mana pun dalam dekade terakhir. Wawasan utamanya bersifat arsitektural: LLM belajar dengan memprediksi token (kata, sub-kata, atau karakter) apa yang akan muncul berikutnya dalam suatu urutan, menyerap korpora teks raksasa untuk membangun representasi internal bahasa dan pengetahuan dunia yang kaya. Para robotikawan mengajukan pertanyaan yang jelas namun transformatif — dapatkah arsitektur yang sama bekerja jika tokennya adalah pembacaan sensor, bingkai kamera, dan posisi sendi, bukan kata?
Jawaban Google DeepMind adalah RT-1 dan penerusnya RT-2 (Robotic Transformer). RT-1 dilatih pada 17 bulan data teleoperasi yang mencakup 700 tugas berbeda, menerima tampilan kamera robot dan status sendi lengan sebagai masukan dan menghasilkan perintah motor sebagai keluaran. Pada tugas yang telah dilihat selama pelatihan, ia mencapai 97% keberhasilan. Pada instruksi yang sepenuhnya baru, ia masih mencapai 76% — peningkatan dramatis dibanding apa pun yang dicapai pendekatan simulasi saja.
RT-2 melangkah lebih jauh dengan menggabungkan data gambar dan teks berskala internet, memberi robot suatu bentuk akal sehat yang berakar pada dunia visual yang lebih luas, bukan hanya laboratorium robotika. Ini adalah lompatan konseptual utama: alih-alih memprogram robot dengan aturan, atau melatih mereka hanya pada data khusus robot, para peneliti menemukan bahwa pengetahuan dunia umum — jenis yang tertanam dalam model visi-bahasa selama prapelatihan skala web — ditransfer secara mengejutkan baik ke tugas manipulasi fisik.
Implikasi praktisnya signifikan. Robot yang telah melihat jutaan gambar dapur, laci, dan cangkir selama prapelatihan tiba dengan pemahaman kontekstual yang tidak akan pernah bisa diperoleh sistem berbasis aturan. Ia tidak yakin cangkir mana yang diinginkan manusia, tetapi ia memiliki prior yang masuk akal. Prior itu secara dramatis mengurangi jumlah data pelatihan khusus robot yang diperlukan untuk mencapai tingkat performa yang berguna.
Batas yang Masih Menahan Industri
Kegembiraan saat ini nyata, tetapi perlu dipetakan apa yang masih belum terpecahkan. Model fondasi untuk robotika menghadapi masalah data yang tidak ada dalam bentuk yang sama untuk model bahasa. Data teks berlimpah, murah, dan mudah dikeruk dari web. Data demonstrasi robot berkualitas tinggi — beragam, berlandaskan fisik, dan diberi label akurat — mahal untuk dikumpulkan, bergantung pada perangkat keras, dan sulit ditransfer antar morfologi robot.
Robot sosial awal menggambarkan keterbatasan yang berbeda: kemampuan tanpa keandalan. Jibo, robot sosial rumah tangga buatan MIT yang mengumpulkan $3.7 juta dalam crowdfunding dan dijual seharga $749, memiliki visi yang menarik tetapi akhirnya dikhianati oleh teknologi bahasa pra-LLM pada zamannya. Percakapannya mengandalkan potongan respons skrip yang cepat terasa berulang dan dangkal. AI suara hari ini akan mengubah apa yang seharusnya bisa menjadi Jibo — tetapi generasi baru mainan bertenaga AI memperkenalkan risiko sebaliknya. Sistem skrip tidak bisa keluar jalur; sistem AI generatif benar-benar bisa, seperti yang ditunjukkan oleh kasus terdokumentasi tentang teman AI yang memberikan panduan berbahaya kepada anak-anak.
Bidang ini telah menukar satu set keterbatasan (kekakuan, kerapuhan) dengan yang lain (ketidakpastian, ketidakamanan keselamatan). Tidak ada masalah yang sepenuhnya terpecahkan. Yang berubah adalah bahwa lintasan perbaikan kini terukur lebih curam.
Apa Artinya bagi Pembeli Robotika dan Pasar Perangkat Keras
Revolusi pembelajaran AI bukan hanya cerita akademis — ia sudah membentuk kembali valuasi perangkat keras dengan cara yang penting bagi pembeli dan operator saat ini.
Robot yang kemampuannya terikat pada program asli mereka terdepresiasi dengan cepat di pasar saat ini. Lengan industri generasi kedua dengan program gerakan tetap memiliki nilai jual kembali yang menurun karena pembeli semakin mengharapkan adaptabilitas. Sementara itu, platform perangkat keras yang dirancang untuk menjalankan perangkat lunak berbasis pembelajaran — dengan komputasi yang dapat diakses, API terbuka, dan muatan sensor yang memadai — mempertahankan nilai lebih kokoh.
Bagi pembeli yang mengevaluasi pembelian hari ini, beberapa implikasi menonjol:
- Ekstensibilitas platform sama pentingnya dengan kemampuan saat ini. Cobot yang menjalankan inferensi ML modern secara lokal akan memiliki masa pakai lebih lama daripada yang terikat pada lingkungan pemrograman khusus vendor.
- Harga perangkat keras bekas mencerminkan kesiapan AI. Robot dari platform yang telah menerima pembaruan perangkat lunak berbasis pembelajaran besar-besaran mempertahankan nilai; yang ditinggalkan oleh pabrikannya mengalami diskon signifikan.
- Infrastruktur data adalah pembeda baru. Pembeli yang menggunakan beberapa unit harus merencanakan pengumpulan data teleoperasi sejak hari pertama — data demonstrasi itu menjadi korpus pelatihan untuk peningkatan performa.
Bagi operator yang mempertimbangkan penyebaran tingkat pemula, pasar robot industri bekas saat ini menawarkan akses ke perangkat keras yang mumpuni dengan biaya lebih rendah, meskipun pembeli harus mengevaluasi peta jalan pembaruan perangkat lunak dengan hati-hati. Demikian pula, kategori cobot yang berkembang sangat siap untuk mendapatkan keuntungan dari penerapan model fondasi, mengingat konteks operasi cobot yang secara inheren fleksibel dan dekat dengan manusia.
Pertanyaan yang Sering Diajukan
Pendorong utamanya adalah pematangan model fondasi AI — khususnya, penemuan bahwa model visi-bahasa yang dilatih pada data berskala internet dapat diadaptasi untuk menghasilkan perintah motor robot dengan generalisasi yang jauh lebih besar daripada pendekatan berbasis aturan atau simulasi saja sebelumnya. Investasi melonjak setelah penelitian menunjukkan bahwa model seperti RT-2 dapat melakukan tugas baru tanpa pelatihan khusus tugas, membuka jalur yang kredibel menuju robot tujuan umum. Angka terbaru menunjukkan investasi meningkat empat kali lipat tahun-ke-tahun, mencapai $6.1 miliar.
Apa itu randomisasi domain dalam robotika dan mengapa itu penting?
Randomisasi domain adalah teknik pelatihan simulasi di mana ribuan lingkungan virtual yang sedikit berbeda dihasilkan selama pelatihan — memvariasikan pencahayaan, gesekan, warna objek, dan parameter fisika secara acak. Ini mengatasi kesenjangan sim-ke-nyata (penurunan performa ketika kebijakan yang dilatih simulasi dijalankan pada perangkat keras fisik) dengan memaksa kebijakan yang dipelajari untuk menjadi kokoh di berbagai kemungkinan konfigurasi dunia. Dactyl milik OpenAI menggunakan pendekatan ini untuk memecahkan Kubus Rubik dengan tangan robot, meskipun tingkat keberhasilan mencapai puncak pada 60% untuk tingkat kesulitan standar.
Bagaimana model fondasi untuk robotika berbeda dari LLM standar?
Model bahasa besar standar memproses token teks sebagai masukan dan keluaran. Model fondasi robotika memperluas arsitektur ini untuk memperlakukan bingkai kamera, pembacaan sensor kedalaman, dan posisi sendi robot sebagai token masukan tambahan, dan perintah kecepatan motor sebagai token keluaran. Tugas prediksi inti — "apa yang akan muncul berikutnya mengingat konteks sebelumnya?" — tetap serupa secara struktural. Keuntungan kritisnya adalah bahwa prapelatihan pada data visual dan bahasa berskala internet memberi model-model ini pengetahuan dunia dan akal sehat yang tidak dapat diberikan oleh data demonstrasi robot murni secara efisien.
Akankah robot adaptif AI membuat robot program tetap lama menjadi usang dengan cepat?
Tidak segera. Robot industri program tetap tetap sangat hemat biaya untuk tugas bervolume tinggi dengan variasi rendah seperti pengelasan dan stamping, di mana adaptabilitas tidak memberikan nilai tambah. Tekanan keusangan paling tinggi di logistik SKU campuran, perakitan ringan, dan lingkungan layanan di mana variabilitas tugas melekat. Pembeli harus mengevaluasi apakah profil tugas spesifik mereka benar-benar mendapat manfaat dari adaptabilitas sebelum berasumsi bahwa platform baru berkemampuan AI membenarkan premi harga di atas perangkat keras lama yang terbukti.
Apa masalah utama yang belum terpecahkan dalam pembelajaran robot saat ini?
Tiga tantangan tetap signifikan: (1) biaya tinggi dan terbatasnya ketersediaan data demonstrasi robot yang beragam dibandingkan dengan data teks untuk model bahasa; (2) ketidakpastian keselamatan sistem AI generatif yang digunakan di lingkungan fisik, terutama yang berinteraksi dengan populasi rentan; dan (3) manipulasi cekatan yang andal — tugas motorik halus seperti memasang kabel atau menangani bahan yang dapat berubah bentuk masih mengalahkan sebagian besar sistem saat ini dalam kondisi dunia nyata, bukan lingkungan laboratorium yang terkontrol.
Revolusi pembelajaran robot itu nyata, tetapi belum selesai. Model fondasi telah memecahkan langit-langit yang diterapkan sistem berbasis aturan, dan angka investasi mencerminkan kemajuan teknologi yang tulus, bukan spekulasi murni. Kesenjangan antara robot fiksi-ilmiah dan perangkat keras yang dapat diterapkan telah menyempit lebih banyak dalam tiga tahun terakhir daripada dalam tiga dekade sebelumnya.
Kendala berikutnya bukanlah algoritmik. Itu adalah data, validasi keselamatan, dan keandalan perangkat keras dalam skala besar — masalah rekayasa sulit yang tidak dapat dipercepat oleh pendanaan saja melampaui kecepatan tertentu.
Pendekatan pembelajaran robot mana — pembelajaran penguatan, model fondasi, atau data teleoperasi — yang menurut Anda akan menentukan siapa yang memenangkan perlombaan humanoid?










Bergabung dalam diskusi
Which robot learning approach — RL, foundation models, or teleoperation data — will determine who wins the humanoid race?