Dari C-3PO ke Roomba: Perjalanan Robot Belajar Berinteraksi dengan Dunia

Sejarah singkat revolusi robotik: dari aturan ketat dan simulasi, hingga AI generatif yang membuat robot bisa belajar seperti manusia. Apa yang berubah?

Dulu, para ahli robotik punya mimpi yang besar. Mereka ingin menciptakan robot secanggih tubuh manusia, yang bisa bergerak bebas, beradaptasi, dan berinteraksi dengan orang lain.

Tapi kenyataannya? Mereka menghabiskan karier memperbaiki lengan robot untuk pabrik mobil. Targetnya C-3PO, yang terwujud malah Roomba.

Mimpi sebenarnya adalah robot fiksi ilmiah yang bisa membantu orang dengan masalah mobilitas, mengurangi kesepian, atau mengerjakan tugas berbahaya. Tapi sejarah kegagalan panjang membuat Silicon Valley ragu untuk berinvestasi.

Sekarang, semuanya berubah. Pada 2025 saja, perusahaan dan investor menyuntikkan $6,1 miliar ke robot humanoid—empat kali lipat dari tahun sebelumnya. Apa yang terjadi?

Revolusi dalam cara mesin belajar berinteraksi dengan dunia.

Bayangkan kamu mau pasang sepasang lengan robot di rumah untuk melipat pakaian. Gimana cara mengajarkannya?

Dulu, kamu harus menulis aturan satu per satu. Periksa jenis kain, identifikasi kerah kemeja, gerakkan gripper ke lengan kiri, lipat dengan jarak tepat sekian sentimeter.

Kalau kemejanya diputar, ubah rencana. Kalau lengannya terpelintir, perbaiki. Jumlah aturan meledak dengan cepat. Ini adalah cara kerja robotik tradisional: mengantisipasi setiap kemungkinan dan mengodekannya dari awal.

Sekitar 2015, pendekatan mulai berubah. Buat simulasi digital dari lengan robot dan pakaiannya. Beri program sinyal reward setiap kali berhasil melipat, dan penalty kalau gagal.

Dengan cara ini, robot belajar dari trial and error—jutaan iterasi—sama seperti AI belajar main game.

Kedatangan ChatGPT pada 2022 memicu ledakan saat ini. Large language models (LLMs) tidak belajar dari trial and error, tapi dengan memprediksi kata berikutnya dalam kalimat.

Model serupa yang diadaptasi untuk robotik bisa menyerap gambar, data sensor, dan posisi sendi robot—kemudian memprediksi aksi berikutnya yang harus diambil, mengeluarkan puluhan perintah motor setiap detik.

Perubahan konseptual ini—mengandalkan AI model yang menyerap data dalam jumlah besar—berhasil untuk robot yang harus berbicara, bergerak, atau mengerjakan tugas kompleks.

Dulu ada Jibo, robot sosial berbentuk lampu yang diperkenalkan 2014 oleh peneliti MIT Cynthia Breazeal. Bisa memperkenalkan diri dan menari untuk menghibur anak, tapi itu saja.

Visinya adalah asisten fisik yang bisa mengatur jadwal, email, dan bercerita. Tapi perusahaannya tutup 2019. Yang benar-benar dibutuhkan Jibo adalah kemampuan bahasa yang lebih baik.

Saat itu, Siri dan Alexa mengandalkan scripting berat—respons dari potongan teks yang sudah disetujui sebelumnya. Bisa menarik, tapi repetitif dan membosankan.

Sekarang, voice mode dari provider AI utama sudah engaging dan mengesankan. Tapi ada risiko baru: percakapan yang digenerate AI bisa keluar jalur, tidak seperti script.

OpenAI juga pernah mencoba dengan Dactyl, tangan robot yang dilatih secara virtual untuk memanipulasi kubus. Masalahnya? Robot bisa jago di simulasi, tapi gagal di dunia nyata karena perbedaan kecil seperti warna atau tekstur karet.

Solusinya adalah domain randomization: buat jutaan dunia simulasi yang sedikit berbeda satu sama lain. Setelah cukup terpapar variasi, robot lebih siap menghadapi dunia nyata.

Dactyl berhasil, bahkan bisa menyelesaikan Rubik's Cube—meski hanya 60% berhasil, dan 20% untuk scramble yang sulit.

Tapi batasan simulasi membuat teknik ini kurang populer sekarang. OpenAI menutup divisi robotik 2021, tapi baru-baru ini membukanya lagi dengan fokus humanoid.

Google DeepMind mengambil jalur berbeda. Timnya menghabiskan 17 bulan memfilmkan orang mengontrol robot untuk 700 tugas berbeda—dari mengambil keripik hingga membuka toples.

Model RT-1 menerima input tentang apa yang dilihat robot dan posisi lengannya, lalu menerjemahkan instruksi menjadi perintah motor. Kalau sudah pernah lihat tugasnya, berhasil 97%. Kalau belum, 76%.

RT-2 melangkah lebih jauh. Dilatih bukan hanya data robotik, tapi gambar umum dari internet—seperti vision-language models. Robot bisa mengerti "Letakkan kaleng Coke dekat foto Taylor Swift."

Pada 2025, Google DeepMind merilis Gemini Robotics dengan kemampuan lebih baik memahami perintah bahasa alami.

Covariant, spin-off dari engineer OpenAI, fokus pada robot praktis: lengan untuk gudang. Model RFM-1 bisa berinteraksi seperti rekan kerja.

Tunjukkan banyak sleeve bola tenis, instruksikan untuk memindahkan ke area terpisah, dan robot bisa merespons—bahkan memprediksi kalau grip tidak bagus dan meminta saran suction cup.

Tidak sempurna. Dalam demo Maret 2024, robot kesulitan ketika diminta "kembalikan pisang" ke lokasi semula. Dia mengambil spons, apel, dan barang lain sebelum berhasil.

Cofounder Peter Chen jelaskan: robot belum mengerti konsep menelusuri jejak kembali. Tapi ini contoh bagus—dia belum bekerja baik di area tanpa data pelatihan yang cukup.

Chen dan founder lainnya kemudian direkrut Amazon, yang sedang melisensi model robotik Covariant untuk 1.300 gudangnya di AS.

Investasi baru mengalir ke startup robotik humanoid—bentuk seperti manusia, bukan lampu atau lengan. Idenya: masuk ruang dan pekerjaan manusia tanpa perlu mengubah jalur perakitan.

Lebih mudah dikatakan daripada dilakukan. Humanoid jarang terlihat di gudang nyata, biasanya terbatas di zona tes.

Tapi Digit dari Agility Robotics tampaknya benar-benar bekerja. Desainnya fungsional, tidak estetika fiksi ilmiah. Amazon, Toyota, dan GXO sudah mendeploynya untuk memindahkan dan menumpuk shipping totes.

Digit masih jauh dari helper humanlike yang diharapkan Silicon Valley. Bisa angkat hanya 16 kg, dan setiap kali dibuat lebih kuat, baterainya jadi lebih berat dan perlu ngecas lebih sering.

Organisasi standar juga menuntut aturan keselamatan lebih ketat untuk humanoid karena dirancang bergerak dan dekat dengan manusia.

Tapi Digit menunjukkan revolusi pelatihan robot tidak menyatu pada satu metode. Agility mengandalkan simulasi seperti OpenAI, dan bekerja dengan model Gemini Google untuk adaptasi lingkungan baru.

Itulah hasil lebih dari satu dekade eksperimen: industri ini sekarang membangun besar.

Praktisnya untuk kamu: revolusi robotik sedang terjadi, tapi masih di tahap awal. Kalau kamu di industri logistik atau manufaktur, mulai eksplorasi pilot dengan vendor terpercaya. Untuk konsumen, humanoid yang benar-benar helpful masih butuh waktu—mungkin 5-10 tahun lagi sebelum benar-benar masuk rumah tangga.

Technology lagi bergerak cepat, jadi jangan cuma lihat headline.
MIT Technology Review

Catatan redaksi

Kalau lo cuma ambil satu hal dari artikel ini

Technology update dari MIT Technology Review.

Sumber asli

Artikel ini merupakan rewrite editorial dari laporan MIT Technology Review.

Baca artikel asli di MIT Technology Review→

#Technology#MITTechnologyReview#rss

Dari C-3PO ke Roomba: Perjalanan Robot Belajar Berinteraksi dengan Dunia

MIT Technology Review

Technology update dari MIT Technology Review.

Kalau lo cuma ambil satu hal dari artikel ini

Ditulis oleh Captivela AI

Bacaan selanjutnya

Meta buys robotics startup to bolster its humanoid AI ambitions

The RAMpocalypse has bought Microsoft valuable time in the fight against SteamOS

Musely secures $360M from General Catalyst without giving up equity