GE-Sim 2.0: Menggunakan World Model untuk membangkitkan dunia, pesaing kuat YU-Tech akan mendorong robot humanoid menuju evolusi mandiri

ChainNewsAbmedia

Kecerdasan berwujud (Embodied AI) sedang memasuki titik balik yang krusial. Baru-baru ini, robot humanoid asal China, Zhi Yuan Robotics, merilis Genie Envisioner World Simulator 2.0 (GE-Sim 2.0), mencoba mendorong World Model (model dunia) dari sekadar alat untuk memahami lingkungan menjadi simulator dunia (World Simulator) yang dapat langsung menjalankan, melatih, dan mengoptimalkan robot.

Jika Anda belum memahami seberapa penting hal ini, mari lihat dulu “cacat bawaan” pada arsitektur LLM: secara logis, LLM yang ada saat ini hanya memprediksi konteks berdasarkan kumpulan data teks yang sangat besar. LLM dapat mengetahui bahwa kata-kata “apel jatuh” sering muncul bersama, tetapi ia tidak benar-benar memahami hubungan kausal gravitasi atau dunia fisik.

Inilah sebabnya ilmuwan seperti Yang LeCun dan Li Fei-Fei terjun ke jalur World Model. Setelah AI memiliki kemampuan untuk memahami lingkungan 3D dan memprediksi fisika, teknologi ini akan menjadi “otak digital” bagi “Physical AI” (AI Berwujud) seperti robot otonom, kendaraan otonom, dan manufaktur cerdas. Karena itu, jalur World Model menegaskan bahwa robot akan menjadi pembawa yang sangat penting. Kini, perusahaan robot humanoid—Zhi Yuan Robotics—masuk ke arena, yang melambangkan pionir dari kebangkitan China dari sisi perangkat keras.

Sebelumnya, Ketua Dewan TSMC, Wei Zhejia, pernah menyatakan: jika melihat China daratan terus membuat robot yang bisa meloncat-loncat melompat-lompat, itu tidak berguna; hanya sekadar tampak bagus saja. Ia menekaskan kuncinya adalah membuat “otak” robot dapat berfungsi. Siapa yang membuat “otak” itu, yaitu Nvidia (Nvidia), AMD (AMD), dan banyak perusahaan Amerika, tetapi 95% “otak” diproduksi oleh TSMC. Hambatan pengembangan GE-Sim 2.0 masih ada, dan perkembangannya sangat terikat pada perkembangan model dari China.

Jalur World Model menyatakan, robot adalah pembawa yang kunci

LLM arus utama saat ini mengandalkan kumpulan data yang besar dan hubungan statistik untuk memahami konteks, serta memprediksi kata berikutnya. Ia bisa mengetahui bahwa kata-kata “apel jatuh” biasanya muncul bersama, tetapi tidak benar-benar memahami hubungan kausal gravitasi atau dunia fisik.

Pola ini tampil sangat baik dalam tugas seperti generasi teks, bantuan pemrograman, atau tanya jawab, namun masih memiliki keterbatasan mendasar pada skenario yang membutuhkan pemahaman struktur dunia nyata, penalaran hubungan kausal, dan perencanaan jangka panjang. Masalah yang lebih besar adalah sumber data yang perlahan mulai menipis. Pelatihan LLM sangat bergantung pada data manusia berkualitas tinggi, dan dalam beberapa tahun terakhir industri sudah mulai memperingatkan bahwa data teks manusia yang tersedia mungkin akan habis dalam beberapa tahun ke depan. Saat itu, seperti inbreeding yang berpotensi menurunkan cacat genetik, pada akhirnya membuat model semakin menjauh dari kenyataan dan mengalami penurunan performa.

(Analisis mendalam: Apakah LLM punya kekurangan? Mengapa Yang LeCun bertaruh pada AMI untuk jalur World Model)

Itulah mengapa dalam beberapa tahun terakhir, dua tokoh besar di bidang riset AI—Yang LeCun dan Li Fei-Fei yang disebut “Ibu kandung AI”—keduanya memilih untuk bertaruh pada arsitektur AI generasi baru yang dikenal sebagai World Model (model dunia).

Saat itu, penulis pernah menyatakan: jika dilihat lebih jauh, setelah AI memiliki kemampuan untuk memahami lingkungan 3D dan kemampuan prediksi fisik, teknologi ini akan menjadi “otak digital” bagi “Physical AI” (AI Berwujud) seperti robot otonom, kendaraan otonom, dan manufaktur cerdas. Oleh karena itu, jalur World Model menegaskan bahwa robot akan menjadi pembawa yang sangat penting. Kini, perusahaan robot humanoid Zhi Yuan Robotics masuk ke industri, yang melambangkan pionir kebangkitan China dari sisi perangkat keras.

Sebelumnya, Ketua TSMC Wei Zhejia, saat membahas perkembangan robot dan semikonduktor, terus terang mengatakan bahwa jika melihat China daratan terus membuat robot yang bisa lompat-lompat melompat-lompat, itu tidak ada gunanya, hanya sekadar tampak bagus. Ia menunjukkan bahwa kuncinya ada pada kemampuan agar “otak” robot bisa bekerja; dan soal “otak” itu dibuat oleh siapa, yaitu Nvidia (Nvidia), AMD (AMD), dan banyak perusahaan Amerika, tetapi 95% “otak” diproduksi oleh TSMC.

(Wei Zhejia dari TSMC mengkritik: Robot China cuma bisa loncat-loncat, itu cuma tampak bagus—tidak ada gunanya! Kuncinya tetap dari Nvidia)

Evolusi World Model: dari memahami dunia, hingga belajar di dalam dunia

Dalam beberapa tahun terakhir, World Model selalu dianggap sebagai teknologi kunci untuk memahami dunia nyata dalam AI. Melalui citra, bahasa, dan data sensor, model dapat memprediksi perubahan lingkungan, sehingga memberi robot kemampuan pengambilan keputusan dasar.

Namun, terobosan inti GE-Sim 2.0 bukan sekadar memahami dunia, melainkan belajar dan sistem bertindak langsung di “dunia yang dihasilkan oleh model”. Variabel utama memasukkan Action (aksi) ke dalam inti, meningkatkan dari prediksi status tradisional menjadi siklus penuh:

State

Action

State Evolution

Artinya, robot tidak lagi hanya mengamati dan merespons, melainkan bisa secara aktif mencoba-coba, mengoptimasi sendiri, dan terus belajar di lingkungan simulasi. Pergantian ini membuat World Model berevolusi dari “model kognitif” menjadi “infrastruktur pelatihan”.

GE-Sim 2.0: Membuat robot “berevolusi” di dunia virtual

GE-Sim 2.0 didefinisikan sebagai seperangkat “simulator dunia berwujud”. Sasaran utamanya adalah memecahkan tiga hambatan utama pelatihan di dunia nyata: biaya yang terlalu tinggi, data yang tidak cukup, dan sulit untuk diskalakan. Melalui lingkungan yang dihasilkan oleh model, sistem dapat melatih robot dalam skala besar tanpa bergantung pada dunia nyata.

Secara teknis, GE-Sim 2.0 mengintegrasikan tiga kemampuan kunci: pertama adalah “pembuatan citra yang digerakkan oleh tindakan” (action-driven image generation). Model dapat menghasilkan gambar masa depan yang sesuai berdasarkan aksi robot, sambil mempertahankan konsistensi multi-sudut pandang, termasuk sudut pandang kepala dan sudut pandang operasi tangan kiri dan tangan kanan.

Kedua adalah pemodelan proprioception (proprioception). Tidak hanya mensimulasikan tampilan eksternal, tetapi juga memprediksi kondisi sendi dan status gerakan robot sendiri, sehingga pengambilan keputusan lebih mendekati dunia fisik yang sebenarnya.

Ketiga adalah “evaluasi tugas otomatis”. Melalui reward model (model hadiah) bawaan, sistem dapat menilai secara otomatis apakah sebuah tugas telah selesai—misalnya “menempatkan benda biru ke dalam kotak merah”—dan memberikan umpan balik, yang langsung digunakan untuk reinforcement learning. Ini membuat robot dapat menyelesaikan siklus tertutup penuh di lingkungan simulasi:

GE-Sim 2.0 sudah dapat mewujudkan pembuatan video yang stabil pada tingkat “menit”

Dibandingkan model-model awal yang hanya mampu menghasilkan cuplikan singkat, GE-Sim 2.0 sudah dapat menghasilkan video yang stabil pada tingkat “menit”, serta mendukung simulasi tugas dalam jangka waktu lama. Pada saat yang sama, melalui pelatihan menggunakan data nyata dalam skala besar (data operasi jarak jauh, deployment, dan interaksi), model memiliki kemampuan generalisasi yang lebih kuat di antara skenario dan tugas yang berbeda. Ini sangat penting untuk robot humanoid, karena operasi di dunia nyata sangat beragam, sehingga tidak bisa hanya dilatih pada skenario yang tetap.

Kemunculan World Simulator berarti robot bisa “latihan tanpa batas” di dunia virtual. Ini akan membawa dua perubahan struktural: pertama, biaya pelatihan turun secara signifikan. Kedua, kecepatan iterasi kemampuan meningkat secara eksponensial.

Zhi Yuan Robotics: Kekuatan baru robot humanoid dari China

Zhi Yuan Robotics didirikan pada 2023 oleh Peng Zhihui, “anak jenius” dari Huawei, dengan fokus pada bidang kecerdasan berwujud yang menggabungkan AI dan robot.

Produk inti perusahaan meliputi:

Robot humanoid seri “Yuan Zheng”

Sistem robot “Lingxi”

Model general GO-1

Saat ini telah menyelesaikan beberapa putaran pendanaan, dan memperoleh investasi dari lembaga seperti Sequoia China dan Hillhouse Capital. Perusahaan ini dianggap sebagai pemain penting dalam industri robot humanoid China, dengan persaingan yang membentuk peta kompetisi bersama Unitree Technology.

Artikel ini Zhi Yuan GE-Sim 2.0: menggunakan World Model untuk menghasilkan dunia, rival kuat Unitree mendorong robot humanoid menuju self-evolution pertama kali muncul di Chain News ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar