
Pada tahun 2026, lingkaran AI akan melahirkan 100 miliar unicorn tercepat. Skild AI menyelesaikan pembiayaan Seri C dengan valuasi lebih dari $140 miliar, dan diinvestasikan oleh SoftBank, Nvidia, dan Bezos hanya dalam 3 tahun pendirian. Pendirinya berasal dari Meta AI, yang tidak membangun perangkat keras robot, tetapi berfokus pada penciptaan “otak universal” Skild Brain, yang menggunakan model bersama untuk memberi robot kemampuan ke dunia fisik.
Skild AI adalah unicorn tercepat yang menembus 100 miliar tahun ini, dengan laju perkembangan yang cepat dan ekspansi penilaian yang sengit, yang fenomenal bahkan dalam gelombang hiruk pikuk investasi AI. Hanya dua bulan setelah didirikan, perusahaan menerima putaran awal senilai $14,5 juta yang dipimpin oleh Lightspeed Ventures, berhasil meluncurkan peluncurannya. Pada ulang tahun pertamanya, Skild AI menyelesaikan putaran pendanaan Seri A hingga $300 juta, dan valuasi pasca-investasinya melonjak menjadi $15 miliar. Dalam waktu kurang dari dua tahun, penilaiannya telah meningkat hampir sepuluh kali lipat, dan pembiayaan Seri C terbarunya telah mendorong penilaiannya menjadi $140 miliar.
Alasan taruhan modal pada Skild AI sederhana – pasar tenaga kerja global menghadapi kesenjangan yang parah. Kesenjangan pekerjaan di industri manufaktur AS saja diperkirakan akan mencapai 2,1 juta pada tahun 2030, dan masalah populasi yang menua di negara maju seperti Eropa dan Jepang bahkan lebih serius. Robot serba guna, yang mampu melakukan tugas-tugas fisika yang kompleks, dipandang sebagai kunci untuk memecahkan krisis produktivitas. Namun, industri robotika saat ini sangat terfragmentasi, dan setiap produsen mencoba mengembangkan segala sesuatu mulai dari struktur mekanis hingga sistem kontrol, menghasilkan biaya R&D yang tinggi dan ketidakmampuan untuk memigrasikan kemampuan lintas platform.
Model perangkat lunak murni Skild AI yang “hanya melakukan otak, bukan tubuh” sejalan dengan tren umum industri yang beralih dari “berorientasi perangkat keras” ke “model AI dan berorientasi pada kemampuan perangkat lunak”. Sequoia Capital menulis dalam laporan pasca-investasi: “Nilai inti dari Skild AI adalah menggunakan model fondasi bersama untuk membuka ‘kemampuan muncul’ robot di dunia fisik. Ini pada dasarnya berbeda dari non-skalabilitas ‘pengontrol titik tunggal’ di masa lalu.” “Kemampuan muncul” ini mirip dengan terobosan GPT-3 dalam pemahaman bahasa, di mana ketika model mencapai titik kritis, ia secara otomatis memiliki kemampuan yang tidak diajarkan secara eksplisit selama pelatihan.
Keterlibatan SoftBank sangat strategis. Raksasa teknologi Jepang mengakuisisi ARM pada tahun 2016 seharga $ 320 miliar dan telah menata di bidang robotika (seperti akuisisi Boston Dynamics). SoftBank Vision Fund dikenal karena agresivitasnya dalam investasi AI, dan posisi berat di Skild AI ini menunjukkan bahwa ia percaya bahwa “otak universal robot” adalah pasar triliunan dolar berikutnya. Penambahan Nvidia memberikan daya komputasi dan dukungan ekologis, dan infrastruktur pelatihan Skild AI kemungkinan akan dibangun di atas kluster GPU Nvidia. Investasi pribadi Bezos bahkan lebih jarang, karena pendiri Amazon jarang berpartisipasi dalam proyek tahap awal, dan dukungannya membawa nilai merek tidak berwujud ke Skild AI.
Jawaban atas kemampuan teknis Skild AI tersembunyi di latar belakang tim pendiri. Sebelum mendirikan Skild AI, Deepak Pathak adalah seorang sarjana dan praktisi terkenal di bidang kecerdasan buatan dan robotika, menjabat sebagai asisten profesor di Carnegie Mellon University dan menerbitkan beberapa makalah yang dikutip secara luas. Selama masa jabatannya di Meta AI, ia sangat terlibat dalam beberapa proyek utama tentang pembelajaran adaptif, migrasi simulasi ke dunia nyata, dan pelatihan data robot skala besar.
Pathak sangat percaya bahwa kecerdasan umum AI sejati harus dibangun melalui interaksi dan coba-coba di dunia fisik, daripada hanya mengandalkan teks digital atau data gambar. Konsep ini dipertanyakan di dalam Meta, karena fokus Meta adalah pada metaverse dan AI sosial pada saat itu, dan investasinya dalam robot fisik relatif konservatif. Ketidaksepakatan strategis ini akhirnya mendorong Pathak untuk memilih untuk memulai bisnis dan mewujudkan ide tersebut.
Abhinav Gupta, juga dari Meta AI, telah membuat prestasi di persimpangan visi komputer dan pembelajaran robotika. Dia menekankan pembelajaran pengetahuan fisika dari data video skala jaringan, memungkinkan mesin untuk memahami sifat objek, hukum fisika, dan niat manusia. Faktanya, Gupta dan Pathak telah berkolaborasi beberapa kali selama mereka di Meta untuk mengeksplorasi cara mereplikasi “kemampuan muncul” dari model bahasa besar menjadi robot fisik.
Keduanya percaya bahwa industri robotika saat ini terlalu bergantung pada solusi yang disesuaikan untuk tugas-tugas tertentu dan perangkat keras tertentu, dan tidak memiliki “otak universal” yang dapat digeneralisasi dan dapat diskalakan, yang secara serius membatasi potensi aplikasi dan kecepatan mempopulerkan robot di dunia nyata. Akibatnya, keduanya telah mulai menginkubasi proyek internal di tahap selanjutnya dari Meta untuk mencoba membangun model fondasi robot yang tidak bergantung pada perangkat keras tertentu. Akhirnya, pada awal 2023, Pathak dan Gupta memutuskan untuk meninggalkan Meta dan memulai bisnis penuh waktu. Mereka sangat percaya bahwa masa depan industri robotika bukan tentang membuat lebih banyak “tubuh” tetapi tentang menyediakan “otak” yang kuat dan dapat dibagikan.
Maju cepat ke tahun 2023, ketika robot cerdas berkembang di mana-mana, tetapi setiap robot perlu melatih algoritme khusus dari awal, menghasilkan siklus R&D yang panjang, biaya tinggi, dan kemampuan yang tidak dapat dikomunikasikan antara robot yang berbeda. Dalam industri intelijen yang terkandung, selalu ada masalah yang mengganggu industri: bagaimana cara menggeneralisasi? Yang disebut generalisasi mengacu pada kemampuan satu robot yang dapat dengan cepat disalin ke robot lain.
Ini sangat sulit bagi robot karena dunia fisik sangat kompleks, tidak pasti, dan sangat dinamis, dan robot perlu memecahkan masalah generalisasi pada tiga tingkat persepsi, pengambilan keputusan, dan eksekusi pada saat yang bersamaan. Misalnya, perubahan pencahayaan, efek cuaca, kekacauan latar belakang, gangguan oklusi, dll., dapat menyebabkan perubahan drastis dalam distribusi data input sensor visual. Bahkan jika setiap tugas sederhana (misalnya, meraih, berjalan) dipelajari, ketika digabungkan menjadi tugas-tugas kompleks (misalnya, “buka lemari es, keluarkan minuman dan tuangkan ke dalam cangkir”), ruang pengambilan keputusan meningkat secara eksponensial.
Pra-pelatihan multimoda skala besar: Pelajari pengetahuan fisika dari video web, lingkungan simulasi, dan data robot nyata untuk membuat representasi umum di seluruh skenario
Perangkat keras tidak bergantung pada arsitektur: Memisahkan persepsi dan logika pengambilan keputusan dari struktur mekanis tertentu melalui lapisan abstraksi, sehingga model yang sama dapat digunakan ke berbagai bentuk robot seperti roda, kaki, dan lengan
Mekanisme pembelajaran berkelanjutan: Data yang dihasilkan oleh robot selama pelaksanaan tugas dikirim kembali ke cloud, dan model terus dioptimalkan, dan pengalaman setiap robot dapat menguntungkan seluruh jaringan
Skild AI tidak membuat perangkat keras robot, tetapi bertujuan untuk memasang “otak universal” untuk semua robot, dan pendirinya mengklaim bahwa mereka menciptakan “momen GPT-3” dari kecerdasan yang diwujudkan. Skild Brain memisahkan perangkat lunak dari perangkat keras, menghindari terikat pada satu desain perangkat keras. Pada saat yang sama, ini menurunkan ambang batas industri sebanyak mungkin, memungkinkan produsen atau integrator robot lain untuk fokus pada pengoptimalan perangkat keras dan implementasi skenario, dan langsung memanggil API Skild Brain untuk mendapatkan kecerdasan tingkat lanjut, sangat mempercepat mempopulerkan aplikasi robot.
Prospek komersialisasi juga menjanjikan. Di sektor industri dan komersial, robot di lini produksi tidak harus dimatikan karena kesalahan kecil; Dalam penyelamatan bencana, robot dapat terus melakukan tugas bahkan jika mereka memiliki “anggota tubuh yang terputus”; Di pasar konsumen, “otak” dapat digunakan “keluar dari cangkang” untuk mengurangi biaya secara signifikan. Landasan teknologi ini membentuk kembali pemahaman orang tentang AGI - pengetahuan digital saja tidak dapat membangun AGI yang sebenarnya, dan agen mesin harus belajar melalui pembelajaran “langsung” untuk memahami hukum operasi yang sebenarnya di dunia fisik.