Enam Terobosan AI yang Mengubah 2025: Apa yang Benar-benar Dicapai Andrej Karpathy

2026-01-21 12:08:16

Andrej Karpathy, salah satu peneliti AI paling berpengaruh di dunia, menawarkan pandangannya tentang perubahan transformatif yang membentuk kecerdasan buatan di tahun 2025. Observasinya menerangi bukan hanya apa yang terjadi tahun lalu, tetapi ke mana seluruh industri menuju. Di antara terobosan pembelajaran penguatan, paradigma aplikasi baru, dan pergeseran fundamental dalam cara manusia berinteraksi dengan AI, lanskap bergerak lebih cepat dari yang diprediksi kebanyakan orang.

RLVR: Dasar Baru Pengganti Pembelajaran Terawasi

Buku panduan pelatihan AI memasuki bab baru ketika reinforcement learning berbasis hadiah yang dapat diverifikasi (RLVR) berpindah dari eksperimental ke arus utama. Menurut analisis Andrej Karpathy, pergeseran ini secara fundamental mengubah seperti apa model bahasa tingkat produksi terlihat.

Selama bertahun-tahun, pipeline standar terlihat seperti ini: pra-pelatihan → penyempurnaan terawasi → reinforcement learning dari umpan balik manusia (RLHF). Itu stabil, terbukti, dan menjadi tulang punggung laboratorium AI besar. Tetapi sesuatu berubah di tahun 2025.

RLVR mengubah permainan dengan melatih model dalam lingkungan dengan sinyal hadiah yang dapat diverifikasi secara otomatis—bayangkan soal matematika dengan jawaban pasti benar atau tantangan pengkodean di mana kode tersebut berjalan atau tidak. Alih-alih bergantung pada penilaian manusia, mekanisme umpan balik objektif ini memungkinkan model mengembangkan sesuatu yang menyerupai penalaran asli. Mereka belajar memecah masalah menjadi langkah-langkah menengah dan menemukan beberapa jalur solusi melalui penyempurnaan iteratif.

DeepSeek-R1 menunjukkan prinsip ini pertama kali, tetapi o1 (late 2024) dan o3 (early 2025) dari OpenAI membuktikan bahwa ini dapat diskalakan. Seperti yang dicatat Andrej Karpathy, yang paling mengejutkannya bukan hanya lonjakan kinerja—melainkan pergeseran komputasi besar-besaran. RLVR mengkonsumsi jauh lebih banyak komputasi daripada penyempurnaan tradisional, secara esensial mengalihkan sumber daya yang awalnya diperuntukkan untuk pra-pelatihan. Ini berarti bahwa peningkatan kemampuan di tahun 2025 tidak berasal dari melatih model yang lebih besar, tetapi dari melatih yang lebih cerdas, dengan fase optimisasi yang secara signifikan diperpanjang.

Satu terobosan tambahan: pendekatan baru ini membuka dimensi skala yang benar-benar baru—kemampuan untuk memodulasi kemampuan model saat pengujian dengan memperpanjang trajektori inferensi dan memungkinkan lebih banyak “waktu berpikir.” Ini memisahkan skala kemampuan dari ukuran model dengan cara yang sebelumnya tidak mungkin.

Ghost Intelligence vs. Performa Sawtooth

Andrej Karpathy memperkenalkan sebuah konsep yang mengubah cara industri memandang kognisi AI: kita bukan mengembangkan hewan, kita memanggil hantu.

Seluruh perangkat pelatihan berbeda secara fundamental—arsitektur neural, data, algoritma, dan yang paling penting, tujuan optimisasi. Jadi tidak mengherankan bahwa model bahasa besar menunjukkan kecerdasan yang sangat berbeda dari otak biologis. Membandingkannya dengan hewan atau kecerdasan biologis sama sekali melewatkan intinya.

Jaringan neural manusia dibentuk oleh kelangsungan hidup dalam ekosistem suku. Model AI dibentuk untuk meniru teks, memecahkan teka-teki matematika, dan memenangkan persetujuan manusia dalam tolok ukur kompetitif. Ketika Anda mengoptimalkan untuk tujuan yang sangat berbeda, Anda mendapatkan output yang sangat berbeda pula.

Ini mengarah pada karakteristik performa yang aneh: kurva kemampuan yang bergerak tidak teratur, berbentuk gigi gergaji. Model mungkin menunjukkan pengetahuan ensiklopedis satu saat dan kebingungan dalam penalaran sekolah dasar di saat lain. Mereka unggul di domain yang dapat diverifikasi dan tersandung di konteks terbuka. Lanskap kemampuan yang tidak merata ini bukanlah bug—melainkan konsekuensi langsung dari regime pelatihan itu sendiri.

Di sinilah skeptisisme Andrej Karpathy menjadi penting: dia mengembangkan apa yang dia sebut “ketidakpedulian umum” terhadap tolok ukur di tahun 2025. Alasannya sederhana—tolok ukur adalah lingkungan yang dapat diverifikasi, menjadikannya target utama untuk overfitting RLVR. Tim-tim tak terhindarkan membangun ruang pelatihan dekat dengan embedding tolok ukur dan membanjirinya dengan kemampuan sempit. “Pelatihan pada set pengujian” menjadi norma industri. Mengalahkan semua tolok ukur tidak lagi menandakan kemajuan AGI yang nyata.

Cursor: Lapisan Aplikasi Muncul

Pertumbuhan pesat Cursor di tahun 2025 mengungkapkan sesuatu yang penting: ada tingkat baru dalam tumpukan aplikasi AI.

Menurut Andrej Karpathy, Cursor bekerja karena menyelesaikan masalah vertikal tertentu—pembuatan kode dalam alur kerja pengembangan nyata—bukan karena ini adalah chatbot tujuan umum yang lebih baik. Arsitektur yang mendukung alat seperti Cursor melibatkan tiga komponen terintegrasi: rekayasa konteks (mengambil informasi relevan), orkestrasi beberapa panggilan LLM menjadi grafik berarah tak siklik yang semakin kompleks (menyeimbangkan kinerja terhadap biaya), dan antarmuka pengguna khusus aplikasi dengan kontrol manusia-di-gang.

Ini memicu percakapan yang lebih luas: akankah platform model bahasa besar (seperti API OpenAI) mendominasi seluruh lapisan aplikasi, atau akankah alat khusus berkembang pesat? Ramalan Andrej Karpathy: platform akan secara bertahap menjadi “universitas generalis,” menghasilkan output yang mampu tetapi tidak khusus. Nilai sebenarnya akan mengalir ke perusahaan lapisan aplikasi yang mengambil model-model yang mampu tersebut, menyempurnakannya dengan data kepemilikan, mengintegrasikan sensor dan aktuator, dan mengubahnya menjadi “tim profesional” khusus yang dapat diterapkan di domain vertikal tertentu.

Implikasinya: Cursor bukanlah akhir permainan—ini adalah template. Harapkan puluhan alat vertikal-spesifik mengikuti buku panduan yang sama ini.

Claude Code: Agen yang Hidup Secara Lokal

Kemunculan Claude Code menunjukkan sesuatu yang menarik perhatian Andrej Karpathy: agen AI yang efektif tidak harus hidup di cloud.

Teknologi ini melalui siklus penggunaan alat dan penalaran dalam sebuah loop, memungkinkan pemecahan masalah yang lebih persistens dan kompleks dibandingkan antarmuka obrolan sederhana. Tetapi yang benar-benar mengesankan Andrej Karpathy adalah pilihan arsitektur: Claude Code berjalan langsung di komputer pengguna, tertanam dalam file lokal, lingkungan pribadi, dan alur kerja individu.

Ini mewakili penyimpangan yang disengaja dari arah strategis OpenAI. OpenAI berinvestasi besar-besaran dalam agen berbasis cloud yang diorkestrasi dalam lingkungan ChatGPT yang dikontainerisasi. Meskipun pendekatan ini menjanjikan “bentuk akhir dari AGI,” kita saat ini berada dalam fase pengembangan yang tidak merata dengan manfaat yang belum terbukti.

Menggunakan agen secara lokal—dekat dengan pengembang, terintegrasi erat dengan konteks kerja mereka—terbukti lebih cepat dan lebih praktis untuk saat ini. Claude Code menancapkan prioritas ini, membungkusnya ke dalam alat baris perintah yang elegan yang secara fundamental mengubah antarmuka AI. Ini tidak lagi sekadar situs web seperti Google. Ini adalah sprite kecil yang hidup di komputer Anda, berkolaborasi langsung dengan alur kerja Anda. Itu adalah paradigma yang benar-benar berbeda untuk interaksi manusia-AI.

Vibe Coding: Pemrograman Tanpa Kode

Pada tahun 2025, AI melampaui ambang kritis: Anda dapat menggambarkan apa yang Anda inginkan dalam bahasa Inggris dan perangkat lunak yang berfungsi akan muncul, tanpa perlu memahami implementasi dasarnya.

Andrej Karpathy menciptakan istilah “Vibe Coding” secara santai dalam sebuah pemikiran shower di Twitter, tidak menyangka akan menjadi tren industri. Tetapi ini dengan sempurna menangkap apa yang terjadi—pemrograman menjadi dapat diakses oleh semua orang, bukan hanya profesional terlatih.

Ini terkait dengan pola yang lebih luas yang diidentifikasi Andrej Karpathy: orang biasa mendapatkan manfaat lebih dari model bahasa besar daripada para ahli. Profesional sudah memiliki alat dan pengetahuan mendalam. Orang biasa tidak bisa membangun apa pun. Sekarang mereka bisa.

Tetapi Vibe Coding juga menguntungkan para profesional—dengan cara yang berbeda. Ini memungkinkan pengembang untuk mengimplementasikan fitur yang “tidak akan pernah ditulis sebaliknya,” karena tiba-tiba kode menjadi gratis, sementara, dan dapat dibuang. Saat membangun nanochat, Andrej Karpathy menggunakan Vibe Coding untuk menulis tokenizer BPE yang khusus dan efisien dalam Rust tanpa mempelajari bahasa tersebut atau bergantung pada pustaka yang ada. Dia memprototipe seluruh sistem hanya untuk menguji kelayakannya. Dia menulis aplikasi satu kali untuk mengatasi kerentanan tertentu.

Perubahan ekonomi ini—di mana biaya beralih nol—akan membentuk ulang ekosistem pengembangan perangkat lunak dan secara permanen menggambar ulang batasan karier di bidang pemrograman.

Nano Banana: LLM Akhirnya Mendapat Antarmuka Pengguna

Terobosan Google Gemini Nano—yang disebut Andrej Karpathy sebagai “Nano Banana”—mewakili salah satu perubahan paradigma paling disruptif di tahun 2025.

Andrej Karpathy menyajikannya secara sederhana: model bahasa besar mewakili paradigma komputasi utama berikutnya setelah era PC tahun 1970-an-80-an. Jadi kita harus mengharapkan inovasi serupa karena alasan yang sama—sejalan dengan evolusi komputasi pribadi, mikrokontroler, dan internet itu sendiri.

Interaksi manusia-komputer saat ini masih menyerupai terminal baris perintah tahun 1980-an. Teks mendominasi, meskipun primitif untuk komputer dan salah format untuk manusia. Manusia merasa membaca teks lambat dan menyakitkan. Mereka lebih suka saluran visual dan spasial—itulah sebabnya antarmuka pengguna grafis mengubah komputasi pribadi beberapa dekade lalu.

Prinsip yang sama berlaku untuk AI: model harus berkomunikasi melalui gambar, infografis, slide, papan tulis, video, aplikasi web—intinya, format apa pun yang benar-benar disukai manusia. Langkah awal muncul melalui “hiasan teks visual” seperti emoji dan pemformatan Markdown. Tetapi siapa yang akhirnya akan membangun lapisan antarmuka grafis lengkap untuk AI?

Nano Banana adalah prototipe awal dari masa depan itu. Terobosan utamanya melampaui pembuatan gambar. Yang membuatnya penting adalah kemampuan terintegrasi—pembuatan teks, pembuatan gambar, dan pengetahuan dunia yang terwujud semuanya terjalin melalui bobot model. Fusi ini menciptakan paradigma antarmuka yang secara fundamental berbeda dari model berbasis teks saja.

Konvergensi: Visi Andrej Karpathy untuk Apa yang Akan Datang

Enam perubahan ini tidak ada dalam isolasi. Pengamatan Andrej Karpathy mengungkapkan industri dalam transisi: menjauh dari skala model murni, menuju metode pelatihan yang lebih cerdas dan aplikasi khusus. Menjauh dari generalis berbasis cloud, menuju agen yang di-deploy secara lokal yang terintegrasi dengan alur kerja manusia. Menjauh dari antarmuka berpusat teks, menuju komunikasi visual dan spasial.

Tahun 2025 membuktikan bahwa kecerdasan buatan tidak hanya menjadi sedikit lebih baik. Ia secara fundamental mengatur ulang bagaimana ia dilatih, dideploy, dan berkomunikasi. Tahap berikutnya akan menjadi milik siapa saja yang menguasai paradigma baru ini terlebih dahulu.

SIX0,96%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.