Enam Perubahan yang Mengubah Bentuk AI di 2025: Dari RLVR ke Nano Banana

Sepanjang tahun 2025, industri kecerdasan buatan mengalami serangkaian transformasi fundamental yang mengubah tidak hanya cara sistem AI dilatih, tetapi juga bagaimana mereka diterapkan, dipersepsikan, dan diintegrasikan ke dalam alur kerja manusia. Apa yang dimulai sebagai inovasi teknis di laboratorium riset menyebar menjadi perubahan paradigma yang mendefinisikan ulang seluruh ekosistem AI. Enam transformasi ini, sebagaimana dianalisis oleh peneliti AI terkemuka Andrej Karpathy, mewakili lebih dari sekadar peningkatan inkremental—mereka menandai munculnya era komputasi baru.

Perubahan 1: Rewards Verifikasi Menggantikan Penilaian Manusia dalam Pelatihan Model

Selama bertahun-tahun, pipeline pelatihan standar untuk model bahasa besar mengikuti urutan yang dapat diprediksi: pra-pelatihan seperti GPT-2/3, diikuti dengan fine-tuning terawasi (menggambarkan InstructGPT dari 2022), ditutup dengan reinforcement learning dari umpan balik manusia (RLHF). Pendekatan tiga tahap ini telah menjadi standar industri, disempurnakan dan teruji di berbagai laboratorium AI utama.

Pada tahun 2025, tumpukan produksi ini mengalami overhaul paling signifikan dalam beberapa tahun. Reinforcement Learning berbasis Rewards Verifikasi (RLVR) muncul sebagai paradigma dominan, secara fundamental mengubah cara model mengembangkan kemampuan penalaran. Alih-alih bergantung pada penilai manusia untuk menilai output, RLVR melatih model dalam lingkungan di mana keberhasilan dapat diverifikasi secara objektif—solusi masalah matematis, tugas pemrograman, rantai penalaran logis—lingkungan di mana jawaban yang benar tidak ambigu.

Perubahan ini paling terlihat melalui model seperti o1 dari OpenAI (yang terungkap pada akhir 2024) dan rilis o3 yang menjadi tonggak di awal 2025. Sistem ini tidak hanya merespons lebih cepat atau lebih lancar; mereka menunjukkan kemampuan untuk secara spontan membangun rantai penalaran, memecah masalah kompleks menjadi langkah-langkah menengah, dan secara iteratif menyempurnakan solusi melalui proses yang menyerupai deliberasi manusia. Makalah DeepSeek-R1 memberikan bukti transparan tentang bagaimana metodologi pelatihan ini memungkinkan model menemukan strategi pemecahan masalah yang canggih yang tidak pernah bisa diungkap pendekatan terawasi.

Implikasi komputasi dari perubahan ini sangat besar. Berbeda dengan fase fine-tuning tradisional yang mengonsumsi sumber daya terbatas, RLVR membutuhkan siklus optimisasi yang ekstensif—menghabiskan anggaran komputasi yang awalnya dialokasikan untuk perluasan pra-pelatihan. Organisasi AI besar menyerap tuntutan luar biasa ini, menerima timeline pelatihan yang lebih lama demi peningkatan performa model secara substansial. Sebuah inovasi sekunder muncul dari perubahan ini: dimensi skala baru. Alih-alih mengukur kemampuan hanya melalui ukuran model, laboratorium menemukan mereka dapat memodulasi performa selama inferensi dengan mengontrol “waktu berpikir” komputasi—menghasilkan trajektori penalaran yang lebih panjang yang secara langsung berkorelasi dengan kualitas output.

Perubahan 2: Memahami Kecerdasan AI sebagai Makhluk Asing yang Fundamental

Untuk pertama kalinya di tahun 2025, komunitas riset AI mulai mengembangkan kerangka kerja matang untuk memahami kecerdasan buatan berdasarkan istilahnya sendiri daripada melalui analogi biologis. Kesalahan konseptual utama sebelumnya adalah memperlakukan model bahasa besar sebagai makhluk yang harus “dikembangkan dan dibesarkan,” padahal kenyataannya jauh lebih asing.

Perbedaan ini menjadi jelas melalui sebuah wawasan utama: jaringan neural manusia yang dioptimalkan selama ribuan tahun untuk kelangsungan suku di lingkungan hutan tidak sama dengan target optimisasi sistem AI. Sementara manusia menginternalisasi pola untuk navigasi sosial dan bertahan secara fisik, model bahasa besar dilatih untuk meniru teks manusia, memaksimalkan reward pemecahan masalah matematis, dan menavigasi mekanisme umpan balik berbasis persetujuan. Fungsi objektif yang secara fundamental berbeda ini menghasilkan entitas yang kecerdasannya menunjukkan karakteristik yang tidak mungkin dalam konteks biologis.

Pengakuan ini memunculkan apa yang bisa disebut “Kecerdasan Hantu” versus “Kecerdasan Gigi Gergaji seperti Hewan”—sebuah perbedaan puitis yang menangkap lanskap kemampuan yang bergerigi dan tak terduga. Model bahasa besar tidak berkembang secara mulus dalam meningkatkan kompetensi di berbagai domain seperti hewan. Sebaliknya, mereka menunjukkan tebing kemampuan dramatis di domain yang dapat diverifikasi (matematika, kode) sementara tetap secara mengejutkan tidak kompeten di bidang lain. Mereka bisa berfungsi sebagai otoritas yang berpengetahuan luas sekaligus siswa sekolah dasar yang bingung, berpotensi rentan terhadap ekstraksi informasi di bawah tekanan adversarial.

Implikasi untuk benchmarking terbukti sangat mengganggu. Karena benchmark mewakili lingkungan yang dapat diverifikasi, mereka menjadi target yang tak tertahankan untuk optimisasi berbasis RLVR. Tim AI menemukan mereka dapat merancang dataset pelatihan dalam ruang embedding yang ketat di sekitar kasus uji benchmark, secara efektif “menutup” metrik evaluasi dengan peningkatan kemampuan lokal. Kebenaran yang tidak nyaman muncul: benchmark saat ini tidak lagi mengukur kecerdasan buatan umum; mereka mengukur seberapa baik sistem dioptimalkan terhadap rangkaian pengujian tertentu.

Perubahan 3: Cursor Mengungkap Lapisan Tersembunyi dari Aplikasi AI

Di antara perkembangan paling diremehkan tahun 2025 adalah lonjakan eksplosif Cursor dan kejelasan konseptual yang diberikannya mengenai arsitektur aplikasi. Terobosan ini bukan terutama dari segi teknologi; melainkan dari segi organisasi. Ketika diskusi industri semakin membingkai peluang seputar “Cursor untuk domain X,” sebuah lapisan yang sebelumnya tak terlihat menjadi nyata.

Dalam pandangan yang muncul ini, model bahasa besar berfungsi sebagai komponen generalis yang membutuhkan orkestrasi besar. Aplikasi sukses seperti Cursor tidak sekadar membungkus panggilan API dalam antarmuka pengguna; mereka adalah sistem koordinasi yang canggih yang menumpuk berbagai fungsi di atas kemampuan model mentah. Aplikasi ini unggul dalam rekayasa konteks—menganalisis dokumen domain-spesifik, lingkungan pengguna, dan riwayat masalah untuk membangun prompt yang kaya informasi. Mereka mengorkestrasi rangkaian kompleks panggilan model bahasa menjadi grafik berarah tak siklus yang semakin canggih, menyeimbangkan kualitas performa terhadap biaya komputasi. Mereka mempertahankan mekanisme umpan balik manusia-di-loop di mana para ahli domain tetap terlibat dengan output sistem.

Mungkin yang paling inovatif, aplikasi yang sukses menerapkan pengatur penyesuaian otomatis—mekanisme yang memungkinkan pengguna untuk menukar tingkat otomatisasi, biaya, dan kualitas output secara real-time. Arsitektur yang muncul menempatkan platform model bahasa besar—API itu sendiri—sebagai pengembang kemampuan generalis, sementara lapisan aplikasi menjadi spesialis yang mengintegrasikan generalis ini ke dalam alur kerja profesional yang disesuaikan dengan domain vertikal tertentu.

Perubahan 4: Agen AI Kembali ke Lingkungan Eksekusi Lokal

Kemunculan Claude Code memantapkan sebuah debat penting dalam komunitas agen AI: di mana sistem cerdas seharusnya benar-benar berjalan? OpenAI telah melakukan penerapan cloud secara ekstensif, merancang lingkungan kontainer yang canggih yang diorkestrasi melalui infrastruktur backend ChatGPT. Daya tarik teoretisnya jelas—klaster agen yang berjalan di cloud tampaknya mewakili bentuk tertinggi dari kecerdasan buatan umum.

Namun Claude Code menunjukkan sebuah wawasan kontra: penerapan lokal mungkin sebenarnya merupakan strategi jangka pendek yang lebih unggul. Pemikiran ini terbukti pragmatis daripada filosofis. Sistem AI saat ini menunjukkan perkembangan kemampuan yang tidak merata; beberapa domain berperforma sangat baik sementara yang lain tertinggal jauh. Kemajuan menuju kecerdasan buatan umum yang komprehensif masih lambat. Dalam kondisi ini, menerapkan agen langsung di mesin lokal, terintegrasi secara mendalam dengan lingkungan kerja dan data pribadi pengembang, memungkinkan kolaborasi AI yang lebih praktis.

Terobosan khusus Claude Code terletak pada keanggunannya. Alih-alih muncul sebagai antarmuka web lain yang memerlukan autentikasi dan pergantian konteks, ia diimplementasikan sebagai alat baris perintah yang ringan dan akrab yang mengubah AI menjadi entitas komputasi yang persisten—seperti “sprite” atau “hantu” yang tinggal langsung di ruang kerja pengembang. Ini merepresentasikan paradigma interaksi manusia-AI yang benar-benar baru, menggeser AI dari layanan eksternal (seperti mengakses situs Google) menjadi kehadiran komputasi ambient yang terintegrasi secara mulus ke dalam alur kerja yang ada.

Perubahan 5: Vibe Coding Mendemokratisasi Pengembangan Perangkat Lunak

Pada tahun 2025, kecerdasan buatan melampaui ambang kemampuan kritis yang secara fundamental mengubah lanskap pemrograman. Kemunculan “Vibe Coding”—pemrograman melalui deskripsi berbahasa Inggris tanpa memerlukan pengetahuan mendalam tentang implementasi kode—terbukti transformatif baik secara konseptual maupun praktis.

Fenomena ini bertentangan dengan pola difusi teknologi sebelumnya. Secara historis, teknologi baru yang kuat memberikan keuntungan tidak proporsional kepada profesional terlatih, perusahaan, dan pemerintah. Large language models membalikkan dinamika ini. Orang biasa—yang tidak memiliki keahlian pemrograman khusus—mengambil lebih banyak manfaat dari AI daripada kelompok demografis lain. Vibe Coding mempercepat proses demokratisasi ini dengan menghilangkan kebutuhan pengetahuan teknis sebelumnya sama sekali.

Namun secara paradoks, Vibe Coding juga memberdayakan pengembang profesional untuk menyelesaikan pekerjaan yang “tidak akan pernah diimplementasikan sebaliknya.” Batasan-batasan berubah: pengembang dapat secara tiba-tiba membuat prototipe ide eksperimen dengan biaya hampir nol, mengimplementasikan alat khusus untuk kerentanan tertentu menggunakan kode buangan, atau membangun utilitas kustom menggunakan bahasa yang sebelumnya tidak mereka pelajari secara formal. Penulis menggunakan Vibe Coding untuk mengembangkan tokenizer BPE yang canggih dalam Rust tanpa keahlian bahasa tradisional atau ketergantungan perpustakaan—pekerjaan yang sebelumnya membutuhkan minggu, kini hanya beberapa jam dengan bantuan AI.

Lebih dalam lagi, perubahan ini menandai bahwa pengembangan perangkat lunak sedang berpindah dari domain profesional yang khusus menjadi media komputasi yang didemokratisasi. Batas karier menjadi kabur ketika siapa saja dapat menghasilkan kode fungsional melalui bahasa alami. Dinamika dasar ekosistem perangkat lunak berubah ketika kode bertransformasi dari kekayaan intelektual yang langka dan berharga menjadi bahan yang melimpah, dapat dibuang, dan dapat dimanipulasi.

Perubahan 6: Revolusi Antarmuka Grafis dalam Interaksi AI

Google Gemini Nano, yang secara informal disebut dalam komunitas AI sebagai “Nano Banana,” muncul sebagai inovasi paling disruptif tahun 2025—yang jauh melampaui kemampuan generasi gambar. Perkembangan ini mencerminkan sebuah kebenaran yang lebih besar: model bahasa besar mewakili paradigma komputasi fundamental berikutnya setelah revolusi mikrokomputer di tahun 1970-an dan 1980-an.

Preseden sejarah terbukti memberi petunjuk. Ketika komputasi beralih dari terminal dan antarmuka baris perintah ke komputer pribadi, perubahan revolusioner bukanlah dari segi kekuatan pemrosesan—melainkan dari segi modality interaksi. Sistem awal memaksa pengguna memasukkan perintah teks untuk menyelesaikan tugas. Antarmuka pengguna grafis (GUI) membayangkan kembali hubungan ini, menyadari bahwa meskipun teks adalah bentuk data paling primitif untuk komputer, itu adalah metode input informasi yang paling tidak disukai manusia. Manusia tidak suka membaca teks; itu secara kognitif mahal dan tidak efisien secara waktu. Pengolahan informasi visual dan spasial jauh lebih alami bagi persepsi manusia.

Model bahasa besar saat ini beroperasi dalam batasan yang secara struktural identik: mereka secara fundamental terbatas pada interaksi berbasis teks. Teks adalah media komputasi paling dasar tetapi paling asing bagi preferensi manusia. Sistem AI masa depan harus berkomunikasi melalui modality yang lebih disukai manusia—gambar, infografis, slide, papan tulis, animasi, video, aplikasi web, dan visualisasi interaktif.

Implementasi awal muncul melalui penyesuaian permukaan: format Markdown, emoji dekoratif, penekanan tipografi. Tetapi ini tetap solusi yang berpusat pada teks secara fundamental. Terobosan Nano Banana menunjukkan sesuatu yang berbeda secara kualitatif—integrasi canggih dari generasi teks, sintesis gambar, dan pengetahuan dunia yang tertanam yang memungkinkan komunikasi multimodal yang komprehensif. Terobosan utamanya tidak hanya bergantung pada kemampuan gambar; muncul dari sintesis terkoordinasi dari berbagai modality output yang terjalin dalam respons terpadu yang meniru cara manusia secara alami lebih suka menerima informasi.

Perubahan ini menandai arah evolusi antarmuka AI. Dalam beberapa tahun mendatang, kita harus mengharapkan sistem AI bertransisi dari “ngobrol dengan situs web AI” menuju lingkungan komunikasi yang kaya interaktif dan visual—secara fundamental membayangkan ulang interaksi manusia-AI dengan cara yang mengingatkan pada transformasi antarmuka grafis terhadap interaksi manusia-komputer beberapa dekade lalu.

Masa Depan yang Konvergen

Enam perubahan ini—dari pelatihan berbasis verifikasi RLVR hingga antarmuka multimodal Nano Banana—bukanlah inovasi yang terisolasi. Mereka adalah transformasi yang saling terkait yang secara kolektif menunjukkan evolusi AI dari domain aplikasi sempit menuju paradigma komputasi yang komprehensif. RLVR memungkinkan model dengan kemampuan penalaran kompleks; kerangka bentuk kecerdasan mencegah optimisasi yang salah arah; lapisan aplikasi seperti Cursor mengorkestrasi kemampuan; penerapan lokal membuat AI menjadi lebih akrab dan praktis; Vibe Coding mendemokratisasi implementasi; dan antarmuka grafis mengembalikan aspek manusia dalam interaksi.

Sepanjang tahun 2025, industri AI tidak hanya memperbaiki pendekatan yang ada. Ia secara fundamental merestrukturisasi cara model dilatih, diterapkan, dipahami, dan dialami. Perubahan ini akan terus bergema sepanjang 2026 dan seterusnya, membentuk ekosistem AI yang semakin tak dikenal dibandingkan awal 2020-an. Era komputasi berikutnya bukanlah sesuatu yang akan datang—ia sudah ada di sini, terlihat melalui enam perubahan paradigma yang transformatif ini.

SIX-0,61%
IN-1,87%
NANO1,03%
BANANA-1,49%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)