Chatbot AI semakin dipromosikan sebagai masa depan layanan kesehatan, dengan beberapa sistem menunjukkan performa yang baik dalam ujian medis standar dan menawarkan saran berbasis gejala kepada pengguna. Namun, sebuah studi baru yang diterbitkan di Nature Medicine menunjukkan bahwa alat ini tidak hanya jauh dari menggantikan dokter, tetapi juga dapat menimbulkan risiko saat digunakan untuk panduan medis pribadi.
Penelitian tersebut, yang dipimpin oleh tim dari Universitas Oxford, mengidentifikasi adanya kesenjangan signifikan dalam model bahasa besar (LLMs). Meskipun sistem ini menunjukkan pengetahuan teknis yang kuat dan berkinerja baik dalam penilaian medis terstruktur, mereka mengalami kesulitan saat diminta membantu pengguna dengan masalah kesehatan nyata di dunia nyata. Menurut para peneliti, menerjemahkan pengetahuan teoretis menjadi saran medis yang aman dan praktis tetap menjadi tantangan besar.
Dr. Rebecca Payne, praktisi medis utama yang terlibat dalam studi ini, menyatakan bahwa meskipun antusiasme terhadap AI di bidang kesehatan semakin meningkat, teknologi ini belum siap untuk mengambil tanggung jawab seorang dokter. Dia memperingatkan bahwa mengandalkan model bahasa besar untuk analisis gejala bisa berbahaya, karena mereka mungkin memberikan diagnosis yang salah atau gagal mengenali situasi yang membutuhkan perhatian medis segera.
Pengujian Skala Besar Mengungkap Kelemahan Utama
Studi ini melibatkan 1.300 peserta yang menggunakan model AI yang dikembangkan oleh OpenAI, Meta, dan Cohere. Peserta diberikan skenario medis yang dibuat oleh dokter dan diminta agar sistem AI menyarankan langkah apa yang harus diambil untuk mengatasi kondisi yang dijelaskan.
Para peneliti menemukan bahwa saran yang dihasilkan AI tidak lebih dapat diandalkan daripada metode diagnosis mandiri tradisional, seperti pencarian online atau penilaian pribadi. Dalam banyak kasus, pengguna menerima campuran panduan yang akurat dan menyesatkan, sehingga sulit menentukan langkah selanjutnya yang tepat. Tantangan lain adalah komunikasi: peserta sering kesulitan memahami informasi apa yang dibutuhkan AI untuk menghasilkan rekomendasi yang akurat.
Dr. Payne menekankan bahwa diagnosis medis lebih dari sekadar mengingat fakta. Dia menjelaskan bahwa perawatan yang efektif memerlukan mendengarkan dengan saksama, mengajukan pertanyaan klarifikasi, menyelidiki gejala yang relevan, dan membimbing pasien melalui percakapan yang dinamis. Pasien sering kali tidak tahu detail mana yang penting secara medis, sehingga dokter harus secara aktif mengekstrak informasi penting tersebut. Studi ini menyimpulkan bahwa saat ini LLM belum mampu mengelola interaksi kompleks ini secara andal dengan non-ahli.
Peran Pendukung, Bukan Peran Klinis
Meskipun para peneliti memperingatkan agar tidak menggunakan chatbot AI sebagai penasihat medis, mereka tidak menolak teknologi ini sepenuhnya. Sebaliknya, mereka menyarankan bahwa AI dapat berperan sebagai pendukung dalam lingkungan layanan kesehatan. Dr. Payne mencatat bahwa LLM sangat berguna untuk merangkum dan mengatur informasi. Di lingkungan klinis, mereka sudah digunakan untuk menyalin konsultasi dan mengubahnya menjadi surat rujukan ke spesialis, lembar informasi pasien, atau catatan medis.
Tim tersebut menyimpulkan bahwa meskipun AI memiliki potensi dalam bidang kesehatan, saat ini belum layak untuk memberikan saran medis langsung. Mereka berpendapat bahwa kerangka evaluasi dan standar keselamatan yang lebih baik diperlukan sebelum sistem semacam ini dapat diintegrasikan secara bertanggung jawab ke dalam peran yang berhadapan langsung dengan pasien. Tujuan mereka bukan menolak AI dalam kedokteran, tetapi memastikan pengembangannya dilakukan dengan prioritas utama pada keselamatan pasien dan akurasi klinis.