Bisakah AI Mengungguli Dokter dalam Diagnosis Medis? Studi Baru Mengeksplorasi Potensi dan Kendalanya

10

Di lingkungan ruang gawat darurat yang berisiko tinggi, kesalahan paling berbahaya yang dapat dilakukan seorang dokter bukanlah memilih pengobatan yang salah—tetapi gagal mengidentifikasi diagnosis yang benar. Sebuah studi baru-baru ini menunjukkan bahwa generasi baru Kecerdasan Buatan akan segera menjadi perlindungan penting terhadap pengawasan kritis ini.

Bangkitnya Model “Penalaran”.

Bidang medis berada di titik puncak pergeseran teknologi yang didorong oleh Model Bahasa Besar (LLM) yang canggih. Tidak seperti versi AI sebelumnya, “model penalaran” baru—seperti pratinjau o1 OpenAI—dirancang untuk memproses masalah kompleks melalui logika berurutan dan langkah demi langkah.

Lompatan teknologi ini memenuhi permintaan yang signifikan dari komunitas medis. Berdasarkan survei terhadap lebih dari 2.000 dokter, 1 dari 5 dokter dan perawat di seluruh dunia sudah menggunakan AI untuk mencari opini kedua mengenai kasus-kasus kompleks, dan lebih dari setengahnya menyatakan keinginan untuk mengintegrasikan AI lebih jauh ke dalam praktik mereka.

Studi: AI vs. Dokter Manusia

Sebuah studi yang dipimpin oleh ilmuwan data biomedis Universitas Harvard, Arjun Manrai, dan diterbitkan di Science, menguji kemampuan diagnostik model pratinjau o1 terhadap dokter manusia. Para peneliti menggunakan dua kumpulan data berbeda:
1. Kumpulan gejala pelatihan medis klasik.
2. Data dunia nyata dari 76 pasien yang dirawat di ruang gawat darurat Boston.

Hasilnya sangat mengejutkan: Model penalaran AI mengungguli dokter manusia dan perangkat lunak diagnostik khusus, dalam mengidentifikasi diagnosis dengan tepat (atau alternatif yang sangat akurat) di hampir 80% kasus.

Salah satu contoh penting yang diberikan oleh rekan penulis Adam Rodman melibatkan pasien transplantasi imunosupresi yang mengalami gejala pernapasan rutin. Meskipun dokter manusia mungkin tidak menyadari betapa parahnya situasi ini, model AI menandai kecurigaan adanya infeksi pemakan daging yang mengancam jiwa jauh lebih awal dibandingkan tim manusia.

Argumen Kontra: Logika vs. Nuansa

Meskipun terdapat angka-angka yang mengesankan, komunitas ilmiah tetap berhati-hati. Kritikus berpendapat bahwa ada perbedaan mendasar antara “penalaran komputasi” dan “penalaran klinis”.

“Saat kita mengatakan penalaran klinis, artinya tidak sama dengan penalaran moral,” Arya Rao, peneliti di Harvard Medical School memperingatkan.

Tim Rao baru-baru ini melakukan studi terpisah yang mengevaluasi 21 model AI, dan mengungkap kelemahan yang terus-menerus terjadi: ketidakmampuan menangani ketidakpastian. Meskipun model penalaran unggul dalam mengikuti jalur logis menuju suatu kesimpulan, model tersebut sering kali kesulitan dengan nuansa yang diperlukan ketika beberapa diagnosis dapat dilakukan.

Risiko utama yang diidentifikasi meliputi:
Penalaran “rapuh”: AI cenderung mengambil kesimpulan terlalu cepat.
Kurangnya nuansa: Model kesulitan ketika harus mempertimbangkan beberapa kemungkinan yang tidak pasti secara bersamaan.
Tidak adanya penilaian manusia: AI tidak memiliki alasan moral dan kontekstual yang penting untuk perawatan pasien yang kompleks.

Masa Depan: Asisten, Bukan Pengganti

Konsensus di antara para peneliti bukanlah bahwa AI harus menggantikan dokter, melainkan berfungsi sebagai perluasan diagnostik yang kuat. Tujuannya adalah menggunakan AI untuk menangkap hal-hal yang mungkin luput dari pandangan mata manusia, sehingga memberikan “jaring pengaman” bagi para dokter.

Seiring dengan semakin matangnya teknologi, fokusnya beralih dari apakah AI dapat mendiagnosis ke bagaimana AI dapat diintegrasikan dengan aman ke dalam alur kerja klinis. Jika dikelola dengan benar, teknologi ini dapat berfungsi sebagai “penyeimbang” yang memberikan dukungan diagnostik tingkat tinggi ke daerah-daerah dengan akses terbatas terhadap perawatan medis spesialis.


Kesimpulan
Meskipun model penalaran AI telah menunjukkan kemampuan unggul dalam mengidentifikasi diagnosis yang benar dalam studi terkontrol, model tersebut masih kesulitan menghadapi nuansa dan ketidakpastian yang melekat pada pengobatan manusia. Tantangan berikutnya bagi AI medis terletak pada uji klinis yang bertujuan untuk mengintegrasikan alat-alat ini sebagai asisten yang andal, bukan sebagai pengambil keputusan yang otonom.