AI Menunjukkan Janji untuk Memprediksi Kesehatan Embrio Tanpa Tes Invasif

31 Oktober 2024 18:02
Penulis: Alamsyah, lifestyle
Aneuploidy embrio didefinisikan sebagai jumlah kromosom yang abnormal, yang merupakan penyebab utama kegagalan implantasi, kehilangan kehamilan, dan kelainan bawaan.

Sahabat.com - Sebuah studi terbaru yang diterbitkan di eClinicalMedicine mengevaluasi efektivitas algoritma kecerdasan buatan (AI) dalam memprediksi ploidy embrio secara non-invasif dari gambar embrio.

Apa Itu Aneuploidy Embrio?

Aneuploidy embrio didefinisikan sebagai jumlah kromosom yang abnormal, yang merupakan penyebab utama kegagalan implantasi, kehilangan kehamilan, dan kelainan bawaan. Dalam fertilisasi in vitro (IVF), tingkat aneuploidy berkisar antara 25% hingga 40% pada embrio tahap awal, dengan prevalensi yang meningkat seiring bertambahnya usia ibu. Meskipun tes genetik pra-implantasi untuk aneuploidy (PGT-A) dapat meningkatkan hasil IVF dengan menentukan ploidy embrio, metode ini mahal, invasif, dan terbatas oleh kendala etika serta hukum, sehingga mengurangi aksesibilitasnya.

AI, melalui model pembelajaran mesin dan pembelajaran mendalam, menunjukkan potensi dalam memprediksi ploidy embrio dengan akurasi. Namun, penelitian lebih lanjut diperlukan untuk meningkatkan keandalan prediksi dan aplikasi klinis metode ini.

Tentang Studi Ini

Studi ini terdaftar di International Prospective Register of Systematic Reviews (PROSPERO) dan mengikuti pedoman pelaporan Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) serta Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies (CHARMS).

Pencarian literatur yang komprehensif dilakukan melalui berbagai database, termasuk PubMed, MEDLINE, Embase, IEEE, SCOPUS, Web of Science, dan Cochrane Central Register. Pencarian ini mengidentifikasi studi tentang algoritma AI yang dikembangkan untuk menilai ploidy embrio manusia dari citra medis.

Strategi pencarian mencakup istilah terkait AI, tes genetik, dan kelainan kromosom. Studi yang diterbitkan hingga 10 Agustus 2024 memenuhi syarat jika melaporkan hasil diagnostik seperti sensitivitas, spesifisitas, dan nilai prediktif, atau memuat data kontingensi 2x2 yang relevan.

Dua penilai independen menyaring artikel, dan jika terdapat perbedaan, penilaian dilakukan oleh penilai ketiga. Studi yang tidak menggunakan model AI atau menggunakan sampel non-manusia, duplikasi, serta berbagai jenis publikasi seperti editorial, dikecualikan dari analisis.

Data diekstrak secara sistematis oleh dua penilai menggunakan formulir standar untuk memastikan akurasi. Metrik diagnostik seperti sensitivitas dan spesifisitas dihitung dari tabel kontingensi yang tersedia.

Penilaian kualitas dilakukan dengan menggunakan kriteria quality assessment of diagnostic accuracy studies for artificial intelligence (QUADAS-AI), di mana potensi bias dan aplikabilitas dievaluasi, dan perbedaan diselesaikan oleh penilai ketiga. Ukuran hasil utama, termasuk sensitivitas (Se), spesifisitas (Sp), dan area di bawah kurva (AUC) dianalisis melalui kurva karakteristik penerima operasi (ROC) dan model efek acak bivariate.

Temuan Studi

Pencarian awal menghasilkan 4.774 catatan, di mana 1.543 di antaranya merupakan duplikasi. Penyaringan judul dan abstrak mengeluarkan 2.837 studi, menyisakan 65 studi untuk ditinjau secara lengkap.

Akhirnya, 20 studi memenuhi kriteria inklusi, dengan 12 di antaranya menyediakan data yang cukup untuk meta-analisis. Enam belas studi bersifat retrospektif, dua bersifat prospektif dengan evaluasi model AI double-blind, dan dua tidak menentukan desain penelitian. Tidak ada studi yang menggunakan citra akses terbuka, delapan studi mengecualikan citra berkualitas rendah, dan dua belas studi tidak membahas faktor ini.

Validasi eksternal dengan dataset non-sampel dilakukan pada tujuh studi. Sepuluh studi menggunakan pembelajaran mendalam (DL), lima menggunakan pembelajaran mesin (ML), dan lima menggunakan kedua metode.

Sistem pendukung keputusan (DSS) yang didorong oleh AI diklasifikasikan ke dalam kategori black-box, matte-box, dan glass-box dalam empat, lima, dan lima studi, berturut-turut. Empat studi menggunakan model black- atau matte-box, sedangkan dua menggunakan matte- atau glass-box.

Kinerja diagnostik gabungan algoritma AI menunjukkan Se sebesar 0,67, Sp sebesar 0,58, dan AUC sebesar 0,67. Memilih tabel kontingensi dengan akurasi tertinggi di antara studi meningkatkan Se dan Sp menjadi 0,71 dan 0,75, masing-masing, dengan AUC sebesar 0,80. Analisis utilitas klinis melalui nomogram Fagan menunjukkan nilai prediktif positif 71% dan nilai prediktif negatif 75%, dengan asumsi prevalensi embrio euploid sebesar 46%.

Kualitas studi dinilai menggunakan alat QUADAS-AI, yang menunjukkan risiko bias tinggi atau tidak jelas dalam pemilihan pasien untuk 19 studi, terutama karena keterbatasan data open-source dan kurangnya validasi eksternal yang ketat. Analisis heterogenitas mengungkapkan variabilitas signifikan, dengan indeks inkonsistensi (I²) sebesar 97,7% untuk Se dan 92,2% untuk Sp. Efek ambang berkontribusi pada heterogenitas ini, dengan variasi dalam nilai cutoff diagnostik untuk embrio euploid.

Meta-regresi mengidentifikasi faktor-faktor yang mempengaruhi heterogenitas, termasuk jenis algoritma AI, kategori DSS, metode anotasi, validasi eksternal, risiko bias, usia ibu, ukuran sampel, dan tahun publikasi. Se dan Sp menunjukkan korelasi negatif, yang sering diamati dalam studi akurasi diagnostik. Plot corong Deek tidak menunjukkan bukti bias publikasi.

Analisis subkelompok menunjukkan bahwa model DL memiliki AUC yang lebih tinggi dibandingkan model ML, yaitu 0,71 dan 0,63, masing-masing. Studi yang menggabungkan data citra dan klinis menunjukkan kinerja yang lebih baik, dengan AUC sebesar 0,71 dibandingkan 0,62.

Validasi eksternal, risiko bias yang lebih rendah, inklusi usia ibu, dan ukuran sampel yang lebih besar berpengaruh positif terhadap hasil model. Studi yang lebih baru juga terkait dengan spesifisitas dan AUC yang lebih tinggi, menunjukkan peningkatan akurasi model AI seiring waktu.

Meskipun PGT-A banyak digunakan untuk meningkatkan hasil kehamilan dengan mendeteksi kelainan kromosom, invasivitasnya meningkatkan risiko komplikasi tertentu, termasuk preeklampsia dan plasenta previa, dengan manfaat terbatas pada tingkat kehamilan atau kelahiran hidup. Oleh karena itu, penting untuk mengembangkan metode prediksi ploidy yang dapat diandalkan dan non-invasif.

AI, yang sudah diterapkan di berbagai bidang klinis, memiliki potensi untuk mendukung penilaian embrio dalam reproduksi berbantu. Namun, model AI yang ada untuk prediksi ploidy masih kurang akurat untuk menggantikan PGT-A dan seharusnya berfungsi sebagai alat bantu dalam pemilihan embrio.

0 Komentar

Berita Terkait

Leave a comment