Javascript must be enabled to continue!
Perbandingan Kinerja XGBoost dan IndoBERT untuk Klasifikasi Teks Kesehatan Bahasa Indonesia
View through CrossRef
Pertumbuhan pesat layanan kesehatan digital di Indonesia telah menghasilkan volume data tekstual yang masif. Data tanya jawab kesehatan, memberikan peluang yang signifikan untuk klasifikasi otomatis menggunakan machine learning. Namun, penerapannya dihadapkan pada dilema praktis antara memilih model machine learning klasik yang efisien atau mengadopsi model transformer modern yang akurat. Studi ini menguji trade-off tersebut dengan membandingkan Extreme Gradient Boosting (Xgboost) yang terkenal unggul dalam efisiensi, dengan Indonesia Bidirectional Encoder Representations from Transformers (IndoBERT) yang superior dalam pemahaman konteks bahasa. Kedua model dilatih dan dievaluasi pada dataset 10.000 data tanya jawab kesehatan bahasa Indonesia. Model XGBoost menggunakan vektorisasi TF-IDF, sementara model IndoBERT di-fine-tuning secara end-to-end. Kinerja keduanya dievaluasi menggunakan validasi silang 5-fold dengan metrik Akurasi, Presisi, Recall, F1-Score, dan efisiensi waktu. Hasil menunjukkan bahwa IndoBERT mencapai akurasi rata-rata lebih tinggi dibandingkan dengan XGBoost. Namun, keunggulan ini menuntut sumber daya lebih besar, di mana IndoBERT membutuhkan waktu pelatihan lebih lama dibandingkan XGBoost. Uji statistik paired t-test mengonfirmasi bahwa perbedaan kinerja akurasi ini signifikan secara statistik. Penelitian ini merumuskan sebuah kerangka keputusan praktis. IndoBERT unggul untuk aplikasi yang mengutamakan akurasi maksimal dengan sumber daya memadai, sementara XGBoost menawarkan efisien secara komputasi dan cepat untuk skenario real-time atau terbatas sumber daya dengan akurasi kompetitif.
Information Technology and Science (ITScience)
Title: Perbandingan Kinerja XGBoost dan IndoBERT untuk Klasifikasi Teks Kesehatan Bahasa Indonesia
Description:
Pertumbuhan pesat layanan kesehatan digital di Indonesia telah menghasilkan volume data tekstual yang masif.
Data tanya jawab kesehatan, memberikan peluang yang signifikan untuk klasifikasi otomatis menggunakan machine learning.
Namun, penerapannya dihadapkan pada dilema praktis antara memilih model machine learning klasik yang efisien atau mengadopsi model transformer modern yang akurat.
Studi ini menguji trade-off tersebut dengan membandingkan Extreme Gradient Boosting (Xgboost) yang terkenal unggul dalam efisiensi, dengan Indonesia Bidirectional Encoder Representations from Transformers (IndoBERT) yang superior dalam pemahaman konteks bahasa.
Kedua model dilatih dan dievaluasi pada dataset 10.
000 data tanya jawab kesehatan bahasa Indonesia.
Model XGBoost menggunakan vektorisasi TF-IDF, sementara model IndoBERT di-fine-tuning secara end-to-end.
Kinerja keduanya dievaluasi menggunakan validasi silang 5-fold dengan metrik Akurasi, Presisi, Recall, F1-Score, dan efisiensi waktu.
Hasil menunjukkan bahwa IndoBERT mencapai akurasi rata-rata lebih tinggi dibandingkan dengan XGBoost.
Namun, keunggulan ini menuntut sumber daya lebih besar, di mana IndoBERT membutuhkan waktu pelatihan lebih lama dibandingkan XGBoost.
Uji statistik paired t-test mengonfirmasi bahwa perbedaan kinerja akurasi ini signifikan secara statistik.
Penelitian ini merumuskan sebuah kerangka keputusan praktis.
IndoBERT unggul untuk aplikasi yang mengutamakan akurasi maksimal dengan sumber daya memadai, sementara XGBoost menawarkan efisien secara komputasi dan cepat untuk skenario real-time atau terbatas sumber daya dengan akurasi kompetitif.
Related Results
PERAN TATA KELOLA PERUSAHAAN DALAM MEMODERASI PENGARUH IMPLEMANTASI GREEN ACCOUNTING, CORPORATE SOCIAL RESPONSIBILITY DAN FIRM SIZE TERHADAP KINERJA KEUANGAN
PERAN TATA KELOLA PERUSAHAAN DALAM MEMODERASI PENGARUH IMPLEMANTASI GREEN ACCOUNTING, CORPORATE SOCIAL RESPONSIBILITY DAN FIRM SIZE TERHADAP KINERJA KEUANGAN
This study examines the role of corporate governance in moderating the influence of green accounting disclosure, corporate social responsibility (CSR), and firm size on the financi...
SISTEM RUJUKAN DALAM SISTEM PELAYANAN KESEHATAN MATERNAL PERINATAL DI INDONESIA
SISTEM RUJUKAN DALAM SISTEM PELAYANAN KESEHATAN MATERNAL PERINATAL DI INDONESIA
ABSTRAK
Kasus keterlambatan rujukan merupakan salah satu permasalahan utama terjadinya kematian ibu dan bayi di Indonesia. Kematian ibu dan bayi dapat diakibatkan pelayanan d...
Teks Prosedur pada Kemasan Produk Makanan dan Implikasinya terhadap Pembelajaran Bahasa Indonesia
Teks Prosedur pada Kemasan Produk Makanan dan Implikasinya terhadap Pembelajaran Bahasa Indonesia
Teks prosedur merupakan teks paparan yang bertujuan memberikan penjelasan tentang cara melakukan sesuatu. Teks ini sangat diperlukan oleh seseorang yang hendak melakukan suatu kegi...
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review Anna Tri Wahyuni1), Masfuri2), Liya Arista3)1,2,3 Fakultas Ilmu Keperawatan Univers...
PERSPEKTIF AKULTURASI NILAI BILINGUALISME BAHASA DI SITUBONDO
PERSPEKTIF AKULTURASI NILAI BILINGUALISME BAHASA DI SITUBONDO
Abstrak, Indonesia sebagai sebuah bangsa memiliki keragaman budaya dan bahasa yang sangat tinggi. Tingkat kemajemukan yang sangat tinggi ini tercermin dalamjumlahbahasa daerah yang...
PEMETAAN LANSKAP LINGUISTIK DI UNIVERSITAS AIRLANGGA SURABAYA
PEMETAAN LANSKAP LINGUISTIK DI UNIVERSITAS AIRLANGGA SURABAYA
Lanskap Linguistik ( LL) merujuk pada objek penggunaan bahasa di ruang publik. Menurut Landry and Bourhis (1997) yang termasuk dalam LL adalah bahasa di ruang-ruang publik seperti ...
Pemahaman Guru Bahasa Indonesia SMP, SMPIT, dan MTs tentang Pembelajaran Bahasa Indonesia di Kecamatan Sekongkang Kabupaten Sumbawa Barat
Pemahaman Guru Bahasa Indonesia SMP, SMPIT, dan MTs tentang Pembelajaran Bahasa Indonesia di Kecamatan Sekongkang Kabupaten Sumbawa Barat
Penelitian ini bertujuan untuk memperoleh informasi mengenai pemahaman guru bahasa indonesia SMP, SMPIT, dan MTs di Kecamatan Sekongkang Kabupaten Sumbawa Barat terhadap pembelajar...

