Javascript must be enabled to continue!
Optimasi Data Tidak Seimbang pada Interaksi Drug Target dengan Sampling dan Ensemble Support Vector Machine
View through CrossRef
<p>Data tidak seimbang menjadi salah satu masalah yang muncul pada masalah prediksi atau klasifikasi. Penelitian ini memfokuskan untuk mengatasi masalah data tidak seimbang pada prediksi <em>drug-target interaction</em> (interaksi senyawa-protein). Ada banyak protein target dan senyawa obat yang terdapat pada basis data interaksi senyawa-protein yang belum divalidasi interaksinya secara eksperimen. Belum diketahuinya interaksi antar senyawa dan target tersebut membuat proporsi antara data yang diketahui interaksinya dan yang belum dikethui menjadi tidak seimbang. Data interaksi yang sangat tidak seimbang dapat menyebabkan hasil prediksi menjadi bias. Terdapat banyak cara untuk mengatasi data tidak seimbang ini, namun pada penelitian ini diimplementasikan metode yang menggabungkan <em>Biased Support Vector Machine</em> (BSVM), <em>oversampling, </em>dan <em>undersampling</em> dengan <em>Ensemble Support Vector Machine</em> (SVM). Penelitian ini mengeksplorasi efek sampling yang digabungkan dalam metode tersebut pada data interaksi senyawa-protein. Metode ini sudah diuji pada dataset <em>Nuclear Receptor,</em> <em>G-Protein Coupled Receptor</em> dan <em>Ion Channel </em>dengan rasio ketidakseimbangannya sebesar 14.6%, 32.36%, dan 28.2%. Hasil pengujian dengan menggunakan ketiga dataset tersebut menunjukkan nilai <em>area under curve</em> (AUC) secara berturut-turut sebesar 63.4%, 71.4%, 61.3% dan F-measure sebesar 54%, 60.7% dan 39%. Nilai akurasi dari metode yang digunakan masih terbilang cukup baik, walaupun nilai tersebut lebih kecil dari metode SVM tanpa perlakuan apapun. Nilai tersebut <em>bias</em> karena nilai AUC dan F-measure ternyata lebih kecil. Hal ini membuktikan bahwa metode yang diusulkan dapat menurunkan tingkat bias pada data tidak seimbang yang diuji dan meningkatkan nilai AUC dan f-measure sekitar 5%-20%.</p><p> </p><p><em><strong>Abstract</strong></em></p><p><em>Imbalanced data </em><em>has been one of the problems that arise in processing data. This research is focusing on handling imbalanced data problem for </em><em>drug-target</em><em> </em><em>(compound-protein) interaction data. There are many target protein and drug compound existed in compound-protein interaction databases, which many interactions are not validated yet by experiment. This unknown</em><em> interaction led drug target interaction to become imbalanced data. A really imbalanced data may cause bias to prediction result. There are many ways of handling imbalanced data, but this research implemented some methods such as BSVM, oversampling, undersampling with SVM ensemble. These method already solve the imbalanced data problem on other kind of data like image data. This research is focusing on exploration of effect on the sampling that used in these method for </em><em>compound-protein</em><em> interaction data. This method had been tested on </em><em>compound-protein</em><em> interaction Nuclear Receptor, GPCR</em> <em>and Ion Channel with 14.6%, 32.36% and 28.2% of imbalance ratio. The evaluation result using these three dataset show the value of AUC respectively 63.4%, 71.4%, 61.3% and F-measure of 54%, 60.7% and 39%. The score from this method is quite good, even though the score of accuracy and precision is smaller than the SVM. The value is bias because the AUC and F-measure score is smaller. This proves that the proposed method could reduce the bias rate in the evaluated imbalanced data and increase AUC and f-measure score from 5% to 20%.</em></p><p><em><strong><br /></strong></em></p>
Fakultas Ilmu Komputer Universitas Brawijaya
Title: Optimasi Data Tidak Seimbang pada Interaksi Drug Target dengan Sampling dan Ensemble Support Vector Machine
Description:
<p>Data tidak seimbang menjadi salah satu masalah yang muncul pada masalah prediksi atau klasifikasi.
Penelitian ini memfokuskan untuk mengatasi masalah data tidak seimbang pada prediksi <em>drug-target interaction</em> (interaksi senyawa-protein).
Ada banyak protein target dan senyawa obat yang terdapat pada basis data interaksi senyawa-protein yang belum divalidasi interaksinya secara eksperimen.
Belum diketahuinya interaksi antar senyawa dan target tersebut membuat proporsi antara data yang diketahui interaksinya dan yang belum dikethui menjadi tidak seimbang.
Data interaksi yang sangat tidak seimbang dapat menyebabkan hasil prediksi menjadi bias.
Terdapat banyak cara untuk mengatasi data tidak seimbang ini, namun pada penelitian ini diimplementasikan metode yang menggabungkan <em>Biased Support Vector Machine</em> (BSVM), <em>oversampling, </em>dan <em>undersampling</em> dengan <em>Ensemble Support Vector Machine</em> (SVM).
Penelitian ini mengeksplorasi efek sampling yang digabungkan dalam metode tersebut pada data interaksi senyawa-protein.
Metode ini sudah diuji pada dataset <em>Nuclear Receptor,</em> <em>G-Protein Coupled Receptor</em> dan <em>Ion Channel </em>dengan rasio ketidakseimbangannya sebesar 14.
6%, 32.
36%, dan 28.
2%.
Hasil pengujian dengan menggunakan ketiga dataset tersebut menunjukkan nilai <em>area under curve</em> (AUC) secara berturut-turut sebesar 63.
4%, 71.
4%, 61.
3% dan F-measure sebesar 54%, 60.
7% dan 39%.
Nilai akurasi dari metode yang digunakan masih terbilang cukup baik, walaupun nilai tersebut lebih kecil dari metode SVM tanpa perlakuan apapun.
Nilai tersebut <em>bias</em> karena nilai AUC dan F-measure ternyata lebih kecil.
Hal ini membuktikan bahwa metode yang diusulkan dapat menurunkan tingkat bias pada data tidak seimbang yang diuji dan meningkatkan nilai AUC dan f-measure sekitar 5%-20%.
</p><p> </p><p><em><strong>Abstract</strong></em></p><p><em>Imbalanced data </em><em>has been one of the problems that arise in processing data.
This research is focusing on handling imbalanced data problem for </em><em>drug-target</em><em> </em><em>(compound-protein) interaction data.
There are many target protein and drug compound existed in compound-protein interaction databases, which many interactions are not validated yet by experiment.
This unknown</em><em> interaction led drug target interaction to become imbalanced data.
A really imbalanced data may cause bias to prediction result.
There are many ways of handling imbalanced data, but this research implemented some methods such as BSVM, oversampling, undersampling with SVM ensemble.
These method already solve the imbalanced data problem on other kind of data like image data.
This research is focusing on exploration of effect on the sampling that used in these method for </em><em>compound-protein</em><em> interaction data.
This method had been tested on </em><em>compound-protein</em><em> interaction Nuclear Receptor, GPCR</em> <em>and Ion Channel with 14.
6%, 32.
36% and 28.
2% of imbalance ratio.
The evaluation result using these three dataset show the value of AUC respectively 63.
4%, 71.
4%, 61.
3% and F-measure of 54%, 60.
7% and 39%.
The score from this method is quite good, even though the score of accuracy and precision is smaller than the SVM.
The value is bias because the AUC and F-measure score is smaller.
This proves that the proposed method could reduce the bias rate in the evaluated imbalanced data and increase AUC and f-measure score from 5% to 20%.
</em></p><p><em><strong><br /></strong></em></p>.
Related Results
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review Anna Tri Wahyuni1), Masfuri2), Liya Arista3)1,2,3 Fakultas Ilmu Keperawatan Univers...
Selection of Injectable Drug Product Composition using Machine Learning Models (Preprint)
Selection of Injectable Drug Product Composition using Machine Learning Models (Preprint)
BACKGROUND
As of July 2020, a Web of Science search of “machine learning (ML)” nested within the search of “pharmacokinetics or pharmacodynamics” yielded over 100...
Study Of Drug Interaction in Diabetes Mellitus Therapy at the Inpatient Installation of Al Islam Hospital Bandung
Study Of Drug Interaction in Diabetes Mellitus Therapy at the Inpatient Installation of Al Islam Hospital Bandung
The patient's clinical outcome can be influenced by drug related problems, one of which is drug interactions, because the more complex the therapy carried out, it will be in line ...
DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR
DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR
DAFTAR PUSTAKAAditama, M. H. R., & Selfiardy, S. (2022). Kehidupan Mahasiswa Kuliah Sambil Bekerja di Masa Pandemi Covid-19. Kidspedia: Jurnal Pendidikan Anak Usia Dini, 3(...
SOSIALISASI PEDOMAN GIZI SEIMBANG 2014 BAGI GURU SD N 05 JOHAR BARU
SOSIALISASI PEDOMAN GIZI SEIMBANG 2014 BAGI GURU SD N 05 JOHAR BARU
Pedoman Gizi Seimbang telah dikenalkan dan disosialisasikan kepada masyarakat lebih dari 15 tahun lalu akan tetapi masih banyak masyarakat di Indonesia yang tidak mengetahui Pedoma...
PENINGKATAN PENGETAHUAN GIZI SEIMBANG SEBAGAI PEDOMAN HIDUP SEHAT PADA MASYARAKAT DI KELURAHAN JATIBENING
PENINGKATAN PENGETAHUAN GIZI SEIMBANG SEBAGAI PEDOMAN HIDUP SEHAT PADA MASYARAKAT DI KELURAHAN JATIBENING
Pendahuluan: Sehat jasmani merupakan impian semua orang. Untuk mendapatkan jasmani yang sehat diperlukan asupan makanan yang sehat dan gizi seimbang. Gizi seimbang adalah dimana su...
Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang
Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang
Serangan smishing (SMS phishing) menghadapi tantangan mendasar dalam deteksi berbasis machine learning akibat ketidakseimbangan distribusi kelas pada dataset dunia nyata, di mana i...

