Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang

View through CrossRef
Serangan smishing (SMS phishing) menghadapi tantangan mendasar dalam deteksi berbasis machine learning akibat ketidakseimbangan distribusi kelas pada dataset dunia nyata, di mana instance kelas minoritas (smishing) justru paling kritis untuk diidentifikasi. Penelitian ini mengusulkan sebuah framework robust yang mengoptimasi Linear Support Vector Machine (SVM) dengan strategi hybrid sampling tiga tingkat untuk klasifikasi multi-kelas pada kondisi data tidak seimbang. Framework yang dikembangkan mengintegrasikan ekstraksi fitur hibrida TF-IDF dan meta-features dengan strategi penanganan ketidakseimbangan data yang komprehensif, yang meliputi Random Oversampling (ROS) untuk kelas minoritas, Random Undersampling (RUS) untuk kelas mayoritas, dan Embedding MixUp untuk augmentasi data level embedding. Optimasi parameter melalui GridSearchCV dengan validasi 5-fold berhasil menentukan konfigurasi optimal SVM Linear (C=0.5). Hasil evaluasi pada test set mendemonstrasikan kemampuan klasifikasi yang tinggi dan seimbang, dengan pencapaian akurasi 96,7% dan F1-macro 87,6%. Kinerja yang konsisten merata pada semua kelas ini tercermin dari recall smishing 84% sambil mempertahankan recall ham 99%. Temuan ini menegaskan bahwa kombinasi Linear SVM dan strategi hybrid sampling  berhasil menghasilkan model deteksi smishing yang robust, seimbang, dan siap diimplementasikan dalam skenario dunia nyata.
Title: Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang
Description:
Serangan smishing (SMS phishing) menghadapi tantangan mendasar dalam deteksi berbasis machine learning akibat ketidakseimbangan distribusi kelas pada dataset dunia nyata, di mana instance kelas minoritas (smishing) justru paling kritis untuk diidentifikasi.
Penelitian ini mengusulkan sebuah framework robust yang mengoptimasi Linear Support Vector Machine (SVM) dengan strategi hybrid sampling tiga tingkat untuk klasifikasi multi-kelas pada kondisi data tidak seimbang.
Framework yang dikembangkan mengintegrasikan ekstraksi fitur hibrida TF-IDF dan meta-features dengan strategi penanganan ketidakseimbangan data yang komprehensif, yang meliputi Random Oversampling (ROS) untuk kelas minoritas, Random Undersampling (RUS) untuk kelas mayoritas, dan Embedding MixUp untuk augmentasi data level embedding.
Optimasi parameter melalui GridSearchCV dengan validasi 5-fold berhasil menentukan konfigurasi optimal SVM Linear (C=0.
5).
Hasil evaluasi pada test set mendemonstrasikan kemampuan klasifikasi yang tinggi dan seimbang, dengan pencapaian akurasi 96,7% dan F1-macro 87,6%.
 Kinerja yang konsisten merata pada semua kelas ini tercermin dari recall smishing 84% sambil mempertahankan recall ham 99%.
Temuan ini menegaskan bahwa kombinasi Linear SVM dan strategi hybrid sampling  berhasil menghasilkan model deteksi smishing yang robust, seimbang, dan siap diimplementasikan dalam skenario dunia nyata.

Related Results

Automatic Smishing Detection System with Feedback Loops
Automatic Smishing Detection System with Feedback Loops
Abstract This study delves into the escalating issue of Smishing, an emerging menace within the information security landscape spurred by the widespread use of text message...
Deteksi Serangan pada Jaringan IoT Menggunakan Seleksi Fitur Gabungan dan Optimasi Bayesian
Deteksi Serangan pada Jaringan IoT Menggunakan Seleksi Fitur Gabungan dan Optimasi Bayesian
Deteksi serangan berbasis machine learning (ML) berpotensi menjadi alternatif terbaik dalam penanganan ancaman siber pada jaringan internet of things (IoT). Metode ini memiliki kem...
SISTEM INFORMASI SEBAGAI KEILMUAN YANG MULTIDISIPLINER
SISTEM INFORMASI SEBAGAI KEILMUAN YANG MULTIDISIPLINER
Saat ini, dibandingkan dengan negara sekitar, di manakah posisi Indonesia? Tepat sesaat sebelum pandemi, World bank mengkategorikan Indonesia pada posisi upper middle income dan PB...
Pengaruh Model Contextual Teaching and Learning Terhadap Kesadaran Metakognisi Dan Hasil Belajar Siswa Pada Materi Larutan Penyangga
Pengaruh Model Contextual Teaching and Learning Terhadap Kesadaran Metakognisi Dan Hasil Belajar Siswa Pada Materi Larutan Penyangga
Tujuan penelitian ini adalah untuk mengetahui pengaruh model Contextual Teaching and Learning terhadap kesadaran metakognisi dan hasil belajar siswa pada materi larutan penyangga. ...
HUBUNGAN PENGETAHUAN GIZI SEIMBANG DENGAN PERILAKU GIZI SEIMBANG PADA MAHASISWA TINGKAT 1
HUBUNGAN PENGETAHUAN GIZI SEIMBANG DENGAN PERILAKU GIZI SEIMBANG PADA MAHASISWA TINGKAT 1
Latar Belakang: Perilaku gizi seimbang akan mempengaruhi status gizi pada setiap individu status gizi seseorang dapat dukur melalui pengukuran antropometri. Setiap individu di duni...
Bayes' Theorem for Multi-Bearing Faults Diagnosis
Bayes' Theorem for Multi-Bearing Faults Diagnosis
During the process of fault diagnosis for automated machinery, support vector machines is one of the suitable choices to categorize multiple faults for machinery. Regardless of the...
DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR
DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR
DAFTAR PUSTAKAAditama, M. H. R., & Selfiardy, S. (2022). Kehidupan Mahasiswa Kuliah Sambil Bekerja di Masa Pandemi Covid-19. Kidspedia: Jurnal Pendidikan Anak Usia Dini, 3(...
DETEKSI DINI KANKER PAYUDARA DENGAN SADARI DI PMB UMMAQU BANJARBARU TAHUN 2024
DETEKSI DINI KANKER PAYUDARA DENGAN SADARI DI PMB UMMAQU BANJARBARU TAHUN 2024
Kanker payudara merupakan salah satu jenis kanker yang paling banyak menyerang wanita di seluruh dunia, termasuk di Indonesia. Deteksi dini kanker payudara terbukti dapat meningkat...

Back to Top