Javascript must be enabled to continue!

Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang

Serangan smishing (SMS phishing) menghadapi tantangan mendasar dalam deteksi berbasis machine learning akibat ketidakseimbangan distribusi kelas pada dataset dunia nyata, di mana instance kelas minoritas (smishing) justru paling kritis untuk diidentifikasi. Penelitian ini mengusulkan sebuah framework robust yang mengoptimasi Linear Support Vector Machine (SVM) dengan strategi hybrid sampling tiga tingkat untuk klasifikasi multi-kelas pada kondisi data tidak seimbang. Framework yang dikembangkan mengintegrasikan ekstraksi fitur hibrida TF-IDF dan meta-features dengan strategi penanganan ketidakseimbangan data yang komprehensif, yang meliputi Random Oversampling (ROS) untuk kelas minoritas, Random Undersampling (RUS) untuk kelas mayoritas, dan Embedding MixUp untuk augmentasi data level embedding. Optimasi parameter melalui GridSearchCV dengan validasi 5-fold berhasil menentukan konfigurasi optimal SVM Linear (C=0.5). Hasil evaluasi pada test set mendemonstrasikan kemampuan klasifikasi yang tinggi dan seimbang, dengan pencapaian akurasi 96,7% dan F1-macro 87,6%. Kinerja yang konsisten merata pada semua kelas ini tercermin dari recall smishing 84% sambil mempertahankan recall ham 99%. Temuan ini menegaskan bahwa kombinasi Linear SVM dan strategi hybrid sampling berhasil menghasilkan model deteksi smishing yang robust, seimbang, dan siap diimplementasikan dalam skenario dunia nyata.

Universitas Budi Darma

Anggun Vannia Muljono

Jurnal Sistem Komputer dan Informatika (JSON)

2026

Title: Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang

Description:

Penelitian ini mengusulkan sebuah framework robust yang mengoptimasi Linear Support Vector Machine (SVM) dengan strategi hybrid sampling tiga tingkat untuk klasifikasi multi-kelas pada kondisi data tidak seimbang.

Framework yang dikembangkan mengintegrasikan ekstraksi fitur hibrida TF-IDF dan meta-features dengan strategi penanganan ketidakseimbangan data yang komprehensif, yang meliputi Random Oversampling (ROS) untuk kelas minoritas, Random Undersampling (RUS) untuk kelas mayoritas, dan Embedding MixUp untuk augmentasi data level embedding.

Optimasi parameter melalui GridSearchCV dengan validasi 5-fold berhasil menentukan konfigurasi optimal SVM Linear (C=0.

5).

Hasil evaluasi pada test set mendemonstrasikan kemampuan klasifikasi yang tinggi dan seimbang, dengan pencapaian akurasi 96,7% dan F1-macro 87,6%.

Kinerja yang konsisten merata pada semua kelas ini tercermin dari recall smishing 84% sambil mempertahankan recall ham 99%.

Temuan ini menegaskan bahwa kombinasi Linear SVM dan strategi hybrid sampling berhasil menghasilkan model deteksi smishing yang robust, seimbang, dan siap diimplementasikan dalam skenario dunia nyata.

Back

Abstract This study delves into the escalating issue of Smishing, an emerging menace within the information security landscape spurred by the widespread use of text message...

Deteksi Serangan pada Jaringan IoT Menggunakan Seleksi Fitur Gabungan dan Optimasi Bayesian

Deteksi serangan berbasis machine learning (ML) berpotensi menjadi alternatif terbaik dalam penanganan ancaman siber pada jaringan internet of things (IoT). Metode ini memiliki kem...

SISTEM INFORMASI SEBAGAI KEILMUAN YANG MULTIDISIPLINER

Saat ini, dibandingkan dengan negara sekitar, di manakah posisi Indonesia? Tepat sesaat sebelum pandemi, World bank mengkategorikan Indonesia pada posisi upper middle income dan PB...

Pengaruh Model Contextual Teaching and Learning Terhadap Kesadaran Metakognisi Dan Hasil Belajar Siswa Pada Materi Larutan Penyangga

Tujuan penelitian ini adalah untuk mengetahui pengaruh model Contextual Teaching and Learning terhadap kesadaran metakognisi dan hasil belajar siswa pada materi larutan penyangga. ...

HUBUNGAN PENGETAHUAN GIZI SEIMBANG DENGAN PERILAKU GIZI SEIMBANG PADA MAHASISWA TINGKAT 1

Latar Belakang: Perilaku gizi seimbang akan mempengaruhi status gizi pada setiap individu status gizi seseorang dapat dukur melalui pengukuran antropometri. Setiap individu di duni...

Bayes' Theorem for Multi-Bearing Faults Diagnosis

During the process of fault diagnosis for automated machinery, support vector machines is one of the suitable choices to categorize multiple faults for machinery. Regardless of the...

DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR

DAFTAR PUSTAKAAditama, M. H. R., & Selfiardy, S. (2022). Kehidupan Mahasiswa Kuliah Sambil Bekerja di Masa Pandemi Covid-19. Kidspedia: Jurnal Pendidikan Anak Usia Dini, 3(...

DETEKSI DINI KANKER PAYUDARA DENGAN SADARI DI PMB UMMAQU BANJARBARU TAHUN 2024

Kanker payudara merupakan salah satu jenis kanker yang paling banyak menyerang wanita di seluruh dunia, termasuk di Indonesia. Deteksi dini kanker payudara terbukti dapat meningkat...

Email:
Password:

Email:

Optimasi Linear Support Vector Machine untuk Deteksi Smishing Multi-Kelas pada Dataset Tidak Seimbang

Related Results