Javascript must be enabled to continue!

Optimasi algoritma deteksi spam email dengan BERT-MI dan jaringan dense

Deteksi email spam merupakan tantangan penting dalam menjaga keamanan dan efisiensi komunikasi digital. Penelitian ini mengusulkan dan mengevaluasi sebuah pipeline yang dioptimalkan untuk deteksi email spam dengan mengintegrasikan Bidirectional Encoder Representations from Transformers (BERT) untuk ekstraksi fitur, seleksi fitur menggunakan Mutual Information (MI) untuk mereduksi dimensi, dan jaringan saraf dense untuk klasifikasi. Dataset Lingspam, yang terdiri dari 2893 email (2412 ham dan 481 spam), digunakan dalam eksperimen dengan pembagian 80% data pelatihan dan 20% data pengujian. Fitur teks diekstraksi menggunakan BERT (bert-base-uncased), menghasilkan embedding 768 dimensi yang kemudian direduksi menjadi 200 fitur paling relevan menggunakan MI. Model jaringan saraf dense dengan arsitektur 256-128-64-32-1 neuron dilatih menggunakan optimizer Adam, fungsi loss binary cross-entropy, dan teknik early stopping serta class weights untuk menangani ketidakseimbangan kelas. Hasil evaluasi pada data pengujian menunjukkan performa yang sangat tinggi dengan akurasi 99.14%, presisi 0.9596, recall 0.9896, F1-score 0.9744, dan ROC-AUC 0.9995. Pendekatan ini menunjukkan bahwa kombinasi BERT-MI dengan jaringan dense mampu mencapai akurasi yang sebanding dengan metode yang lebih kompleks, namun dengan potensi arsitektur yang lebih sederhana dan efisien.

LPPM Universitas Muhammadiyah Riau

Florentina Yuni Arini

Jurnal CoSciTech (Computer Science and Information Technology)

2025

Title: Optimasi algoritma deteksi spam email dengan BERT-MI dan jaringan dense

Description:

Deteksi email spam merupakan tantangan penting dalam menjaga keamanan dan efisiensi komunikasi digital.

Penelitian ini mengusulkan dan mengevaluasi sebuah pipeline yang dioptimalkan untuk deteksi email spam dengan mengintegrasikan Bidirectional Encoder Representations from Transformers (BERT) untuk ekstraksi fitur, seleksi fitur menggunakan Mutual Information (MI) untuk mereduksi dimensi, dan jaringan saraf dense untuk klasifikasi.

Dataset Lingspam, yang terdiri dari 2893 email (2412 ham dan 481 spam), digunakan dalam eksperimen dengan pembagian 80% data pelatihan dan 20% data pengujian.

Fitur teks diekstraksi menggunakan BERT (bert-base-uncased), menghasilkan embedding 768 dimensi yang kemudian direduksi menjadi 200 fitur paling relevan menggunakan MI.

Model jaringan saraf dense dengan arsitektur 256-128-64-32-1 neuron dilatih menggunakan optimizer Adam, fungsi loss binary cross-entropy, dan teknik early stopping serta class weights untuk menangani ketidakseimbangan kelas.

Hasil evaluasi pada data pengujian menunjukkan performa yang sangat tinggi dengan akurasi 99.

14%, presisi 0.

9596, recall 0.

9896, F1-score 0.

9744, dan ROC-AUC 0.

9995.

Pendekatan ini menunjukkan bahwa kombinasi BERT-MI dengan jaringan dense mampu mencapai akurasi yang sebanding dengan metode yang lebih kompleks, namun dengan potensi arsitektur yang lebih sederhana dan efisien.

Back

Optimasi adalah hal penting dalam suatu algoritma. Ini dapat menghemat kebutuhan dalam suatu kegiatan. Pada Minimum Spanning Tree, yang ingin dicapai adalah bagaimana semua vertexs...

Spam Review Detection Techniques: A Systematic Literature Review

Online reviews about the purchase of products or services provided have become the main source of users’ opinions. In order to gain profit or fame, usually spam reviews are written...

Research of Email Classification based on Deep Neural Network

Abstract The effective distinction between normal email and spam, so as to maximize the possible of filtering spam has become a research hotspot currently. Naive ...

ARTIKEL ALGORITMA PEMROGRAMAN SERI MINTA UBA HASIBUAN

Algoritma merupakan akar dari sebuah sistem yang terbentuk dalam dunia pemrograman.Melalui serangkaian cara yang masuk akal dan teratur, sebuah algoritma dapat menyelesaikan suatu ...

Email Spam Classifier

Communication plays a major part in everything be it proficient or individual. Because of its widespread use, accessibility, affordability, and free services, email is a popular co...

A Collaborative Reputation-Based Vector Space Model for Email Spam Filtering

In this paper, we propose a novel Collaborative Reputation-based Vector Space Model (CRVSM) for detection of spam email. CRVSM uses a vector space model for representing the featur...

Deteksi Serangan pada Jaringan IoT Menggunakan Seleksi Fitur Gabungan dan Optimasi Bayesian

Deteksi serangan berbasis machine learning (ML) berpotensi menjadi alternatif terbaik dalam penanganan ancaman siber pada jaringan internet of things (IoT). Metode ini memiliki kem...

Analisis Perbandingan Algoritma Local Binary Patterns Histogram (LBPH) Dan Algoritma Convolutional Neural Network (CNN) Pada Sistem Pengenalan Wajah

Dalam sistem pengamanan dan verifikasi digital, kata sandi sering digunakan tetapi memiliki kerentanan terhadap manipulasi dan pencurian. Untuk mengatasi masalah ini, metode altern...

Email:
Password:

Email:

Optimasi algoritma deteksi spam email dengan BERT-MI dan jaringan dense

Related Results