Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Optimasi algoritma deteksi spam email dengan BERT-MI dan jaringan dense

View through CrossRef
Deteksi email spam merupakan tantangan penting dalam menjaga keamanan dan efisiensi komunikasi digital. Penelitian ini mengusulkan dan mengevaluasi sebuah pipeline yang dioptimalkan untuk deteksi email spam dengan mengintegrasikan Bidirectional Encoder Representations from Transformers (BERT) untuk ekstraksi fitur, seleksi fitur menggunakan Mutual Information (MI) untuk mereduksi dimensi, dan jaringan saraf dense untuk klasifikasi. Dataset Lingspam, yang terdiri dari 2893 email (2412 ham dan 481 spam), digunakan dalam eksperimen dengan pembagian 80% data pelatihan dan 20% data pengujian. Fitur teks diekstraksi menggunakan BERT (bert-base-uncased), menghasilkan embedding 768 dimensi yang kemudian direduksi menjadi 200 fitur paling relevan menggunakan MI. Model jaringan saraf dense dengan arsitektur 256-128-64-32-1 neuron dilatih menggunakan optimizer Adam, fungsi loss binary cross-entropy, dan teknik early stopping serta class weights untuk menangani ketidakseimbangan kelas. Hasil evaluasi pada data pengujian menunjukkan performa yang sangat tinggi dengan akurasi 99.14%, presisi 0.9596, recall 0.9896, F1-score 0.9744, dan ROC-AUC 0.9995. Pendekatan ini menunjukkan bahwa kombinasi BERT-MI dengan jaringan dense mampu mencapai akurasi yang sebanding dengan metode yang lebih kompleks, namun dengan potensi arsitektur yang lebih sederhana dan efisien.
Title: Optimasi algoritma deteksi spam email dengan BERT-MI dan jaringan dense
Description:
Deteksi email spam merupakan tantangan penting dalam menjaga keamanan dan efisiensi komunikasi digital.
Penelitian ini mengusulkan dan mengevaluasi sebuah pipeline yang dioptimalkan untuk deteksi email spam dengan mengintegrasikan Bidirectional Encoder Representations from Transformers (BERT) untuk ekstraksi fitur, seleksi fitur menggunakan Mutual Information (MI) untuk mereduksi dimensi, dan jaringan saraf dense untuk klasifikasi.
Dataset Lingspam, yang terdiri dari 2893 email (2412 ham dan 481 spam), digunakan dalam eksperimen dengan pembagian 80% data pelatihan dan 20% data pengujian.
Fitur teks diekstraksi menggunakan BERT (bert-base-uncased), menghasilkan embedding 768 dimensi yang kemudian direduksi menjadi 200 fitur paling relevan menggunakan MI.
Model jaringan saraf dense dengan arsitektur 256-128-64-32-1 neuron dilatih menggunakan optimizer Adam, fungsi loss binary cross-entropy, dan teknik early stopping serta class weights untuk menangani ketidakseimbangan kelas.
Hasil evaluasi pada data pengujian menunjukkan performa yang sangat tinggi dengan akurasi 99.
14%, presisi 0.
9596, recall 0.
9896, F1-score 0.
9744, dan ROC-AUC 0.
9995.
Pendekatan ini menunjukkan bahwa kombinasi BERT-MI dengan jaringan dense mampu mencapai akurasi yang sebanding dengan metode yang lebih kompleks, namun dengan potensi arsitektur yang lebih sederhana dan efisien.

Related Results

Perbandingan Algoritma Boruvka Dan Algoritma Sollin Pada Optimasi Kebutuhan Kabel Fiber Optik Universitas Bengkulu
Perbandingan Algoritma Boruvka Dan Algoritma Sollin Pada Optimasi Kebutuhan Kabel Fiber Optik Universitas Bengkulu
Optimasi adalah hal penting dalam suatu algoritma. Ini dapat menghemat kebutuhan dalam suatu kegiatan. Pada Minimum Spanning Tree, yang ingin dicapai adalah bagaimana semua vertexs...
Spam Review Detection Techniques: A Systematic Literature Review
Spam Review Detection Techniques: A Systematic Literature Review
Online reviews about the purchase of products or services provided have become the main source of users’ opinions. In order to gain profit or fame, usually spam reviews are written...
Research of Email Classification based on Deep Neural Network
Research of Email Classification based on Deep Neural Network
Abstract The effective distinction between normal email and spam, so as to maximize the possible of filtering spam has become a research hotspot currently. Naive ...
ARTIKEL ALGORITMA PEMROGRAMAN SERI MINTA UBA HASIBUAN
ARTIKEL ALGORITMA PEMROGRAMAN SERI MINTA UBA HASIBUAN
Algoritma merupakan akar dari sebuah sistem yang terbentuk dalam dunia pemrograman.Melalui serangkaian cara yang masuk akal dan teratur, sebuah algoritma dapat menyelesaikan suatu ...
Email Spam Classifier
Email Spam Classifier
Communication plays a major part in everything be it proficient or individual. Because of its widespread use, accessibility, affordability, and free services, email is a popular co...
A Collaborative Reputation-Based Vector Space Model for Email Spam Filtering
A Collaborative Reputation-Based Vector Space Model for Email Spam Filtering
In this paper, we propose a novel Collaborative Reputation-based Vector Space Model (CRVSM) for detection of spam email. CRVSM uses a vector space model for representing the featur...
Deteksi Serangan pada Jaringan IoT Menggunakan Seleksi Fitur Gabungan dan Optimasi Bayesian
Deteksi Serangan pada Jaringan IoT Menggunakan Seleksi Fitur Gabungan dan Optimasi Bayesian
Deteksi serangan berbasis machine learning (ML) berpotensi menjadi alternatif terbaik dalam penanganan ancaman siber pada jaringan internet of things (IoT). Metode ini memiliki kem...

Back to Top