Javascript must be enabled to continue!

Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF)

Pertumbuhan data yang terjadi saat ini berpengaruh terhadap analisis data di berbagai bidang, seperti astronomi, bisnis, kedokteran, pendidikan, dan finansial. Data yang terkumpul dan tersimpan mengandung nilai ekstrem atau nilai pengamatan yang berbeda dari kebanyakan nilai hasil pengamatan lain. Nilai ekstrem tersebut disebut dengan outlier. Outlier pada sebagian data sering kali memiliki nilai yang mengandung informasi penting, sehingga perlu dikaji agar dapat diambil keputusan untuk menghapus atau menggunakan data tersebut sebelum diterapkan dalam penambangan data. Deteksi outlier dapat dilakukan sebagai prapemrosesan data dengan menggunakan teknik analisis outlier. Beberapa teknik analisis outlier yang banyak diterapkan antara lain metode berbasis jarak (distance), metode berbasis kepadatan (density), dan metode local outlier factor (LOF). K-nearest neighbors (KNN) merupakan salah satu algoritma penambangan data yang sangat sensitif terhadap outlier karena cara kerjanya yang bergantung pada nilai k. Oleh karena itu, perlu penanganan tepat saat KNN bekerja pada dataset yang mengandung outlier. Metode eksperimen dipilih dalam menerapkan metode usulan, dengan tujuan untuk mengoptimasi algoritma KNN berdasarkan perbandingan analisis outlier (KNN-distance, KNN-density, dan KNN-LOF). Hasil penelitian menunjukkan bahwa KNN-kepadatan unggul sebanyak tiga kali: pada Wisconsin Breast Cancer dengan nilai rata-rata akurasi sebesar 99,34% pada k=3 dan k=5; pada Glass dengan nilai rata-rata akurasi sebesar 85,25% pada k=7; dan pada Lymphography dengan nilai rata-rata akurasi sebesar 85,45% pada k=5. Selanjutnya, berdasarkan hasil uji Friedman dan uji Nemenyi, juga terbukti bahwa ada perbedaan yang signifikan antara KNN-kepadatan dengan KNN-LOF.

Universitas Gadjah Mada

Fitri Ayuning Tyas Mahda Nurayuni Hidayatur Rakhmawati

Jurnal Nasional Teknik Elektro dan Teknologi Informasi

2024

Title: Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF)

Description:

Pertumbuhan data yang terjadi saat ini berpengaruh terhadap analisis data di berbagai bidang, seperti astronomi, bisnis, kedokteran, pendidikan, dan finansial.

Data yang terkumpul dan tersimpan mengandung nilai ekstrem atau nilai pengamatan yang berbeda dari kebanyakan nilai hasil pengamatan lain.

Nilai ekstrem tersebut disebut dengan outlier.

Outlier pada sebagian data sering kali memiliki nilai yang mengandung informasi penting, sehingga perlu dikaji agar dapat diambil keputusan untuk menghapus atau menggunakan data tersebut sebelum diterapkan dalam penambangan data.

Deteksi outlier dapat dilakukan sebagai prapemrosesan data dengan menggunakan teknik analisis outlier.

Beberapa teknik analisis outlier yang banyak diterapkan antara lain metode berbasis jarak (distance), metode berbasis kepadatan (density), dan metode local outlier factor (LOF).

K-nearest neighbors (KNN) merupakan salah satu algoritma penambangan data yang sangat sensitif terhadap outlier karena cara kerjanya yang bergantung pada nilai k.

Oleh karena itu, perlu penanganan tepat saat KNN bekerja pada dataset yang mengandung outlier.

Metode eksperimen dipilih dalam menerapkan metode usulan, dengan tujuan untuk mengoptimasi algoritma KNN berdasarkan perbandingan analisis outlier (KNN-distance, KNN-density, dan KNN-LOF).

Hasil penelitian menunjukkan bahwa KNN-kepadatan unggul sebanyak tiga kali: pada Wisconsin Breast Cancer dengan nilai rata-rata akurasi sebesar 99,34% pada k=3 dan k=5; pada Glass dengan nilai rata-rata akurasi sebesar 85,25% pada k=7; dan pada Lymphography dengan nilai rata-rata akurasi sebesar 85,45% pada k=5.

Selanjutnya, berdasarkan hasil uji Friedman dan uji Nemenyi, juga terbukti bahwa ada perbedaan yang signifikan antara KNN-kepadatan dengan KNN-LOF.

Back

Optimasi adalah hal penting dalam suatu algoritma. Ini dapat menghemat kebutuhan dalam suatu kegiatan. Pada Minimum Spanning Tree, yang ingin dicapai adalah bagaimana semua vertexs...

Differential Effects of Organic Fertilizers on Mustard Pakcoy

This study investigates the interplay between different types of liquid organic fertilizer (LOF) and their concentrations on the growth and yield of mustard pakcoy plants, aiming t...

Perbandingan pengaruh antara latihan bowling jarak sesungguhnya dengan latihan bowling jarak dekat ke jarak sesungguhnya terhadap ketepatan dan kecepatan bowling cricket pada siswa putra ekstrakulikuler cricket

Tujuan penelitian ini adalah untuk mengetahui: (1) Perbedaan Pengaruh Antara Latihan Bowling Jarak Sesungguhnya Dengan Latihan Jarak Dekat Ke Jarak Sesungguhnya Terhadap Ketepatan ...

Perbandingan Kinerja Algoritma Naïve Bayes Dan C.45 Dalam Klasifikasi Spam Email

Antispam dengan algoritma tertentu yang dapat memisahkan antara spam-mail dengan non spam mail. Perbandingan kinerja antara algoritma naïve bayes, dan decision tree yang memakai al...

ANALISIS DATA SCIENCE PADA STRUKTUR DATA KEPADATAN PENDUDUK KOTA TEGAL

Indonesia merupakan negara dengan kepadatan penduduk yang sangat banyak nomer 4 di dunia. Kepadatan penduduk Indonesia mengalami peningkatan yang cukup signifikan setiap tahunnya, ...

IDENTIFIKASI KEPADATAN PENDUDUK DI PROVINSI JAWA BARAT MENGGUNAKAN HIERARCHICAL CLUSTERING

Penelitian ini menerapkan algoritma hierarchical clustering untuk mengidentifikasi pola kepadatan penduduk di Jawa Barat (18 kabupaten, 9 kota) sebagai dasar penanggulangan bencana...

ARTIKEL ALGORITMA PEMROGRAMAN SERI MINTA UBA HASIBUAN

Algoritma merupakan akar dari sebuah sistem yang terbentuk dalam dunia pemrograman.Melalui serangkaian cara yang masuk akal dan teratur, sebuah algoritma dapat menyelesaikan suatu ...

Pencarian Jalur berdasarkan Kepadatan Lalu Lintas di Surabaya Menggunakan Algoritma Koloni Semut

Di kota besar seperti Surabaya yang mempunyai kepadatan lalu lintas yang cukup tinggi, merupakan permasalahan yang rumit untuk diselesaikan. Peningkatan jumlah pengguna jalan meny...

Email:
Password:

Email:

Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF)

Related Results