Javascript must be enabled to continue!
Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF)
View through CrossRef
Pertumbuhan data yang terjadi saat ini berpengaruh terhadap analisis data di berbagai bidang, seperti astronomi, bisnis, kedokteran, pendidikan, dan finansial. Data yang terkumpul dan tersimpan mengandung nilai ekstrem atau nilai pengamatan yang berbeda dari kebanyakan nilai hasil pengamatan lain. Nilai ekstrem tersebut disebut dengan outlier. Outlier pada sebagian data sering kali memiliki nilai yang mengandung informasi penting, sehingga perlu dikaji agar dapat diambil keputusan untuk menghapus atau menggunakan data tersebut sebelum diterapkan dalam penambangan data. Deteksi outlier dapat dilakukan sebagai prapemrosesan data dengan menggunakan teknik analisis outlier. Beberapa teknik analisis outlier yang banyak diterapkan antara lain metode berbasis jarak (distance), metode berbasis kepadatan (density), dan metode local outlier factor (LOF). K-nearest neighbors (KNN) merupakan salah satu algoritma penambangan data yang sangat sensitif terhadap outlier karena cara kerjanya yang bergantung pada nilai k. Oleh karena itu, perlu penanganan tepat saat KNN bekerja pada dataset yang mengandung outlier. Metode eksperimen dipilih dalam menerapkan metode usulan, dengan tujuan untuk mengoptimasi algoritma KNN berdasarkan perbandingan analisis outlier (KNN-distance, KNN-density, dan KNN-LOF). Hasil penelitian menunjukkan bahwa KNN-kepadatan unggul sebanyak tiga kali: pada Wisconsin Breast Cancer dengan nilai rata-rata akurasi sebesar 99,34% pada k=3 dan k=5; pada Glass dengan nilai rata-rata akurasi sebesar 85,25% pada k=7; dan pada Lymphography dengan nilai rata-rata akurasi sebesar 85,45% pada k=5. Selanjutnya, berdasarkan hasil uji Friedman dan uji Nemenyi, juga terbukti bahwa ada perbedaan yang signifikan antara KNN-kepadatan dengan KNN-LOF.
Universitas Gadjah Mada
Title: Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF)
Description:
Pertumbuhan data yang terjadi saat ini berpengaruh terhadap analisis data di berbagai bidang, seperti astronomi, bisnis, kedokteran, pendidikan, dan finansial.
Data yang terkumpul dan tersimpan mengandung nilai ekstrem atau nilai pengamatan yang berbeda dari kebanyakan nilai hasil pengamatan lain.
Nilai ekstrem tersebut disebut dengan outlier.
Outlier pada sebagian data sering kali memiliki nilai yang mengandung informasi penting, sehingga perlu dikaji agar dapat diambil keputusan untuk menghapus atau menggunakan data tersebut sebelum diterapkan dalam penambangan data.
Deteksi outlier dapat dilakukan sebagai prapemrosesan data dengan menggunakan teknik analisis outlier.
Beberapa teknik analisis outlier yang banyak diterapkan antara lain metode berbasis jarak (distance), metode berbasis kepadatan (density), dan metode local outlier factor (LOF).
K-nearest neighbors (KNN) merupakan salah satu algoritma penambangan data yang sangat sensitif terhadap outlier karena cara kerjanya yang bergantung pada nilai k.
Oleh karena itu, perlu penanganan tepat saat KNN bekerja pada dataset yang mengandung outlier.
Metode eksperimen dipilih dalam menerapkan metode usulan, dengan tujuan untuk mengoptimasi algoritma KNN berdasarkan perbandingan analisis outlier (KNN-distance, KNN-density, dan KNN-LOF).
Hasil penelitian menunjukkan bahwa KNN-kepadatan unggul sebanyak tiga kali: pada Wisconsin Breast Cancer dengan nilai rata-rata akurasi sebesar 99,34% pada k=3 dan k=5; pada Glass dengan nilai rata-rata akurasi sebesar 85,25% pada k=7; dan pada Lymphography dengan nilai rata-rata akurasi sebesar 85,45% pada k=5.
Selanjutnya, berdasarkan hasil uji Friedman dan uji Nemenyi, juga terbukti bahwa ada perbedaan yang signifikan antara KNN-kepadatan dengan KNN-LOF.
.
Related Results
Perbandingan Algoritma Boruvka Dan Algoritma Sollin Pada Optimasi Kebutuhan Kabel Fiber Optik Universitas Bengkulu
Perbandingan Algoritma Boruvka Dan Algoritma Sollin Pada Optimasi Kebutuhan Kabel Fiber Optik Universitas Bengkulu
Optimasi adalah hal penting dalam suatu algoritma. Ini dapat menghemat kebutuhan dalam suatu kegiatan. Pada Minimum Spanning Tree, yang ingin dicapai adalah bagaimana semua vertexs...
Perbandingan pengaruh antara latihan bowling jarak sesungguhnya dengan latihan bowling jarak dekat ke jarak sesungguhnya terhadap ketepatan dan kecepatan bowling cricket pada siswa putra ekstrakulikuler cricket
Perbandingan pengaruh antara latihan bowling jarak sesungguhnya dengan latihan bowling jarak dekat ke jarak sesungguhnya terhadap ketepatan dan kecepatan bowling cricket pada siswa putra ekstrakulikuler cricket
Tujuan penelitian ini adalah untuk mengetahui: (1) Perbedaan Pengaruh Antara Latihan Bowling Jarak Sesungguhnya Dengan Latihan Jarak Dekat Ke Jarak Sesungguhnya Terhadap Ketepatan ...
Perbandingan Kinerja Algoritma Naïve Bayes Dan C.45 Dalam Klasifikasi Spam Email
Perbandingan Kinerja Algoritma Naïve Bayes Dan C.45 Dalam Klasifikasi Spam Email
Antispam dengan algoritma tertentu yang dapat memisahkan antara spam-mail dengan non spam mail. Perbandingan kinerja antara algoritma naïve bayes, dan decision tree yang memakai al...
Differential Effects of Organic Fertilizers on Mustard Pakcoy
Differential Effects of Organic Fertilizers on Mustard Pakcoy
This study investigates the interplay between different types of liquid organic fertilizer (LOF) and their concentrations on the growth and yield of mustard pakcoy plants, aiming t...
ARTIKEL ALGORITMA PEMROGRAMAN SERI MINTA UBA HASIBUAN
ARTIKEL ALGORITMA PEMROGRAMAN SERI MINTA UBA HASIBUAN
Algoritma merupakan akar dari sebuah sistem yang terbentuk dalam dunia pemrograman.Melalui serangkaian cara yang masuk akal dan teratur, sebuah algoritma dapat menyelesaikan suatu ...
IDENTIFIKASI KEPADATAN PENDUDUK DI PROVINSI JAWA BARAT MENGGUNAKAN HIERARCHICAL CLUSTERING
IDENTIFIKASI KEPADATAN PENDUDUK DI PROVINSI JAWA BARAT MENGGUNAKAN HIERARCHICAL CLUSTERING
Penelitian ini menerapkan algoritma hierarchical clustering untuk mengidentifikasi pola kepadatan penduduk di Jawa Barat (18 kabupaten, 9 kota) sebagai dasar penanggulangan bencana...
Pencarian Jalur berdasarkan Kepadatan Lalu Lintas di Surabaya Menggunakan Algoritma Koloni Semut
Pencarian Jalur berdasarkan Kepadatan Lalu Lintas di Surabaya Menggunakan Algoritma Koloni Semut
Di kota besar seperti Surabaya yang mempunyai kepadatan lalu lintas yang cukup tinggi, merupakan permasalahan yang rumit untuk diselesaikan. Peningkatan jumlah pengguna jalan meny...
HUBUNGAN INDEKS MASSA TUBUH (IMT), PERSEN LEMAK TUBUH, ASUPAN ZAT GIZI, DAN AKTIVITAS FISIK DENGAN KEPADATAN TULANG PADA REMAJA PUTRI
HUBUNGAN INDEKS MASSA TUBUH (IMT), PERSEN LEMAK TUBUH, ASUPAN ZAT GIZI, DAN AKTIVITAS FISIK DENGAN KEPADATAN TULANG PADA REMAJA PUTRI
Latar Belakang : Kepadatan tulang yang rendah saat remaja dapat meningkatkan risiko terjadinya osteoporosis. Terdapat beberapa faktor yang mempengaruhi kepadatan tulang diantaranya...

