Javascript must be enabled to continue!
Analisis Segmentasi Tayangan Netflix Berdasarkan Metadata Menggunakan PCA, Multi-Model Clustering, dan Validasi Stabilitas Klaster
View through CrossRef
Abstrak - Pertumbuhan layanan streaming seperti Netflix menghadirkan tantangan dalam memahami preferensi pengguna serta mengelola ribuan konten yang tersedia. Oleh karena itu, diperlukan metode analisis segmentasi untuk mengidentifikasi pola distribusi konten secara lebih efisien. Penelitian ini bertujuan untuk melakukan segmentasi konten Netflix menggunakan pendekatan clustering dengan algoritma K-Means, serta membandingkan performanya dengan metode lain. Dataset yang digunakan terdiri dari 15.026 konten dengan 1.206 fitur, yang direduksi menggunakan Principal Component Analysis (PCA) menjadi 1.134 komponen dengan 95% varians tetap terjaga. Evaluasi kinerja model dilakukan menggunakan Silhouette Score dan Adjusted Rand Index (ARI). Hasil penelitian menunjukkan bahwa K-Means dengan 9 cluster merupakan metode terbaik dengan nilai Silhouette Score 0,1481 dan ARI 0,6381. Segmentasi menghasilkan distribusi yang didominasi oleh Segmen 0 (81,5%) sebagai segmen utama dan Segmen 4 (18,4%) sebagai segmen potensial, sementara segmen lainnya (1%) dikategorikan sebagai segmen niche. Temuan ini memberikan implikasi akademis berupa kontribusi dalam pengembangan metode segmentasi berbasis machine learning, serta implikasi praktis bagi industri streaming untuk mengoptimalkan strategi investasi konten, mengembangkan sistem rekomendasi, dan mengeksplorasi peluang pasar baru.Kata Kunci: Netflix; Klastering; PCA; K-Means; Silhouette Score; Adjusted Rand Index; Abstract - The rapid growth of streaming services such as Netflix poses significant challenges in understanding user preferences and managing the vast number of available contents. Therefore, content segmentation methods are required to efficiently identify distribution patterns. This study aims to perform Netflix content segmentation using the clustering approach with the K-Means algorithm, and to compare its performance with alternative methods. The dataset consists of 15,026 contents with 1,206 features, which were reduced using Principal Component Analysis (PCA) into 1,134 components while preserving 95% variance. Model performance was evaluated using the Silhouette Score and Adjusted Rand Index (ARI). The results indicate that K-Means with 9 clusters achieved the best performance, yielding a Silhouette Score of 0.1481 and an ARI of 0.6381. The segmentation revealed that Segment 0 (81.5%) dominated as the main segment and Segment 4 (18.4%) was identified as a potential segment, while the remaining clusters (1%) represented niche segments. These findings provide both academic implications by contributing to the development of machine learning-based segmentation methods, and practical implications for the streaming industry to optimize content investment strategies, improve recommendation systems, and explore new market opportunities.Keywords: Netflix; Clustering; PCA; K-Means; Silhouette Score; Adjusted Rand Index;
Universitas Serambi Mekkah
Title: Analisis Segmentasi Tayangan Netflix Berdasarkan Metadata Menggunakan PCA, Multi-Model Clustering, dan Validasi Stabilitas Klaster
Description:
Abstrak - Pertumbuhan layanan streaming seperti Netflix menghadirkan tantangan dalam memahami preferensi pengguna serta mengelola ribuan konten yang tersedia.
Oleh karena itu, diperlukan metode analisis segmentasi untuk mengidentifikasi pola distribusi konten secara lebih efisien.
Penelitian ini bertujuan untuk melakukan segmentasi konten Netflix menggunakan pendekatan clustering dengan algoritma K-Means, serta membandingkan performanya dengan metode lain.
Dataset yang digunakan terdiri dari 15.
026 konten dengan 1.
206 fitur, yang direduksi menggunakan Principal Component Analysis (PCA) menjadi 1.
134 komponen dengan 95% varians tetap terjaga.
Evaluasi kinerja model dilakukan menggunakan Silhouette Score dan Adjusted Rand Index (ARI).
Hasil penelitian menunjukkan bahwa K-Means dengan 9 cluster merupakan metode terbaik dengan nilai Silhouette Score 0,1481 dan ARI 0,6381.
Segmentasi menghasilkan distribusi yang didominasi oleh Segmen 0 (81,5%) sebagai segmen utama dan Segmen 4 (18,4%) sebagai segmen potensial, sementara segmen lainnya (1%) dikategorikan sebagai segmen niche.
Temuan ini memberikan implikasi akademis berupa kontribusi dalam pengembangan metode segmentasi berbasis machine learning, serta implikasi praktis bagi industri streaming untuk mengoptimalkan strategi investasi konten, mengembangkan sistem rekomendasi, dan mengeksplorasi peluang pasar baru.
Kata Kunci: Netflix; Klastering; PCA; K-Means; Silhouette Score; Adjusted Rand Index; Abstract - The rapid growth of streaming services such as Netflix poses significant challenges in understanding user preferences and managing the vast number of available contents.
Therefore, content segmentation methods are required to efficiently identify distribution patterns.
This study aims to perform Netflix content segmentation using the clustering approach with the K-Means algorithm, and to compare its performance with alternative methods.
The dataset consists of 15,026 contents with 1,206 features, which were reduced using Principal Component Analysis (PCA) into 1,134 components while preserving 95% variance.
Model performance was evaluated using the Silhouette Score and Adjusted Rand Index (ARI).
The results indicate that K-Means with 9 clusters achieved the best performance, yielding a Silhouette Score of 0.
1481 and an ARI of 0.
6381.
The segmentation revealed that Segment 0 (81.
5%) dominated as the main segment and Segment 4 (18.
4%) was identified as a potential segment, while the remaining clusters (1%) represented niche segments.
These findings provide both academic implications by contributing to the development of machine learning-based segmentation methods, and practical implications for the streaming industry to optimize content investment strategies, improve recommendation systems, and explore new market opportunities.
Keywords: Netflix; Clustering; PCA; K-Means; Silhouette Score; Adjusted Rand Index;.
Related Results
Normalising Netflix: The Platforms, Practices, and Protocols of Internet Distributed Television
Normalising Netflix: The Platforms, Practices, and Protocols of Internet Distributed Television
<p><b>As the leading internet-distributed television platform (IDTVP) today, with over 200 millionworldwide subscribers, Netflix is a fascinating case-study through whi...
Big Metadata, Smart Metadata, and Metadata Capital: Toward Greater Synergy Between Data Science and Metadata
Big Metadata, Smart Metadata, and Metadata Capital: Toward Greater Synergy Between Data Science and Metadata
Abstract
Purpose
The purpose of the paper is to provide a framework for addressing the disconnect between metadata and data scie...
Penerapan Efektivitas Segmentasi Pasar Terhadap Peningkatan Volume Penjualan UD. Bitang Timur Di Desa Sumber Pakem Kecamatan Sumber Jambe Kabupaten Jember
Penerapan Efektivitas Segmentasi Pasar Terhadap Peningkatan Volume Penjualan UD. Bitang Timur Di Desa Sumber Pakem Kecamatan Sumber Jambe Kabupaten Jember
ABSTRAK
Maryana Ayu Hakiki, 2019: Penerapan efektivitas segmentasi pasar terhadap peningkatan volume penjualan ud. Bitang timur di desa sumber pakem kecamatan sumber jambe ka...
Perbandingan Ukuran Jarak pada Analisis Kluster Hirarki
Perbandingan Ukuran Jarak pada Analisis Kluster Hirarki
Analisis klaster merupakan salah satu metode statistik untuk mengelompokkan objek berdasarkan kemiripan. Pada data kategorik, pemilihan ukuran jarak menjadi aspek penting karena me...
OPTIMISASI MANAJEMEN PERSEDIAAN BARANG DENGAN MENGGUNALAN ALGORITMA FUZZY C-MEANS
OPTIMISASI MANAJEMEN PERSEDIAAN BARANG DENGAN MENGGUNALAN ALGORITMA FUZZY C-MEANS
ABSTRAK
Untuk menganalisis data stok barang, penelitian ini menggunakan algoritma klastering Fuzzy C-Means. Hasil klastering Fuzzy C-Means menghasilkan sepuluh kelompok, masing...
Pemirsa dan Tayangan "Awas 86" Karya Remotivi
Pemirsa dan Tayangan "Awas 86" Karya Remotivi
Abstract. Video essay is one of the mass media to convey a message from the producer to the audience who watched the film. However, audiences often receive the message in a differe...
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review Anna Tri Wahyuni1), Masfuri2), Liya Arista3)1,2,3 Fakultas Ilmu Keperawatan Univers...
Literature Review on Metadata Governance
Literature Review on Metadata Governance
The framework of metadata governance is a subset of the primary data governance framework implementation within an enterprise. Metadata management helps identify data provenance an...

