Comparison of K-Means and K-Medoids Algorithms for Grouping Video Game Sales Data in North America

Aditya Rezky Pratama,Bima Maulana,Rahmad Didho Rianda,Syaid El Hasyim
DOI: https://doi.org/10.57152/ijirse.v3i2.898
2023-09-29
Abstract:Analisis cluster merupakan proses spesifik pengelompokan kumpulan objek ke dalam kelas yang serupa. Kluster adalah sekumpulan objek yang mirip satu sama lain di dalam kluster yang sama dan berbeda dari objek di kluster lain. Deskriptif berarti data mining digunakan untuk menemukan pola yang bisa dipahami orang yang menggambarkan sifat-sifat informasi. Di samping itu data prediktif digunakan dalam membangun model data yang berguna dalam melakukan prediksi. Algoritma K-Means Clustering adalah algoritma yang penting dalam bidang data mining dan mudah untuk diimplementasikan dan dijalankan. Selain itu, metode pengelompokan K-Means memiliki varian pengembangan yaitu K-Medoids. Algoritma K-Medoids membantu mengatasi kelemahan dari algoritma K-Means. Banyak data yang akan diambil sebagai sampel adalah 2000 record data. Data tersebut akan diproses yang nantinya akan diperoleh pola rata-rata penjualan video game di Amerika Utara. Dari percobaan yang dilakukan, didapatkan hasil pengolahan K-means menggunakan Rapidminer dengan waktu yang diperlukan hanya rata-rata 1 detik sebaliknya pengolahan data dengan K-medoids memerlukan waktu 2 menit 21 detik. Nilai Davies-Bouldin Index (DBI) pada K-Means lebih rendah dibandingkan K-Medoids yaitu masing-masing 0.727 dan 1.148 yang berarti penggunaan K-means lebih tepat untuk pengolahan data penjualan video game di Amerika Utara.
What problem does this paper attempt to address?