Optimalisasi Pengelompokkan Konsumen dengan Multi Internal Metric Validation dan Boxplot Analysis

Rachmad Fitriyanto; Nurindah Nurindah

doi:10.71302/jbidai.v8i1.67

Penulis

Rachmad Fitriyanto Program Studi Sistem Informasi STMIK PPKIA Tarakanita Rahmawati
Nurindah Nurindah STMIK PPKIA Tarakanita Rahmawati

DOI:

https://doi.org/10.71302/jbidai.v8i1.67

Kata Kunci:

Boxplot, Inter Quartile Range, K-Means Clustering, Segmentasi Konsumen, Validasi Internal

Abstrak

Penggunaan metrik-metrik validasi internal secara bersamaan untuk menentukan jumlah klaster optimal pada algoritma K-Means Clustering berpotensi memberikan nilai K yang berbeda-beda dan membingungkan bagi pengguna data untuk mengekstraksi informasi seperti untuk identifikasi karakteristik pelanggan. Penelitian ini bertujuan mengembangkan framework evaluasi untuk mengatasi ambiguitas nilai K dari beberapa metrik validasi internal. Framework evaluasi nilai K terdiri dari 2 tahap, dengan tahap pertama menggunakan lima metrik validasi, DBI, Silhouette Score, Elbow Method, Dunn Index dan Calinski-Harabasz Index sebagai filter untuk menghasilkan maksimal 5 nilai K terbaik. Evaluasi tahap kedua menggunakan analisis boxplot, inter quartile range dan elbow untuk mengeksplorasi tingkat kohesifitas dan stabilitas klaster yang terbentuk. Hasil yang diperoleh dari evaluasi tahap 1 terdapat 4 opsi jumlah klaster, K=2, 5, 7 dan 10. Evaluasi tahap kedua menunjukkan dari grafik elbow nilai rata-rata inter quartile range, K=5 menjadi jumlah klaster yang optimal dibanding 3 nilai K lainnya. Hasil ini menunjukkan bahwa semakin banyak metrik validasi internal yang digunakan, berpotensi menghasilkan banyak nilai K. Semakin banyak jumlah klaster tidak menjamin semakin baik kualitasnya. Implikasi dari penelitian ini menunjukkan pentingnya pendekatan evaluasi berlapis dalam menentukan jumlah klaster optimal, terutama saat menggunakan banyak metrik validasi internal secara bersamaan. Framework yang dikembangkan dapat membantu praktisi data dalam membuat keputusan yang lebih terinformasi dan mengurangi ambiguitas dalam proses klasterisasi. Ke depan, framework ini dapat dikembangkan lebih lanjut dengan mengintegrasikan metrik eksternal atau diadaptasi untuk algoritma klasterisasi lainnya.

Referensi

[1] M. Alves Gomes and T. Meisen, “A review on customer segmentation methods for personalized customer targeting in e-commerce use cases,” Inf Syst E-Bus Manage, vol. 21, no. 3, pp. 527–570, Sep. 2023, doi: 10.1007/s10257-023-00640-4.

[2] R. W. B. S. Berahmana, F. A. Mohammed, and K. Chairuang, “Customer Segmentation Based on RFM Model Using K-Means, K-Medoids, and DBSCAN Methods,” LKJITI, vol. 11, no. 1, p. 32, Apr. 2020, doi: 10.24843/LKJITI.2020.v11.i01.p04.

[3] N. A. S. Z. Abidin, R. D. Avila, A. Hermatyar, and R. Rismayani, “Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokan Daerah Produksi Kakao,” Jurnal Teknik Informatika dan Sistem Informasi, vol. 8, no. 2, Art. no. 2, Aug. 2022, doi: 10.28932/jutisi.v8i2.4897.

[4] A. A. Aldino, D. Darwis, A. T. Prastowo, and C. Sujana, “Implementation of K-Means Algorithm for Clustering Corn Planting Feasibility Area in South Lampung Regency,” J. Phys.: Conf. Ser., vol. 1751, no. 1, p. 012038, Jan. 2021, doi: 10.1088/1742-6596/1751/1/012038.

[5] R. Fitriyanto and M. Ardi, “Feature Selection Comparative Performance for Unsupervised Learning on Categorical Dataset,” Journal of Computing and Information Technology, vol. 22, no. 1, pp. 61–69, 2025.

[6] R. Fitriyanto and U. Syafiqoh, “Multilevel Modal Value Analysis for Interpreting Categorical K-Medoids Clusters Data,” techno, vol. 21, no. 2, pp. 134–143, Sep. 2024, doi: 10.33480/techno.v21i2.5796.

[7] N. A. Maori and E. Evanita, “Metode Elbow dalam Optimasi Jumlah Cluster pada K-Means Clustering,” Simetris J. Teknik Mesin, Elektro dan Ilmu Komput., vol. 14, no. 2, pp. 277–288, Nov. 2023, doi: 10.24176/simet.v14i2.9630.

[8] A. Winarta and W. J. Kurniawan, “Optimasi Cluster K-Means Menggunakan Metode Elbow Pada Data Pengguna Narkoba Dengan Pemrograman Python,” JTIK, vol. 5, no. 1, pp. 113–119, Jan. 2021, doi: 10.59697/jtik.v5i1.593.

[9] A. Azzahra and A. W. Wijayanto, “Comparison of Agglomerative Hierarchical and K-Means in Grouping Provinces Based on Maternal Health Services,” SISTEMASI, vol. 11, no. 2, p. 481, May 2022, doi: 10.32520/stmsi.v11i2.1829.

[10] S. Monalisa, “Klusterisasi Customer Lifetime Value dengan Model LRFM menggunakan Algoritma K-Means,” JTIIK, vol. 5, no. 2, pp. 247–252, May 2018, doi: 10.25126/jtiik.201852690.

[11] A. M. Sikana and A. W. Wijayanto, “Analisis Perbandingan Pengelompokan Indeks Pembangunan Manusia Indonesia Tahun 2019 dengan Metode Partitioning dan Hierarchical Clustering,” jik, vol. 14, no. 2, p. 66, Sep. 2021, doi: 10.24843/JIK.2021.v14.i02.p01.

Optimalisasi Pengelompokkan Konsumen dengan Multi Internal Metric Validation dan Boxplot Analysis

Penulis

DOI:

Kata Kunci:

Abstrak

Referensi

Unduhan

Diterbitkan

Cara Mengutip

Terbitan

Bagian

Lisensi

ISSN

Template

Indeksasi

Tools

Statistik

Informasi

Bahasa