Abstrak: Sembako sebagai kebutuhan pokok memiliki peranan penting dalam kehidupan masyarakat. Dengan meningkatnya persaingan di sektor ini, pelaku usaha dituntut untuk memahami perilaku konsumen secara lebih mendalam agar strategi pemasaran yang dijalankan menjadi lebih efektif. Salah satu metode yang bisa dimanfaatkan adalah segmentasi pelanggan berbasis data transaksi. Penelitian ini bertujuan menerapkan algoritma K-Means Clustering untuk mengelompokkan pelanggan dalam rangka mendukung peningkatan penjualan sembako. Data yang digunakan meliputi empat variabel utama: jumlah pesanan, uang muka, total transaksi, dan pelunasan. Proses awal dilakukan melalui pembersihan dan normalisasi data menggunakan StandardScaler. Penentuan jumlah cluster terbaik dilakukan dengan metode Elbow dan dikonfirmasi menggunakan nilai Silhouette Score. Hasil penelitian menunjukkan bahwa empat cluster merupakan segmentasi paling optimal dengan nilai Silhoutette Score sebesar 3,99. Cluster 2 memberikan kontribusi tertinggi terhadap total penjualan dan jumlah pelanggan sebesar 35,62%, disusul oleh cluster 1 sebesar 30,14%, cluster 3 sebesar 21,92%, sedangkan cluster 0 memiliki kontribusi terendah sebesar 12,33%. Visualisasi scatter plot menunjukkan distribusi antar-cluster yang cukup jelas. Segmentasi ini berguna untuk merancang strategi pemasaran yang lebih tepat sasaran.
Abstract: Basic necessities such as staple foods play an important role in people's lives. With increasing competition in this sector, business actors are required to understand consumer behavior in more depth so that the marketing strategies implemented become more effective. One method that can be utilized is customer segmentation based on transaction data. This study aims to apply the K-Means Clustering algorithm to group customers to support increased sales of necessities. The data used includes four main variables: number of orders, down payment, total transactions, and settlement. The initial process is carried out through data cleaning and normalization using StandardScaler. Determination of the best number of clusters is carried out using the Elbow method and confirmed using the Silhouette Score value. The results of the study showed that four clusters were the most optimal segmentation with a Silhouette Score value of 3.99. Cluster 2 contributed the highest to total sales and number of customers 35.62%, followed by Cluster 1 by 30.14%, cluster 3 by 21.92%, and Cluster 0 had the lowest contribution by 12.33%. Scatter plot visualization shows a fairly clear distribution between clusters. This segmentation is useful for designing more targeted marketing strategies.