HeaderRight Teknologi Nalar

Kamis, 29 Januari 2026

Studi Kasus Nyata UMKM: Implementasi Pipeline Machine Learning K-Means, KNN & Decision Tree

Studi Kasus Nyata UMKM: Implementasi Pipeline Machine Learning K-Means, KNN & Decision Tree
Ilustrasi studi kasus nyata UMKM dalam implementasi pipeline machine learning untuk klasifikasi pelanggan

Studi Kasus Nyata UMKM
Implementasi Pipeline Machine Learning K-Means, KNN & Decision Tree

Artikel ini merupakan lanjutan langsung dari: Bagian 2 – Pipeline Machine Learning UMKM dengan Python .

Daftar Isi
  1. Profil UMKM & Masalah Bisnis
  2. Implementasi Pipeline Machine Learning
  3. Hasil Segmentasi Pelanggan
  4. Evaluasi Model: Confusion Matrix
  5. Dampak Bisnis (Before–After)
  6. Feature Importance Decision Tree
  7. Pembelajaran Penting

1. Profil UMKM & Masalah Bisnis

UMKM dalam studi kasus ini bergerak di bidang retail makanan & minuman dengan karakteristik:

  • ±300 pelanggan aktif
  • ±1.200 transaksi dalam 6 bulan
  • Promosi bersifat massal tanpa segmentasi

Masalah utama:

  • Pelanggan loyal tidak diprioritaskan
  • Diskon sering tidak tepat sasaran
  • Tidak ada insight perilaku pelanggan

2. Implementasi Pipeline Machine Learning

Pipeline yang digunakan persis seperti di Bagian 2:

  • Ekstraksi fitur RFM
  • Segmentasi pelanggan dengan K-Means
  • Klasifikasi pelanggan baru menggunakan KNN
  • Interpretasi aturan bisnis dengan Decision Tree
Fokus utama bukan akurasi tinggi, tetapi keputusan bisnis yang bisa dijalankan.

3. Hasil Segmentasi Pelanggan

Hasil segmentasi menghasilkan 4 kelompok:

  • Hemat – transaksi jarang & nilai kecil
  • Reguler – transaksi stabil
  • Loyal – sering belanja
  • Premium – nilai belanja tinggi

UMKM mulai menerapkan strategi berbeda untuk tiap segmen.

4. Evaluasi Model: Confusion Matrix

Selain interpretasi fitur, evaluasi model dilakukan untuk memastikan segmentasi pelanggan cukup konsisten dan dapat diandalkan.

Confusion Matrix – Klasifikasi Pelanggan UMKM Predicted Class Actual Class 120 18 22 95 Reguler Loyal Reguler Loyal

Confusion matrix menunjukkan bahwa model:

  • Mampu mengidentifikasi pelanggan loyal dengan cukup baik
  • Kesalahan klasifikasi masih terjadi di segmen transisi
  • Tidak menimbulkan risiko besar bagi keputusan bisnis
Insight Bisnis:
Kesalahan kecil antar segmen tidak kritis bagi UMKM. Yang terpenting adalah model membantu mengurangi keputusan promosi yang salah sasaran.

5. Dampak Bisnis (Before–After)

Perbandingan performa bisnis sebelum dan sesudah implementasi ML:

Sebelum ML Sesudah ML Repeat Order Repeat Order 35% 55%

Hasil nyata yang dicapai:

  • Repeat order naik dari 35% → 55%
  • Diskon lebih terkontrol
  • Pelanggan loyal meningkat signifikan

6. Feature Importance Decision Tree

Setelah segmentasi pelanggan dilakukan, Decision Tree digunakan untuk menjawab pertanyaan penting bagi pemilik UMKM:

  • Faktor apa yang paling menentukan segmen pelanggan?
  • Apakah pelanggan loyal ditentukan oleh frekuensi, nilai belanja, atau recency?

Decision Tree memberikan feature importance, yaitu tingkat kontribusi setiap variabel RFM terhadap keputusan segmentasi.

Feature importance membantu UMKM memahami apa yang benar-benar memengaruhi perilaku pelanggan, bukan sekadar hasil cluster.

Ekstraksi Feature Importance

import pandas as pd
from sklearn.tree import DecisionTreeClassifier

# Asumsikan rfm dan label cluster sudah tersedia
dt = DecisionTreeClassifier(max_depth=4, random_state=42)
dt.fit(rfm, rfm["cluster"])

feature_importance = pd.DataFrame({
    "feature": rfm.columns[:-1],
    "importance": dt.feature_importances_
}).sort_values(by="importance", ascending=False)

print(feature_importance)

Output akan menunjukkan variabel mana yang paling berpengaruh dalam menentukan segmen pelanggan.

Visualisasi Feature Importance

Monetary Frequency Recency 0.45 0.32 0.23

Dari grafik di atas, dapat disimpulkan bahwa:

  • Monetary adalah faktor paling dominan
  • Frequency menentukan loyalitas jangka menengah
  • Recency berperan sebagai indikator risiko churn
Insight Bisnis:
UMKM sebaiknya memprioritaskan pelanggan dengan nilai belanja tinggi, bukan hanya yang sering datang. Strategi diskon massal dapat diganti dengan reward khusus pelanggan bernilai tinggi.

7. Pembelajaran Penting

  • Model sederhana bisa berdampak besar
  • Segmentasi lebih penting dari akurasi tinggi
  • Interpretasi bisnis adalah kunci adopsi
Machine Learning untuk UMKM harus dipakai, bukan sekadar dibuat.

Pada artikel berikutnya (Bagian 4), kita akan membahas: deploy model ke API Flask agar bisa digunakan real-time.

Tidak ada komentar:

Posting Komentar

Galery Artikel