Studi Kasus Nyata UMKM
Implementasi Pipeline Machine Learning K-Means, KNN & Decision Tree
Artikel ini merupakan lanjutan langsung dari: Bagian 2 – Pipeline Machine Learning UMKM dengan Python .
- Profil UMKM & Masalah Bisnis
- Implementasi Pipeline Machine Learning
- Hasil Segmentasi Pelanggan
- Evaluasi Model: Confusion Matrix
- Dampak Bisnis (Before–After)
- Feature Importance Decision Tree
- Pembelajaran Penting
1. Profil UMKM & Masalah Bisnis
UMKM dalam studi kasus ini bergerak di bidang retail makanan & minuman dengan karakteristik:
- ±300 pelanggan aktif
- ±1.200 transaksi dalam 6 bulan
- Promosi bersifat massal tanpa segmentasi
Masalah utama:
- Pelanggan loyal tidak diprioritaskan
- Diskon sering tidak tepat sasaran
- Tidak ada insight perilaku pelanggan
2. Implementasi Pipeline Machine Learning
Pipeline yang digunakan persis seperti di Bagian 2:
- Ekstraksi fitur RFM
- Segmentasi pelanggan dengan K-Means
- Klasifikasi pelanggan baru menggunakan KNN
- Interpretasi aturan bisnis dengan Decision Tree
3. Hasil Segmentasi Pelanggan
Hasil segmentasi menghasilkan 4 kelompok:
- Hemat – transaksi jarang & nilai kecil
- Reguler – transaksi stabil
- Loyal – sering belanja
- Premium – nilai belanja tinggi
UMKM mulai menerapkan strategi berbeda untuk tiap segmen.
4. Evaluasi Model: Confusion Matrix
Selain interpretasi fitur, evaluasi model dilakukan untuk memastikan segmentasi pelanggan cukup konsisten dan dapat diandalkan.
Confusion matrix menunjukkan bahwa model:
- Mampu mengidentifikasi pelanggan loyal dengan cukup baik
- Kesalahan klasifikasi masih terjadi di segmen transisi
- Tidak menimbulkan risiko besar bagi keputusan bisnis
Kesalahan kecil antar segmen tidak kritis bagi UMKM. Yang terpenting adalah model membantu mengurangi keputusan promosi yang salah sasaran.
5. Dampak Bisnis (Before–After)
Perbandingan performa bisnis sebelum dan sesudah implementasi ML:
Hasil nyata yang dicapai:
- Repeat order naik dari 35% → 55%
- Diskon lebih terkontrol
- Pelanggan loyal meningkat signifikan
6. Feature Importance Decision Tree
Setelah segmentasi pelanggan dilakukan, Decision Tree digunakan untuk menjawab pertanyaan penting bagi pemilik UMKM:
- Faktor apa yang paling menentukan segmen pelanggan?
- Apakah pelanggan loyal ditentukan oleh frekuensi, nilai belanja, atau recency?
Decision Tree memberikan feature importance, yaitu tingkat kontribusi setiap variabel RFM terhadap keputusan segmentasi.
Ekstraksi Feature Importance
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
# Asumsikan rfm dan label cluster sudah tersedia
dt = DecisionTreeClassifier(max_depth=4, random_state=42)
dt.fit(rfm, rfm["cluster"])
feature_importance = pd.DataFrame({
"feature": rfm.columns[:-1],
"importance": dt.feature_importances_
}).sort_values(by="importance", ascending=False)
print(feature_importance)
Output akan menunjukkan variabel mana yang paling berpengaruh dalam menentukan segmen pelanggan.
Visualisasi Feature Importance
Dari grafik di atas, dapat disimpulkan bahwa:
- Monetary adalah faktor paling dominan
- Frequency menentukan loyalitas jangka menengah
- Recency berperan sebagai indikator risiko churn
UMKM sebaiknya memprioritaskan pelanggan dengan nilai belanja tinggi, bukan hanya yang sering datang. Strategi diskon massal dapat diganti dengan reward khusus pelanggan bernilai tinggi.
7. Pembelajaran Penting
- Model sederhana bisa berdampak besar
- Segmentasi lebih penting dari akurasi tinggi
- Interpretasi bisnis adalah kunci adopsi
Pada artikel berikutnya (Bagian 4), kita akan membahas: deploy model ke API Flask agar bisa digunakan real-time.
Tidak ada komentar:
Posting Komentar