Pengertian Analisis Cluster
Analisis Cluster adalah suatu analisis
statistik multivariate yang bertujuan untuk mengetahui struktur data
dengan menempatkan kesamaan obyek observasi ke dalam satu kelompok data
sehingga dapat dibedakan antara kelompok satu dengan kelompok yang lain atau dengan
cara memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat
berbeda antar kelompok yang satu dengan yang lain. Dalam analisis ini tiap-tiap
kelompok bersifat homogen antara anggota dalam kelompoknya atau dapat dikatakan
variasi obyek/individu dalam satu kelompok yang terbentuk sekecil mungkin (Anderberg,1973).
Dengan kata lain yang lebih mudah dipahami, analisis
cluster adalah analisis yang dilakukan untuk mengelompokkan objek – objek
berdasarkan kesamaan karakteristik di antara objek – objek tersebut. Diharapkan
dengan terbentuknya kelompok – kelompok tersebut akan lebih mudah dalam
menganalisa dan lebih tepat pengambilan keputusan yang sehubungan dengan
masalah tersebut. Perbedaan analisis cluster dengan analisis faktor
adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan
analisis faktor terfokus pada kelompok variabel.
Tujuan Analisis Cluster
- menyederhanakan data dan untuk menyajikannya ke dalam bentuk grafik atau dendogram.
- mengelompokkan obyek – obyek menjadi kelompok – kelompok yang mempunyai sifat yang homogen atau variasi obyek yang terbentuk sekecil mungkin.
- selain itu, analisis cluster digunakan untuk membedakan dengan jelas antara satu kelompok cluster dengan kelompok yang lain.
Proses
Pengambilan Keputusan dalam Analisis Cluster
Pengambilan
keputusan dengan analisis cluster memiliki 6 tahapan, yaitu : menentukan tujuan
analisis cluster, menentukan desain penelitian analisis cluster, menentukan
asumsi analisis cluster, menurunkan cluster-cluster dan memperkirakan overall fit, menginterpretasi
hasil analisis cluster, mengukur tingkat validasi hasil analisis cluster.
Fuzzy Clustering
Fuzzy
clustering adalah salah satu teknik untuk menentukan cluster optimal dalam
suatu ruang vektor yang didasarkan pada bentuk normal euclidian untuk jarak
antar vektor. Fuzzy clustering sangat berguna bagi pemodelan fuzzy terutama
dalam mengindentifikasi aturan-aturan fuzzy. Metode clustering merupakan
pengelompokan data beserta parameternya dalam kelompok – kelompok sesuai
kecenderungan sifat dari masing-masing data tersebut (kesamaan sifat).
Ada
beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy
C-Means. Fuzzy C-Means adalah suatu teknik peng-cluster-an yang mana
keberadaannya tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat
keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun
1981.
Konsep
dari Fuzzy C-Means pertama kali adalah menentukan pusat cluster, yang akan
menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat
cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat
keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan
derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat
dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan
ini didasarkan pada minimasi fungsi obyektif yang menggambarkan jarak dari
titik data yang diberikan kepusat cluster yang terbobot oleh derajat
keanggotaan titik data tersebut.
Output
dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat
keanggotaan untuk tiap-tiap titik data. Informasi ini dapat digunakan untuk
membangun suatu fuzzy inference system. Fuzzy C-Means diperkenalkan pertama kali oleh JIM BEZDEK pada
tahun 1981. Fuzzy C-Means adalah suatu teknik clustering data dimana tiap data
dalam suatu cluster ditentukan oleh derajat keanggotaannya.
Konsep Fuzzy C-Means :
- Penentuan pusat cluster yang menandai lokasi rata-rata untuk tiap cluster, dengan kondisi awal tidak akurat.
- Tiap data memiliki derajat keanggotaan untuk masing-masing cluster.
- Dengan perulangan yang didasarkan pada minimisasi fungsi obyektif, pusat cluster dan nilai kenaggotaan diperbaiki. Sehingga lokasi cluster bisa berada pada posisi yang benar.
Rumus Fuzzy C-Means :
1.Buat matriks partisi awal secara acak, dengan ketentuan jumlah
setiap kolom pada matrik harus sama dengan 1.
2.Hitung Pusat Cluster, dg persamaan :
Ket : V = Pusat ClusterW = pangkat atau pembobot ( W > 1 )
3.Perbaiki derajat keanggotaan setiap anggota dengan
lalu mencari jarak (d) antara pusat dan data
4. Tentukan nilai kriteria berhenti.
Nilai kriteria berhenti merupakan perubahan yang terjadi pada
matrik partisi pada iterasi sekarang dengan iterasi sebelumnya. Jika nilai kriteria berhenti lebih besar atau sama dengan
selisihnya maka hentikan proses, tetapi jika tidak kembali ke PERUMUSAN 2
(hitung pusat cluster).
Perbedaan Analisis Cluster dengan Fuzzy
Cluster
Analisis
kluster atau clustering merupakan proses membagi data dalam suatu himpunan ke
dalam beberapa kelompok yang mana kesamaan data dalam suatu kelompok lebih
besar dibandingkan kesamaan data tersebut dengan data dalam kelompok lain
(Jang, Sun, dan Mizutani, 2004). Sedangkan, Metode Fuzzy clustering mengijinkan
obyek untuk menjadi bagian dari beberapa kelompok secara bersamaan dengan
perbedaan level keanggotaan.
0 komentar:
Posting Komentar