Pengertian dan Perbedaan Analisis Cluster dan Fuzzy Cluster

| Senin, 27 Oktober 2014
Pengertian Analisis Cluster
Analisis Cluster adalah suatu analisis statistik multivariate yang bertujuan untuk mengetahui struktur data dengan menempatkan kesamaan obyek observasi ke dalam satu kelompok data sehingga dapat dibedakan antara kelompok satu dengan kelompok yang lain atau dengan cara memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antara anggota dalam kelompoknya atau dapat dikatakan variasi obyek/individu dalam satu kelompok yang terbentuk sekecil mungkin (Anderberg,1973).
Dengan kata lain yang lebih mudah dipahami, analisis cluster adalah analisis yang dilakukan untuk mengelompokkan objek – objek berdasarkan kesamaan karakteristik di antara objek – objek tersebut. Diharapkan dengan terbentuknya kelompok – kelompok tersebut akan lebih mudah dalam menganalisa dan lebih tepat pengambilan keputusan yang sehubungan dengan masalah tersebut. Perbedaan analisis cluster dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel.

Tujuan Analisis Cluster
  1. menyederhanakan data dan untuk menyajikannya ke dalam bentuk grafik atau dendogram.
  2. mengelompokkan obyek – obyek menjadi kelompok – kelompok yang mempunyai sifat yang homogen atau variasi obyek yang terbentuk sekecil mungkin.
  3. selain itu, analisis cluster digunakan untuk membedakan dengan jelas antara satu kelompok cluster dengan kelompok yang lain.

Proses Pengambilan Keputusan dalam Analisis Cluster
Pengambilan keputusan dengan analisis cluster memiliki 6 tahapan, yaitu : menentukan tujuan analisis cluster, menentukan desain penelitian analisis cluster, menentukan asumsi analisis cluster, menurunkan cluster-cluster dan memperkirakan overall fit, menginterpretasi hasil analisis cluster, mengukur tingkat validasi hasil analisis cluster.

Fuzzy Clustering
Fuzzy clustering adalah salah satu teknik untuk menentukan cluster optimal dalam suatu ruang vektor yang didasarkan pada bentuk normal euclidian untuk jarak antar vektor. Fuzzy clustering sangat berguna bagi pemodelan fuzzy terutama dalam mengindentifikasi aturan-aturan fuzzy. Metode clustering merupakan pengelompokan data beserta parameternya dalam kelompok – kelompok sesuai kecenderungan sifat dari masing-masing data tersebut (kesamaan sifat).  
Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means. Fuzzy C-Means adalah suatu teknik peng-cluster-an yang mana keberadaannya tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. 
Konsep dari Fuzzy C-Means pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan kepusat cluster yang terbobot oleh derajat  keanggotaan titik data tersebut. 
Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data. Informasi ini dapat digunakan untuk membangun suatu fuzzy inference system. Fuzzy C-Means diperkenalkan pertama kali oleh JIM BEZDEK pada tahun 1981. Fuzzy C-Means adalah suatu teknik clustering data dimana tiap data dalam suatu cluster ditentukan oleh derajat keanggotaannya.

Konsep Fuzzy C-Means :
  1. Penentuan pusat cluster yang menandai lokasi rata-rata untuk tiap cluster, dengan kondisi awal tidak akurat.
  2. Tiap data memiliki derajat keanggotaan untuk masing-masing cluster.
  3. Dengan perulangan yang didasarkan pada minimisasi fungsi obyektif, pusat cluster dan nilai kenaggotaan diperbaiki. Sehingga lokasi cluster bisa berada pada posisi yang benar.


Rumus Fuzzy C-Means :
1.Buat matriks partisi awal secara acak, dengan ketentuan jumlah setiap kolom pada matrik harus         sama dengan 1.

2.Hitung Pusat Cluster, dg persamaan :

                             Ket : V = Pusat ClusterW = pangkat atau pembobot ( W > 1 )

3.Perbaiki derajat keanggotaan setiap anggota dengan 

    lalu mencari jarak (d) antara pusat dan data


4. Tentukan nilai kriteria berhenti.


Nilai kriteria berhenti merupakan perubahan yang terjadi pada matrik partisi pada iterasi sekarang dengan iterasi sebelumnya. Jika nilai kriteria berhenti lebih besar atau sama dengan selisihnya maka hentikan proses, tetapi jika tidak kembali ke PERUMUSAN 2 (hitung pusat cluster).

Perbedaan Analisis Cluster dengan Fuzzy Cluster
Analisis kluster atau clustering merupakan proses membagi data dalam suatu himpunan ke dalam beberapa kelompok yang mana kesamaan data dalam suatu kelompok lebih besar dibandingkan kesamaan data tersebut dengan data dalam kelompok lain (Jang, Sun, dan Mizutani, 2004). Sedangkan, Metode Fuzzy clustering mengijinkan obyek untuk menjadi bagian dari beberapa kelompok secara bersamaan dengan perbedaan level keanggotaan. 


0 komentar:

Posting Komentar

Next Prev