K-Ortalamalar kümeleme yöntemi için çift K başlatma algoritması

Yükleniyor...
Küçük Resim

Tarih

2021

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Veri madenciliğinin en dikkat çekici konularından biri olan kümeleme yöntemleri, bu alanın en yoğun araştırma sahası olup kümeleme üzerine bir çok teknik ve bağlı yöntemler bulunmaktadır.Bu alandaki çalışmaların bir kısmı daha önce mevcut olan algoritmaların güncellenmesiyle elde edilmiş ve performansları değerlendirilmiştir.Kümelemenin en çok ilgi duyulan konusu KOrtalamalar yöntemidir.K-Ortalamalar algoritması her çalıştırıldığında, başlangıç merkezlerinin rastgele seçilmesi nedeniyle farklı küme çıktıları döndürür.Bu nedenle, sonuçların güvenilirliği olumsuz etkilenir ve kümeleme doğruluğu için yineleme sayısı artar.Bu yöntemin doğruluğunu arttırmaya çalışan yöntemlerden biri de K-Ortalamalar++ yöntemidir. Bu çalışmada K-Ortalamalar algoritmasının başarısının arttırılması hedeflenmiştir. Sentetik veri kümesine çift k olarak adlandırdığımız önerilen yöntem uygulanmıştır.Çift k yönteminin,

Clustering methods which is one of the most striking subjects of data mining are the most intensive research area of this field and there are many techniques and related methods on it. Some of the studies in this field have been obtained by updating the algorithms previously available and their performance has been evaluated. The most interesting topic of clustering techniques is K-Means method. Every initializing of K-Means algorithm return different cluster outputs because of random selection of the initial centers. Therefore, the reliability of the results is adversely affected and the number of iterations increase for clustering accuracy.One of the methods that tries to increase accuracy of this method is the k-means ++ method. In this study, it was aimed to increase the success of the K-means algorithm. The proposed method that we called double k was applied to synthetic dataset. It has been observed that double k method is more successful in finding final clustering labels than the K-Means and K-Means++ methods.

Açıklama

Anahtar Kelimeler

Veri Madenciliği, Kümeleme, Başlangıç Ağırlık Merkezleri, K-Ortalamalar, K-Ortalamalar++., Data Mining, Clustering, Initial Centroids, K-Means, K-Means++

Kaynak

Avrupa Bilim ve Teknoloji Dergisi

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

23

Künye

Yücelen, A.M. ve Baykal, A. (2021). K-Ortalamalar kümeleme yöntemi İçin çift K başlatma algoritması. Avrupa Bilim ve Teknoloji Dergisi, (23), 280-287. https://doi.org/10.31590/ejosat.866830