امروز: جمعه 4 اسفند 1402
کلمات کلیدی میانگینk تحلیل مولفه­ی اصلی مقداردهی اولیه­ی مرکز خوشه خوشه­بندی
دسته بندی مقالات ترجمه شده isi
بازدید ها 1,324
فرمت فایل docx
حجم فایل 1.357 مگا بایت
تعداد صفحات فایل 5
15,600 تومان
جستجو با PCA-هدایت­شده برای K-means

Pattern Recognition Letters 54 (2015) 50–55

 

PCA-guided search for K-means

 

K-means is undoubtedly the most widely used partitional clustering algorithm. Unfortunately, due to the non-convexity of the model for mulations, expectation maximization (EM) type algorithms converge to different local optima with different initializations. Recent discoveries have identified that the global solution of K means cluster centroids lies in the principal component analysis (PCA) subspace. Based on this insight, we propose PCA-guided effective search for K-means. Because the PCA subspace is much smaller than the original space, searching in the PCA subspace is both more effective and efficient. Extensive experiments on four real world datasets and systematic comparison with previous algorithms demonstrate that our proposed method outperforms the restasit makes the K-means more effective. 

 

Keywords:K-means Principal component analysis Cluster centroid initialization Clustering

 

 

جستجو با PCA-هدایت­شده برای K-means 

 

چکیده

بی‎تردید K-means پرکاربردترین الگوریتم خوشه‎بندی جزئی است. متاسفانه به دلیل نامحدب بودن[1] فرمول‎بندی مدل، الگوریتم‎های نوع بیشینه‎سازی امید ریاضی[2] (EM) با مقادیر اولیه‏ی مختلف به بهینه‎های محلی متفاوتی هم‎گرا می‎شوند. در کشفیات جدید مشخص شده است که پاسخ [بهینه‎ی] کلی برای مراکز خوشه‎های K-means در زیرفضای تحلیل مولفه‎های اصلی (PCA) قرار دارد. ما با این دید، روش جستجوی موثری را با هدایت PCA برای K-means پیشنهاد می‎کنیم. از آن‎جا که زیرفضای PCA بسیار کوچک‎تر از فضای اصلی است، جستجو در این زیرفضا هم موثر[3] و هم کارآمد[4] است. آزمایش‎های گسترده که بر روی چهار مجموعه داده‎ی واقعی انجام شده است و مقایسه نظام‎مند با الگوریتم‎های قبلی نشان می‎دهد که روش پیشنهادی ما عملکرد بهتری نسبت به سایرین دارد و K-means را موثرتر می‎سازد.

 

کلمات کلیدی:

 

میانگین-k

تحلیل مولفه­ی اصلی

مقداردهی اولیه­ی مرکز خوشه

خوشه­بندی


فایل های مرتبط ( 24 عدد انتخاب شده )

بالا