خوشه بندی

 

خوشه بندی (Clustering)

«تحلیل خوشه بندی» (Cluster Analysi) یا به طور خلاصه خوشه بندی (Clustering)، فرآیندی است که به کمک آن میتوان مجموعه ای از اشیا را به گروه های مجزا تقسیم بندی کرد. که به هر یک از این گروه ها خوشه گفته میشود. اینکار به این صورت است که اشیا در یک گروه (خوشه) بسیار به یکدیگر مشابه، و نسبت به سایر گروه ها (خوشه ها) متفاوت هستند. این وظیفه اصلی داده کاوی اکتشافی است و یک روش معمول برای تجزیه و تحلیل داده های آماری که در بسیاری از زمینه ها از جمله یادگیری ماشین، تشخیص الگو، تجزیه و تحلیل تصویر، بازیابی اطلاعات، بیوانفورماتیک، فشرده سازی داده ها و گرافیک کامپیوتری استفاده میشود.

این نوع از تجزیه و تحلیل خود یک نوع الگوریتم خاص نیست، بلکه روند کلی است و می تواند توسط الگوریتم های مختلفیی به دست آید که درک آنچه که یک خوشه را تشکیل میدهد و نحوه کارآمدی آن ها را پیدا می کند.

به این ترتیب تفاوت اصلی که بین تحلیل خوشه بندی و «طبقه بندی» ( Classification Analysis) وجود دارد، نداشتن برچسب های اولیه برای مشاهدات است. در نتیجه بر اساس ویژگی های مشترک و روش های اندازه گيری فاصله یا شباهت بین اشیاء، باید برچسب (Lable) هایی بطور خودکار نسبت داده شوند. در حالیکه در طبقه بندی برچسب های اولیه موجود است و باید با استفاده از الگوهای پیش بینی قادر به برچسب گذاری برای مشاهدات جدید باشیم.

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *