بهبود عملکرد الگوریتم خوشه‌بندی فازی سی- مینز با وزن‌دهی اتوماتیک و محلی ویژگی‌ها

نویسندگان

دانشگاه کردستان - دانشکده مهندسی

چکیده

خوشه‌بندی یکی از راه‌کارهای مهم در تحلیل داده‌هاست. در راه‌کارهای کلاسیکِ خوشه‌بندی معمولاً فرض بر این است که همه ویژگی‌ها از درجه اهمیت یکسانی برخوردارند. این در حالی است که در مجموعه داده‌های واقعی یک سری از ویژگی‌ها اهمیت بیش‌تری نسبت به دیگر ویژگی‌ها دارند. در نتیجه ویژگی‌های مهم تأثیر بیش‌تری در شناسایی خوشه‌های بهینه نسبت به سایر ویژگی‌ها خواهند داشت. در این مقاله، یک الگوریتم خوشه‌بندی فازی با وزن‌دهی اتوماتیک محلی ارائه شده است. الگوریتم پیشنهادی دارای سه مزیت اصلی است. مزیت اول این است که وزن‌دهی ویژگی‌ها را به‌صورت محلی انجام می‌دهد به‌طوری که وزن ویژگی‌ها در یک خوشه نسبت به خوشه دیگر متفاوت است. مزیت دوم، استفاده از یک معیار شباهت غیر اقلیدسی برای به‌دست‌آوردن فاصله بین نمونه‌ها به‌منظور کاهش حساسیت الگوریتم نسبت به نویز است. مزیت سوم این است که وزن ویژگی‌ها به‌صورت تطبیقی و در طول فرآیند یادگیری به‌دست می‌آید. در این مقاله تحلیل‌های ریاضی برای به‌دست‌آوردن توابع به‌روزرسانی مراکز خوشه‌ها و وزن‌های ویژگی‌ها ارائه شده است. هم‌چنین تحلیل‌های ریاضی جهت اثبات هم‌گرایی الگوریتم نیز ارائه شده است. آزمایش‌های انجام گرفته بر روی یک مجموعه داده مصنوعی و پنج مجموعه داده واقعی نشان‌دهنده کارایی بالای الگوریتم پیشنهادی در مقایسه با دیگر الگوریتم‌های پیشنهادی با وزن‌دهی سراسری و محلی ویژگی‌ها است.

کلیدواژه‌ها