مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشهبندی در دنیای واقعی، اغلب با مجموعه دادههایی مواجهیم که از ترکیبی از مقادیر عددی و دستهای تشکیل شدهاند. در حالیکه اغلب روشهای خوشهبندی موجود تنها بر روی دادههای عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی دادههای مختلط را ندارند. از سوی دیگر، بیشتر روشهای سنتی، تعداد خوشهها را به عنوان ورودی از کاربر طلب میکنند. در حالیکه در بیشتر موارد تعداد خوشهها برای کاربر مقداری نامعلوم است و حدس زدن مقدار آن نیز به خصوص در مورد مجموعه دادههای بزرگ کاری مشکل و حتی غیرممکن است. در این مقاله قصد داریم تا با بهرهگیری از روشی دقیقتر جهت اندازهگیری فاصله میان مقادیر دستهای، روش جدیدی را برای خوشهبندی دادههای مختلط ارائه نماییم که نیازی به تعیین تعداد خوشهها به عنوان ورودی الگوریتم نداشته و قادر است همزمان با خوشهبندی داده ها، مقدار بهینه برای تعداد خوشهها را محاسبه نماید. در روش پیشنهادی معکوس شاخص Davies-Bouldin به عنوان تابع برازش در نظر گرفته شده و به منظور جستجوی فضای جواب از الگوریتم ژنتیک استفاده میشود. برای ارزیابی عملکرد الگوریتم از دو گروه از داده های استاندارد و شبیهسازی شده استفاده شده است. نتایج بدست آمده، عملکرد بسیار بالای الگوریتم پیشنهادی را نشان میدهد
بازنشر اطلاعات | |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |