خوشه ‏بندی توافقی دادههای توزیع شده ناهمگن

۱۰۰ هزار تومان ۷۰ هزار تومان
افزودن به سبد خرید

جهت خرید و دانلود پایاننامه ارشد کامپیوتر خوشه ‏بندی توافقی دادههای توزیع شده ناهمگن روی خرید محصول کلیک و یا با ایمیل زیر در ارتباط باشید

sellthesis@gmail.com


پایان نامه پایان‏نامه کارشناسی ارشد کامپیوتر نرم ‏افزار خوشه ‏بندی توافقی دادههای توزیع شده ناهمگن


خرید محصول پایاننامه ارشد کامپیوتر خوشه ‏بندی توافقی دادههای توزیع شده ناهمگن


چکیده:

خوشه ‏بندی را می‏توان یکی از مهمترین مراحل در تحلیل داده‏ها برشمرد. روش‏های خوشه‏بندی بسیاری تاکنون توسعه و ارائه داده شده‏اند. یکی از این روش‏ها که در مطالعات اخیر مورد توجه و بررسی قرار گرفته است، روش خوشه‏بندی توافقی می‏باشد. هدف خوشه‏بندی توافقی ترکیب چند خوشه‏بندی اولیه و بدست آوردن یک خوشه‏بندی نهایی است به گونه‏ای که در آن خوشه‏ها از کیفیت بالاتری، نسبت به خوشه‏ها در خوشه‏بندی‏های اولیه، برخوردار باشند.
ما در این پایان نامه فرآیندی را جهت انجام خوشه‏بندی توافقی بر روی داده‏های توزیع شده ناهمگن ارائه خواهیم نمود که این فرآیند از سه مرحله تشکیل می‏شود. در مرحله‏ی اول خوشه‏های نظیر به نظیر در خوشه‏بندی‏های اولیه تشخیص داده می‏شود. در مرحله‏ی دوم هر یک از خوشه‏بندی‏های اولیه وزن‏دار می‏شوند. در مرحله‏ی سوم نیز خوشه‏بندی توافقی با توجه به وزن اختصاص داده شده به خوشه‏بندی‏ها، انجام می‏گردد.
در این پایان نامه فرآیند پیشنهادی بر روی داده‏هایی که به صورت ناهمگن توزیع شده‏اند، مورد ارزیابی قرار گرفته است. نتایج ارزیابی‏های انجام شده نیز با 4 الگوریتم دیگر در زمینه‏ی خوشه‏بندی توافقی مقایسه شده است. مقایسه‏های انجام شده بیانگر آن است که فرآیند پیشنهادی در اغلب موارد از کارایی بالاتری نسبت به دیگر الگوریتم‏ها برخوردار است.


فهرست مطالب

عنوان صفحه
چکیده 1
فصل اول مقدمه 2
1-1- مقدمه 3
1-2- داده کاوی 3
1-3- روش‏های داده کاوی 4
1-4- خوشه‏بندی 5
1-5- خوشه‏بندی توافقی 9
1-6- تحقیقات انجام گرفته در پایان نامه 12
1-7- نتایج بدست آمده 13
1-8- ساختار پایان نامه 13
فصل دوم مروری بر کارهای انجام شده 14
2-1- مقدمه 15
2-2- روش‏های خوشه‏بندی 15
2-2-1- روش‏های بخش‏بندی 17

2-2-2- روش‏های سلسله مراتبی 19
2-2-3- الگوریتم خوشه‏بندی K-Means 19
2-3- خوشه‏بندی توافقی 22
2-3-1- انگیزه‏های استفاده از خوشه‏بندی توافقی 23
2-3-2- مسئله خوشه‏بندی توافقی: ارائه‏ی مثال 25
2-3-3- مروری بر روش‏های خوشه‏بندی توافقی 26
2-3-4- گروه‏بندی روش‏های خوشه‏بندی توافقی 27
2-3-5- روش‏های شباهت محور 31
شباهت دوبه‏دو(ماتریس همبستگی) 31
گراف محور 35
2-3-6- روش‏های توافقی با استفاده از اطلاعات دوجانبه 39
2-3-7- روش‏های توافقی با استفاده از مدل ترکیبی 40
2-3-8- روش‏های توافقی رأی محور 42
2-4- روش‏های تولید اجتماع خوشه‏بندی‏ها 46
2-5- خلاصه فصل 49
فصل سوم ارائه‏ی راهکار پیشنهادی: خوشه‏بندی توافقی بر روی داده‏های توزیع شده ناهمگن 51
3-1- مقدمه 52
3-2- راهکار پیشنهادی 53
3-2-1- تشخیص نظیر به نظیر بودن خوشه ها 53
3-2-2- خوشه‏بندی‏های دارای وزن 60
3-2-3- خوشه‏بندی‏ توافقی بر روی داده های توزیع شده ناهمگن 64
3-3- تولید اجتماع خوشه‏بندی‏ها 67
3-4- خلاصه فصل 68
فصل چهارم پیاده‏سازی راهکار پیشنهادی و نتایج ارزیابی آن 70
4-1- مقدمه 71
4-2- معیارهای ارزیابی 71
4-2-1- معیار دقت 72
4-2-2- شاخص Davies-Bouldin 73
4-2-3- شاخص Rand 73
4-2-4- متوسط اطلاعات دوجانبه نرمال‏سازی شده (ANMI) 75
4-3- پیاده‏سازی 76
4-4- مجموعه‏های داده‏ای 76
4-5- نتایج ارزیابی 78
4-5-1- معیار دقت 78
4-5-2- شاخص Davies-Bouldin 81
4-5-3- شاخص Rand 83
4-5-4- متوسط اطلاعات دوجانبه نرمال‏سازی شده (ANMI) 85
4-6- خلاصه فصل 87
فصل پنجم نتیجه‏گیری و کارهای آینده 88
5-1- مقدمه 89
5-2- نتیجه‏گیری 89
5-3- کارهای آینده 92
مراجع 94
پیوست الف : فهرست اختصارات 100
پیوست ب : واژه‏نامه انگلیسی به فارسی 101
پیوست ج : واژه‏نامه فارسی به انگلیسی 107


1-1- مقدمه

در این بخش ابتدا به بررسی مفاهیم اولیه‏ای نظیر داده‏کاوی و خوشه‏بندی می‏پردازیم. سپس مسئله‏ی خوشه‏بندی توافقی با استفاده از یک مثال مطرح می‏گردد. پس از آن کلیات تحقیقات انجام گرفته در این پایان نامه و نتایج بدست آمده در ارزیابی‏ها ارائه خواهد شد.


1-2- داده کاوی

ما در جهانی مملوء از اطلاعات زندگی می‏کنیم. سیستم‏های کامپیوتری پیشرفته، با حجم بسیار زیادی از داده‏ها مواجه هستند که از منابع مختلفی نظیر پایانه‏های فروش ، تراکنش‏های بانکی، تجارت الکترونیک، کارت‏های اعتباری و ماهواره‏ها جمع آوری می‏شوند. بنابراین با توجه به افزایش روز افزون حجم داده‏ها نیاز به وجود فرآیندی جهت تحلیل و استخراج دانش نهفته در آنها بیش از پیش حس می‏شود.
داده کاوی در یک تعریف ساده فرآیندی جهت کشف دانش از مجموعه‏های داده‏ای بزرگ می‏باشد. در بسیاری از موارد، اصطلاح داده کاوی مترادف با عبارت کشف دانش از داده بکار می‏رود، اما در حقیقت داده کاوی یکی از مراحل اصلی کشف دانش است. شکل 1-1 . فرآیند کشف دانش از داده را نشان می‏دهد و همانطور که مشخص است این فرآیند شامل یک دنباله تکراری از مراحل زیر است [37]:
1. پاکسازی داده‏ها (جهت حذف نویز و داده‏های ناسازگار)
2. یکپارچه سازی داده‏ها (مرحله‏ای که چند منبع داده‏ای با هم ترکیب می‏شوند)
3. انتخاب داده‏ها (مرحله‏ای که داده‏های مرتبط با فرآیند تحلیل، از پایگاه داده بازیابی می‏شوند)
4. تبدیل داده‏ها (مرحله‏ای که داده‏ها به شکلی مناسب برای انجام تحلیل، تبدیل می‏شوند. به عنوان مثال عملیاتی نظیر خلاصه سازی و همسان سازی می‏توانند برای تبدیل استفاده شوند)
5. داده کاوی (فرآیند اصلی که در آن از روش‏های هوشمند و آماری به منظور استخراج الگوهای داده‏ای استفاده می‏شود)
6. ارزیابی الگو (جهت تشخیص الگوهای صحیح و مورد نظر با استفاده از معیارهای اندازه گیری)
7. ارائه دانش (مرحله‏ای که از روش‏های نمایش بصری و ارائه دانش جهت نمایش دانش کشف شده به کاربر استفاده می‏شود)

مرور

هیچ دیدگاهی برای این محصول نوشته نشده است.