پایاننامه‌ ارشد کامپیوتر رتبه‌بندی اسناد وب تعاملات کاربران

۱۱۰ هزار تومان ۷۵ هزار تومان
افزودن به سبد خرید

جهت خرید و دانلود پایاننامه‌ ارشد کامپیوتر رتبه‌بندی اسناد وب تعاملات کاربران روی خرید محصول کلیک و یا با ایمیل زیر در ارتباط باشید

sellthesis@gmail.com


پایان نامه‌ کارشناسی ارشد کامپیوتر نرم افزار ارائه مدلی برای رتبه‌بندی اسناد وب بر اساس تعاملات کاربران


خرید محصول پایاننامه‌ ارشد کامپیوتر رتبه‌بندی اسناد وب تعاملات کاربران


چکیده:

امروزه وب جهان گستر به عنوان بهترین محیط جهت توسعه، انتشار و دسترسی به دانش مورد استفاده قرار می‌گیرد. مهم‌ترین ابزار برای دسترسی به این اقیانوس بی کران اطلاعات، موتورهای جستجو می‌باشد که یکی از اصلی‌ترین بخش‌های آن رتبه‌بندی در پاسخ به جستجوی کاربر است. بنابراین کمک به کاربران برای پیدا کردن صفحه وب مورد نظرشان یک مسئله بسیار مهم است. با توجه به مشکلات روش‌های مبتنی بر متن و پیوند، روش‌های مبتنی بر رفتار و قضاوت کاربر برای برقراری عدالت و دموکراسی در وب مورد توجه قرار گرفته است. به عبارت دیگر جهتِ رشد وب از نظر کمی و کیفی، تعیین صفحات اصلح توسط خود کاربران انجام می‌پذیرد. ولیکن تشخیص و استخراج قضاوت کاربران از اهمیت خاصی برخوردار می‌باشد. رفتار کاربر در حین جستجو، شامل متن پرس‌و‌جو، نحوه کلیک کاربر بر روی لیست رتبه‌بندی شده نتایج، زمان توقف در صفحه و دیگر اطلاعات موجود در خصوص وقایع ثبت شده در حین جستجو می‌باشد. این وقایع ثبت شده، حاوی اطلاعات بسیار ارزشمندی هستند که از آن‌ها می‌توان جهت تحلیل و ارزیابی و مدل‌سازی رفتار کاربران به منظور بهبود کیفیت نتایج استفاده کرد. در این پژوهش مدلی ارائه می‌گردد که به ازای هر پرس‌وجوی مشخص بازخوردهای مثبت و منفی کاربران از جمله تعداد دفعات دست‌یابی یک سایت، مدت زمان سپری‌شده در هر سایت، تعداد دانلودهای انجام شده در هر سایت، تعداد کلیک‌های مثبت و تعداد کلیک‌های منفی در هر سایت از لیست نشان داده شده از صفحات وب، را دریافت کرده و رتبه هر صفحه را با استفاده از روش‌ تصمیم‌گیری چند شاخصه محاسبه می‌کند و یک رتبه‌بندی جدید از سایت‌ها ارائه می‌دهد و این رتبه‌بندی را مرتباً با استفاده از بازخوردهای بعدی کاربران به روز می‌نماید.

واژه‌های کلیدی: موتور جستجو، رفتار کاربر، بازخورد کاربر، تصمیم‌گیری چندشاخصه


فهرست مطالب

عنوان صفحه

چکیده 1
فصل اول: کلیات پژوهش
1-1 مقدمه 3
1-2 بازیابی اطلاعات .4
1-3 انگیزش 5
1-4 موتور جستجو .9
1-5 نمایه‌سازی و پردازش پرس‌و‌جو .11
1-6 تصمیم‌گیری چند شاخصه .13
1-7 بيان مسأله اساسي تحقيق 13
1-8 اهمیت و ضرورت انجام تحقيق .14
1-9 اهداف مشخص تحقيق 16
1-10 فرضيه‏هاي تحقیق 16
فصل دوم :مروری بر کارهای انجام شده
2-1 مقدمه 18
2-2 رتبه‌بندی بر مبنای متن .19
2-2-1 مدل فضای برداری 19
2-2-2 مدل احتمالی 20
2-3 رتبه‌بندی مبتنی بر اتصال 22
2-3-1 رتبه‌بندی مستقل از پرس وجو 23
2-3-2 رتبه‌بندی وابسته به پرس وجو 27
2-3-3 چالش‌های رتبه‌بندی بر اساس پیوند 31
2-4 رتبه‌بندی ترکیبی .34
2-5 رتبه‌بندی مبتنی بر یادگیری 37
2-6 رتبه‌بندی مبتنی بر رفتار کاربر 39
2-6-1 گسترش سند 42
2-6-2 روش NM 45
2-6-3 روش CVM .43
2-6-4 روش LA 45
2-6-5 روشی برای رتبه‌بندی وب با تعریف فاکتورهای محبوبیت .46
2-6-6 مدل مارکو از رفتار کاربر به عنوان یک پیش بینی‌گر در جهت یک جستجوی موفق 51
فصل سوم: شرح روش پیشنهادی
3-1 تحلیل یک سیستم چند معیاره .64
3-2 بررسی فرآیند تصمیم‌گیری چند شاخصه 64
3-2-1 بی مقیاس کردن 66
3-2-2 وزن دهی به شاخص‌ها .67
3-3 توصیف روش TOPSIS 69
3-4 روش پیشنهادی 71
فصل چهارم: پیاده سازی و ارزیابی روش پیشنهادی
4-1 خصوصیات روش پیشنهادی 75
4-2 توصیف شبیه‌سازی مدل پیشنهادی .76
4-3 نمونه شبیه‌سازی مدل پیشنهادی 79
فصل پنجم: نتیجه گیری
5-1 بحث و نتیجه گیری 82
5-2 مزایای روش پیشنهادی 83
5-3 کارهای آینده 84
فهرست منابع 85


1-1 مقدمه

اینترنت از صفحات وب که شامل موضوعات متفاوتی هستند، تشکیل شده است. برای یافتن موضوعی خاص در این مجموعه عظیم صفحات، نیاز به استفاده از یک موتور جستجو است. موتورهای جستجو با توجه به پرس‌وجوی کاربر در پایگاه داده‌ی خود جستجو را انجام داده و نتایج جستجو را به کاربر نشان می‌دهند. با توجه به این که امکان پیدا شدن صفحات بسیاری، به عنوان مثال امکان یافتن میلیون‌ها صفحه، به عنوان نتیجه جستجوی یک درخواست وجود دارد و ممکن است که تعداد اندکی از این صفحات نیاز واقعی کاربر را پاسخ دهند، معمولاً موتورهای جستجو نتایج را بر اساس اهمیت صفحه، رتبه‌بندی کرده و به همین ترتیب به کاربر نمایش می‌دهند.
به دلیل گستردگی صفحات موجود در وب و رشد روزافزون آن‌ها، نیاز به روش‌هایی برای رتبه‌بندی صفحات وب بر اساس میزان اهمیت این صفحات و ارتباط آن‌ها با موضوع مورد جستجو است. رتبه‌بندی از اجزای اصلی یک سیستم بازیابی اطلاعات است. در مورد موتورهای جستجوی وب، که از جمله سیستم‌های بازیابی اطلاعات هستند، به دلیل طبیعت به خصوص کاربران وب، نقش رتبه‌بندی بسیار پررنگ‌تر است. برای موتورهای جستجوی وب یافتن هزاران و بلکه میلیون‌ها صفحه به عنوان نتایج جستجو امری طبیعی است و از جهت دیگر کاربر وب، حوصله و زمان کافی برای مشاهده تمام نتایج برای رسیدن به صفحه مورد علاقه خود را ندارد. بیشتر کاربران وب به صفحات بعد از صفحه اول نتایج جستجو اهمیتی نمی‌دهند. بنابراین برای یک موتور جستجوی وب بسیار مهم است که نتایج مورد علاقه کاربر را در صدر نتایج یافت شده به کاربر نشان دهد، در غیر این صورت موتور جستجو کارایی لازم را نخواهد داشت.
از جهت دیگر، نیاز کاربرانی که عمل جستجو در وب را انجام می‌دهند با سیستم‌های بازیابی اطلاعات سنتی، که در آن‌ها تنها به تطبیق واژگان موجود در پرس‌و‌جو و متن صفحات اکتفا می‌شد متفاوت است. در سیستم‌های بازیابی اطلاعات سنتی، صفحه‌ای که توسط کاربر معمولی نوشته شده ممکن است ارتباط بسیار زیادی با درخواست کاربر داشته باشد، در صورتی که هدف جستجو چیز دیگری بوده است. بنابراین کاربران وب بیشتر علاقه‌مند به صفحاتی هستند که نه تنها مرتبط با موضوع بوده بلکه از اعتبار کافی هم برخوردار باشند. در نتیجه، به هنگام جستجوی وب تمرکز از ارتباط بیشتر به سمت اعتبار بیشتر تغییر می‌یابد. وظیفه‌ی یک الگوریتم رتبه‌بندی تشخیص و تخصیص رتبه بیشتر به صفحات معتبرتر در مجموعه صفحات وب است.


1-2 بازیابی اطلاعات

بازیابی اطلاعات شامل استانداردها و پروتکل‌های نمایش، ذخیره‌سازی، سازماندهی و دسترسی به اقلام اطلاعاتی با هدف بازیابی کلیه‌ی اسنادی که با پرس‌وجوی کاربر مرتبط است، می‌باشد. بازیابی اطلاعات به دو حوزه کاربر و اطلاعات و یک حوزه میانی بنام حوزه بازیابی تقسیم می‌شود. در حوزه کاربر نیاز اطلاعاتی کاربر بیان می‌شود که در اکثر موارد باید به زبان سیستم بازیابی این نیاز بیان شود یا اینکه سیستم با توجه به رفتار کاربر، تاریخچه‌ی رفتار وی یا اطلاعات مستقیمی که از تخصص یا موارد شخصی وی دارد، او را مدل کرده و نیاز اطلاعاتی او را پیش‌بینی کند. در حوزه اطلاعات باید اطلاعات و دانش نهفته در اسناد و داده‌ها مدل سازی و سازماندهی شود. حوزه بازیابی نیز فصل مشترک این دو و تطبیق‌دهنده نیاز اطلاعاتی کاربر با اسناد اطلاعاتی است. نیازهای اطلاعاتی یا به صورت پرس‌وجوهای بر خط به حوزه بازیابی ارسال می‌شوند که در این حالت از مجموعه‌ی اسناد موجود موارد مرتبط بازیابی می‌شود و یا اینکه پرس‌وجویی وجود دارد که در معرض جریان اطلاعات (مثلاً اخبار) قرار می‌گیرد و اسناد مرتبط را فیلتر و جدا می‌کند.

مرور

هیچ دیدگاهی برای این محصول نوشته نشده است.