itm_id

کد آیتم/ محصول

ratings

امتیاز

date

تاریخ

۵-۲-۳- ایجاد مجموعه داده نمونه[۱۰۷]
با توجه به اینکه جدول ratings شامل ۵۷۳۹۳۱ رکورد مربوط به نظرات کاربران در خصوص آیتمهای مختلف می­باشد و اجرای مدل پایه و مدل توسعه یافته بر روی این اطلاعات مستلزم صرف زمان بسیار زیاد می­باشد، لذا نسبت به استخراج چندین مجموعه داده نمونه مطابق مراحل زیر برای بررسی و انجام آزمایشات و تسریع در روند تحقیق اقدام شده است.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

مرتب سازی اطلاعات جدول ratings بر اساس امتیاز تعلق گرفته به آیتمهای مختلف
استخراج ۲۰ درصد اطلاعات متناسب با نسبت تعداد موجود از هر امتیاز در محدوده ]۵,۱ [به جهت حفظ نحوه پراکندگی اطلاعات
۵-۳- مجموعه داده movielens
یکی دیگر از مجموعه داده­هایی که در این تحقیق مورد استفاده و بررسی قرار گرفته است مجموعه داده سایت Movielens[108] می­باشد. این سایت یکی از بزرگترین سایتهای موجود در زمینه به اشتراک گذاری و اجاره فیلم سینمایی می­باشد. در این سایت نظرات کاربران مختلف درباره فیلمها و همچنین امتیازات تخصیص داده شده به هر فیلم قابل مشاهده می­باشد. بر خلاف مجموعه داده epinions، در این مجموعه داده اطلاعات شبکه اعتماد میان کاربران موجود نیست و تنها دسترسی به نظرات کاربران در خصوص فیلمهای گوناگون قابل دسترس است.
۵-۳-۱- ویژگیهای مجموعه داده movielens
از این مجموعه داده، ۳ ویرایش مختلف توسط گروه grouplens دانشگاه Minnesota آمریکا منتشر شده است که در این تحقیق ویرایش شماره ۱ مورد استفاده قرار گرفته است. در این نسخه از مجموعه داده movielens تعداد ۱۰۰۰۰۰ نظرات ۹۴۳ کاربر در خصوص ۱۶۸۲ فیلم موجود می­باشد­. در این مجموعه داده هر کاربر حداقل به ۲۰ فیلم امتیاز داده است بنابراین در این مجموعه داده، مشکل کاربران تازه وارد و همچنین مشکل اندکی اطلاعات وجود ندارد و نمی­ توان از آن برای بررسی عملکرد سیستم توصیه­گر در خصوص کاربران تازه وارد استفاده نمود. همانند مجموعه داده epinions، امتیازات به صورت مقادیر صحیح و در محدوده ]۵,۱[ توسط کاربران بیان شده است. در این مجموعه یک کاربر در مورد یک فیلم تنها یک بار نظر داده است بنابراین ردیفهای تکراری وجود ندارد، همچنین اطلاعات بدون نقص و کاستی ارائه شده است لذا نیازی به پالایش اطلاعات نیست.
با توجه به اینکه در این مجموعه داده شبکه اعتماد میان کاربران وجود ندارد بنابراین برای بکارگیری آن در این تحقیق، محاسبه اعتماد میان هر دو زوج از کاربران به صورت دستی و از طریق فرمول شماره ۳۰ انجام شده است که نتیجه حاصل در قالب جدولی مشابه جدول WOT ذخیره و شامل تعداد ۸۸۹۲۴۹رکورد می­باشد­.
لازم به توضیح است اطلاعات این مجموعه داده در قالب تعدادی فایل متنی ارائه شده است که در ساختارها و جداولی کاملا مشابه جداول مجموعه داده epinions در پایگاه داده SQL Server 2010 درج، یکپارچه و نگهداری شده است.
۵-۴- نیازمندیهای نرم افزاری
برای پیاده سازی مدل TrustWalker پایه و همچنین مدل توسعه یافته از زبان برنامه نویسی Java نسخه ۱٫۶٫۰_۲۴ و محیط توسعه NetBeans IDE[109]نسخه ۷٫۲ و سیستم عامل Windows 7 Ultimate استفاده شده است.
۵-۵- نیازمندیهای سخت افزاری
انجام آزمایشات و اجرای مدل پیاده­سازی شده بر روی یک دستگاه رایانه با مشخصات فنی زیر انجام گرفته است.
Processor : Intel® Core™ i5 CPU M520@2.40 GHz
RAM : 4.00 GB
System Type : 32-bit Operating System
۵-۶- متدولوژی نرم افزاری
پیاده سازی مدل پایه و مدل توسعه یافته کاملا به صورت متدولوژی شی­گرا انجام گرفته است و جهت افزایش سرعت اجرای الگوریتم و بهره گیری از کل توان سیستم، از روش پردازش موازی[۱۱۰] برای پیاده سازی و اجرای متد­های اصلی مدل استفاده شده است.
۵-۷- پارامترهای پیش فرض انجام آزمایشات
جهت حفظ دقت و یکپارچگی در انجام آزمایشات، اخذ نتایج و یکسان بودن شرایط انجام آزمایشات، پارامترها و متغیرهای مورد استفاده در مدل، مطابق جدول شماره ۵-۵ تعیین و تنظیم گردیده­اند.
جدول ۵-۵ : مقادیر پیش فرض پارامترها و متغیرهای مورد استفاده در مدل پیشنهادی

پارامترها و شرایط انجام آزمایش

دقت اجرا

۰٫۰۰۰۱

حداکثر اجرای ناموفق

۱۰۰۰۰

عمق

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...