سایت دانلود پایان نامه : مقالات و پایان نامه ها درباره :ارائه چارچوبی در ... - منابع مورد نیاز برای پایان نامه : دانلود پژوهش های پیشین |
-
- خلاصه مطالب و نتیجه گیری
بیشک امروزه مباحث داده کاوی، جایگاه مهمی در توسعه سامانههای هوشمند دارند. در حوزه ترافیک نیز با توجه به حجم زیاد داده ها، توجه به مباحث داده کاوی و بکارگیری الگوریتمهای موجود در حوزهی هوش مصنوعی و یادگیری ماشین می تواند در ارتقاء و توسعه سیستمهای حملونقل هوشمند مؤثر باشد. خوشبختانه استفاده از این علوم این امکان را فراهم می کند که بجای نگهداری و استفاده از داده های خام، دانش موجود در این داده ها را کشف و استخراج کرد و به کمک الگوریتمهای ماشینی به تحلیل ویادگیری آنها پرداخت. در این رساله نیز از الگوریتمهای موجود در حوزهی هوش مصنوعی و یادگیری ماشین در راستای پیش بینی کوتاهمدت ترافیک شهری استفاده شده است.
بطور کلی، کلاسهبندی، کلاسترینگ، پیش بینی و…. از جمله اهداف الگوریتمهای یادگیری به شمار میآیند. همانطور که پیشتر توضیح داده شد، بر خلاف کلاسهبند که برچسبهای گسسته را پیشبینی میکند، پیشبینیکننده، توابع با مقادیر پیوسته را مدل میکند، یعنی به جای برچسب کلاس، مقادیر عددی را پیشبینی میکند. در این رساله نیز، داده های مورد بررسی، نرخ ترافیکی هستند، یعنی همان مقادیر عددی، که قرار است مقادیر آنها در آینده پیش بینی شود. آنالیز رگرسیون نیز یک متدولوژی آماری است که غالباَ برای پیش بینی مقادیر عددی استفاده میشود. در واقع از آنجا که داده های در اختیار گذاشته شده در این پایان نامه، داده های ترافیکی و به بیانی دقیقتر تعداد وسایل نقلیه عبوری از خیابانهاست، هدف اصلی در اینجا نیز اعمال روشی بهینه مبتنی بر رگرسیون بود. از میان روشهای گوناگون، تمرکز تعداد قابل توجهی از تحقیقات اخیر به روی الگوریتمهای یادگیری تجمعی میباشد. دو دسته از مهمترین و شناختهشدهترین متدها در زمینهی یادگیری تجمعی، الگوریتمهای بوستینگ و بگینگ میباشد. الگوریتم رندوم فارست، الگوریتمی قدرتمند مبتنی بر یادگیری تجمعی است که حالت عمومیتر از متدهای بگینگ به شمار می آید که در این پایان نامه نیز استفاده شده است.
( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
از طرف دیگر، تاکید منحصر به روی الگوریتمهای یادگیری، بدون استفاده از دانش موجود در مورد رفتارها در برخی از مسائل منجر به افت کارایی مدلسازی می شود. داده های ترافیکی نیز دادههایی هستند که دنبال کردن رفتارها و توجه به روند جریانهای ترافیکی آنها، می تواند در دقت مدل آموزش دیده، تاثیرگذار باشد. اکثر الگوریتمهایی که قادر به لحاظ کردن رفتار داده ها در مدلسازی هستند، همچون الگوریتمهای سری زمانی، رفتارهای فصلی و طولانی را دنبال می کنند. حال آنکه، در این رساله، هدف انجام پیش بینی کوتاهمدت است. از این رو، هدف این پایان نامه دخیل کردن رفتار دادهی مورد بررسی قبل از انجام مدلسازی است که این رویکرد را با انجام مراحل گوناگون اعمال می کند.
به بیانی دیگر، در مراحل ابتدایی تحلیل داده، قبل از انجام پیشپردازشها و نمونهبرداری از دادهها، ما به بررسی رفتار جریانهای ترافیکی، پرداختیم و اطلاعات بدستآمده از روند تغییرات آنها در طول زمان، ما را به این نتیجه رساند که در مدلسازیها، از تأثیر تغییرات این روندها استفاده کنیم. در راستای اعمال تکنیک، در اولین گام، ماهیت داینامیک جریانهای ترافیکی و رفتارهای وابسته به زمان جمعآوری آنها مورد توجه قرارگرفت. با بررسی توزیع داده و کمک از الگوریتمهای داده کاوی به این نتیجه رسیدیم که رفتار ترافیکی مشاهده شدهی مربوط به یک مسیر، معمولاً در طی سایکلهای مختلف متناوباً تکرار می شود. همچنین جریانهای ترافیکی مربوط به همه مسیرها، در ساعات اولیه سایکلها، نرخ ترافیکی بالایی دارند. نظر به اینکه زمان واقعی جمع آوری این داده ها را در اختیار نبود و داده ها حاصل شبیهساز ترافیک شهری TSFبود، بنابراین، سعی بر آن شد تا با بررسی قوانین موجود در این شبیه ساز ، رفتارها را تفسیر و با رفتار داده های واقعی نظیر کنیم. همانطور که میدانیم روند مشابهی که در مورد وسایل نقلیه در طی روزهای مختلف دیده میشود، ایناست که رفتوآمدها و جابجاییها در ساعات ابتدائی روز شروع و اوج میگیرند و در ساعات پایانی شب، رفت و آمدها تقریباً ناچیز میشوند. در TSF نیز، بعد از هر سایکل، توزیع مبدأ و مقصدهای وسایل نقلیه بطور رندوم انتخاب و شبیه سازی از ابتدا شروع می شود. بنابراین، این سایکلها در این پایگاه دادهی مصنوعی میتوانند معادل با روزهای متفاوت در پایگاه داده های واقعی در نظر گرفته شوند. علاوه بر این، منطبق با تحقیقات، ساعتهای اوج ترافیکی، ساعتهای همزمان با شروع فعالیتهای روزانه، همچون رفتن به سر کار، مدارس و … تعریف میشوند. در دادههای مورد بررسی حاصل اجرای سایکلهای به طول ۱۰ساعت هستند، بنابراین احتمال وجود ۱ پیک در طول بازه ۱۰ ساعته، مطابق با انتظار است.
بطور خلاصه مشاهدهی رفتارهای مختلف در جریانهای ترافیکی باعث این نتیجهگیری شد که آموزش تنها یک مدل برای کل داده کافی نیست و در راستای بکارگیری اطلاعات بدست آمده از روند ترافیکی در ساختن مدل، این سه مرحله به الگوریتم اعمال شد: در ابتدا یک مرحله پیش پردازش داده با هدف کاهش بُعد و اطلاعات تکراری، سپس ، آنالیز گروهبندی در راستای دسته بندی داده ها و مبتنی بر رفتارهای مشاهده شدهی جریانهای ترافیکی صورت گرفت که منجر به تشکیل گروههای peak و non-peak شد و در نهایت دو مدل Contex-Aware RF بطور جداگانه، روی گروههای مختلف ارائه شده، خواهند شدند.
نتایج حاصل نشان داد که با این روند آموزش، رندوم فارست بعنوان مدل پیش بینی کننده از زمینه داده مورد آموزش باخبر خوهد بود و بر این اساس احتمال گیر افتادن آن در بهینه محلی کمتر خواهد بود. آزمایشات انجام شده بر روی دادههای فراهم شده دربخش ترافیک مسابقه بین المللی داده کاوی (ICDM) سال ۲۰۱۰ ، مؤید کارایی و مقیاس پذیری روش پیشنهادی در مقایسه با دیگر نتایج بدست آمده توسط تیمهای برتر مسابقه، میباشد.
فهرست منابع و مآخذ
[۱] Ezell, Stephen. “Explaining international IT application leadership: Intelligent transportation systems.” (2010).
[۲] Box, G. E., and Jenkins, G. M. (1976). Time Series Analysis Forecasting and Control. Holden-Day: San Francisco. MR436499.
فرم در حال بارگذاری ...
[شنبه 1401-04-18] [ 12:58:00 ق.ظ ]
|