1. خلاصه مطالب و نتیجه ­گیری

بی­شک امروزه مباحث داده ­کاوی، جایگاه مهمی در توسعه سامانه­های هوشمند دارند. در حوزه­ ترافیک نیز با توجه به حجم زیاد داده ­ها، توجه به مباحث داده ­کاوی و بکارگیری الگوریتم­های موجود در حوز­ه­ی هوش مصنوعی و یادگیری ماشین می ­تواند در ارتقاء و توسعه سیستم­های حمل­ونقل هوشمند مؤثر باشد. خوشبختانه استفاده از این علوم این امکان را فراهم می­ کند که بجای نگهداری و استفاده از داده ­های خام، دانش موجود در این داده ­ها را کشف و استخراج کرد و به کمک الگوریتم­های ماشینی به تحلیل ویادگیری آن­ها پرداخت. در این رساله نیز از الگوریتم­های موجود در حوز­ه­ی هوش مصنوعی و یادگیری ماشین در راستای پیش ­بینی کوتاه­مدت ترافیک شهری استفاده شده است.
بطور کلی، کلاسه­بندی، کلاسترینگ، پیش ­بینی و…. از جمله اهداف الگوریتم­های یادگیری به شمار می­آیند. همانطور که پیش­تر توضیح داده شد، بر خلاف کلاسه‌بند که برچسب­های گسسته را پیش‌بینی می‌کند، پیش‌بینی‌کننده، توابع با مقادیر پیوسته را مدل می‌کند، یعنی به جای برچسب کلاس، مقادیر عددی را پیش‌بینی می‌کند. در این رساله نیز، داده ­های مورد بررسی، نرخ ترافیکی هستند، یعنی همان مقادیر عددی، که قرار است مقادیر آن­ها در آینده پیش ­بینی شود. آنالیز رگرسیون نیز یک متدولوژی آماری است که غالباَ برای پیش ­بینی مقادیر عددی استفاده می‌شود. در واقع از آنجا که داده ­های در اختیار گذاشته شده در این پایان نامه، داده ­های ترافیکی و به بیانی دقیق‌تر تعداد وسایل نقلیه عبوری از خیابان­هاست، هدف اصلی در این‌جا نیز اعمال روشی بهینه مبتنی بر رگرسیون بود. از میان روش­های گوناگون، تمرکز تعداد قابل توجهی از تحقیقات اخیر به روی الگوریتم­های یادگیری تجمعی می‌باشد. دو دسته از مهم­ترین و شناخته­شده­ترین متدها در زمینه‌ی یادگیری تجمعی، الگوریتم­های بوستینگ و بگینگ می­باشد. الگوریتم رندوم فارست، الگوریتمی قدرتمند مبتنی بر یادگیری تجمعی است که حالت عمومی­تر از متدهای بگینگ به شمار می ­آید که در این پایان نامه نیز استفاده شده است.

( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

از طرف دیگر، تاکید منحصر به روی الگوریتم­های یادگیری، بدون استفاده از دانش موجود در مورد رفتارها در برخی از مسائل منجر به افت کارایی مدل­سازی می­ شود. داده ­های ترافیکی نیز داده­هایی هستند که دنبال کردن رفتارها و توجه به روند جریان­های ترافیکی آن­ها، می ­تواند در دقت مدل آموزش دیده، تاثیر­گذار باشد. اکثر الگوریتم­هایی که قادر به لحاظ کردن رفتار داده ­ها در مدل­سازی هستند، همچون الگوریتم­های سری زمانی، رفتارهای فصلی و طولانی را دنبال می­ کنند. حال آنکه، در این رساله، هدف انجام پیش ­بینی کوتاه­مدت است. از این رو، هدف این پایان نامه دخیل کردن رفتار داده‌ی مورد بررسی قبل از انجام مدل‌سازی است که این رویکرد را با انجام مراحل گوناگون اعمال می­ کند.
به بیانی دیگر، در مراحل ابتدایی تحلیل داده، قبل از انجام پیش­پردازش­ها و نمونه­برداری از داده‌ها، ما به بررسی رفتار جریان‌های ترافیکی، پرداختیم و اطلاعات بدست­آمده از روند تغییرات آنها در طول زمان، ما را به این نتیجه رساند که در مدل­سازی­ها، از تأثیر تغییرات این روند­ها استفاده کنیم. در راستای اعمال تکنیک، در اولین گام، ماهیت داینامیک جریان‌های ترافیکی و رفتارهای وابسته به زمان جمع­آوری آن‌ها مورد توجه قرارگرفت. با بررسی توزیع داده و کمک از الگوریتم­های داده ­کاوی به این نتیجه رسیدیم که رفتار ترافیکی مشاهده شده‌ی مربوط به یک مسیر، معمولاً در طی سایکل­های مختلف متناوباً تکرار می­ شود. همچنین جریان‌های ترافیکی مربوط به همه مسیر‌ها­، در ساعات اولیه سایکل­ها، نرخ ترافیکی بالایی دارند. نظر به اینکه زمان واقعی جمع آوری این داده ­ها را در اختیار نبود و داده ­ها حاصل شبیه­ساز ترافیک شهری TSFبود، بنابراین، سعی بر آن شد تا با بررسی قوانین موجود در این شبیه ساز ، رفتارها را تفسیر و با رفتار داده ­های واقعی نظیر کنیم. همانطور که می­دانیم روند مشابهی که در مورد وسایل نقلیه در طی روزهای مختلف دیده می‌شود، این‌است که رفت‌وآمدها و جابجایی­ها در ساعات ابتدائی روز شروع و اوج می‌گیرند و در ساعات پایانی شب، رفت و آمدها تقریباً ناچیز می­شوند. در TSF نیز، بعد از هر سایکل، توزیع مبدأ و مقصدهای وسایل نقلیه بطور رندوم انتخاب و شبیه سازی از ابتدا شروع می­ شود. بنابراین، این سایکل­ها در این پایگاه داده‌ی مصنوعی می­توانند معادل با روزهای متفاوت در پایگاه داده ­های واقعی در نظر گرفته شوند. علاوه بر این، منطبق با تحقیقات، ساعت‌های اوج ترافیکی، ساعت­های همزمان با شروع فعالیت­های روزانه، همچون رفتن به سر کار، مدارس و … تعریف می‌شوند. در داده‌های مورد بررسی حاصل اجرای سایکل­های به طول ۱۰ساعت هستند، بنابراین احتمال وجود ۱ پیک در طول بازه ۱۰ ساعته، مطابق با انتظار است.
بطور خلاصه مشاهده‌ی رفتارهای مختلف در جریان­های ترافیکی باعث این نتیجه‌گیری شد که آموزش تنها یک مدل برای کل داده کافی نیست و در راستای بکارگیری اطلاعات بدست آمده از روند ترافیکی در ساختن مدل، این سه مرحله به الگوریتم اعمال شد: در ابتدا یک مرحله پیش پردازش داده با هدف کاهش بُعد و اطلاعات تکراری، سپس ، آنالیز گروه­بندی در راستای دسته بندی داده ­ها و مبتنی بر رفتارهای مشاهده شده‌ی جریان­های ترافیکی صورت گرفت که منجر به تشکیل گروه‌های peak و non-peak ­شد و در نهایت دو مدل Contex-Aware RF بطور جداگانه، روی گروه‌های مختلف ارائه شده، خواهند شدند.
نتایج حاصل نشان داد که با این روند آموزش، رندوم فارست بعنوان مدل پیش ­بینی کننده از زمینه داده مورد آموزش باخبر خوهد بود و بر این اساس احتمال گیر افتادن آن در بهینه محلی کمتر خواهد بود. آزمایشات انجام شده بر روی داده‌های فراهم شده دربخش ترافیک مسابقه بین المللی داده کاوی (ICDM) سال ۲۰۱۰ ، مؤید کارایی و مقیاس پذیری روش پیشنهادی در مقایسه با دیگر نتایج بدست آمده توسط تیم‌های برتر مسابقه، می‌باشد.

فهرست منابع و مآخذ

[۱] Ezell, Stephen. “Explaining international IT application leadership: Intelligent transportation systems.” (2010).
[۲] Box, G. E., and Jenkins, G. M. (1976). Time Series Analysis Forecasting and Control. Holden-Day: San Francisco. MR436499.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...