بنابراین فرضیه قدرت پیش بینی یکسان را در سطح ۹۵% زمانی رد می کنیم که داشته باشیم:

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

اما این آماره سال­های بعدها توسط هاروی – لیبورن- نیوبولد برای نمونه­های کوچک و تابع زیان خاص مجذور خطا به صورت زیر اصلاح گردید:
×
آماره­ی دارای توزیع t-student از درجه­ آزادی N-1می­باشد.

۱-۹)تعریف واژه ­ها و اصطلاحات تخصصی طرح

سری‌های زمانی (Time Series): داده‌هایی که طی زمان ثبت شده و یک دنباله‌ی زمانی را بوجود می‌آورند.
خودرگرسیو میانگین متحرک انباشته (ARIMA): مدل ترکیبی از مدل‌های میانگین متحرک و خودرگرسیو با احتساب شرط مانایی است که به مدل باکس و جنکینز شناخته می‌شود.
شاخص بازده نقدی و قیمت : نشان دهنده تغییرات قیمتی و بازده نقدی سهام در بورس اوراق بهادار می­باشد .به عبارتی نشان دهنده تغییرات بازدهی کل سرمایه ­گذاری در بورس اوراق بهادار می­باشد.
مانایی (Stationarity): اگر در طول زمان تمامی گشتاور‌های یک سری ثابت، اکیداً مانا و اگر فقط گشتاور مرتبه‌ی اول و دوم ثابت باشد، مانای ضعیف نامیده می­ شود.
SVM: ماشین بردار پشتیبان که به عنوان یک تکنیک نوین شبکه عصبی معرفی می شود و معمولاً در سری‌های زمانی به دلیل کارایی بالای آن در عمل استفاده می‌شود.
شبکه­ عصبی پیش­خور (FFNN): شبکه‌ی عصبی پیش­خور یکی از انواع شبکه که معمولاً در سری‌های زمانی از آن استفاده می‌شود.
روش ترکیبی (Hybrid): این مدل ترکیبی از دو روش خودرگرسیو میانگین متحرک انباشته و شبکه‌ی عصبی می‌باشد.
فصل دوم:
مبانی نظری و مروری بر ادبیات تحقیق

۲-۱) مقدمه

در زمینه مدل‌سازی سری­های زمانی، روش­های متفاوتی مورد استفاده قرار می‌گیرد. مدل‌های سنتی مانند میانگین متحرک، هموارسازی نمایی و ARIMAپیش‌بینی آینده را به روابط خطی از گذشته محدود می‌نمایند و الگوهای خطی را مدل سازی می­ کنند. از این مدل‌ها به دلیل سادگی در فهم و کاربرد در دهه‌ های اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمی­تواند الگوهای غیر خطی را خوب مدل سازی کند.
به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدل‌های غیرخطی مانند[۲۲]ARCH GARCH, [۲۳] ،[۲۴]TGARCH مطرح گردیدند. همگی این مدل‌ها، الگوهای غیرخطی بخصوصی­ را­ توضیح می‌دهند.
اما شبکه عصبی مجازی([۲۵]ANN) توان و قدرت پیش‌بینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل می کند. شبکه ­های عصبی مصنوعی از عناصر عملیاتی ساده­ای ساخته می­شوند که به صورت موازی در کنار یکدیگر عمل می­ کنند. این عناصر که از سیستم­های عصبی زیستی الهام گرفته شده ­اند، در تلاش­اند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نکته حائز اهمیت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام[۲۶] و راکس[۲۷] اذعان داشتند عملکرد شبکه عصبی برای مساله‌های رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) می‌باشد.
از طرفی ماشین بردار پشتیبان (SVM)[28] به عنوان تکنیک نوین یکی از روش­های یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک[۲۹] در دهه ۹۰ میلادی توسط واپنیک و همکارانش ارائه گردید. این روش از جمله روش‌های نسبتاً جدیدی است که در سال‌های اخیر کارایی خوبی نسبت به روش‌های قدیمی‌تر از جمله شبکه‌های عصبی پرسپترون نشان داده است. رگرسیون بردار پشتیبان این عمل را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است، انجام می­دهد.
همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدل­سازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش( به منظور انجام فرایند یادگیری) مواجه می­باشد. اما چون دانستن خصوصیات داده ­ها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده می­ شود، بنابراین این ایده به ذهن می­رسد که ترکیب مدل خطی آریما با مدل­های غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان می ­تواند باعث بهبود دقت پیش ­بینی گردد.
در مدل ترکیبی سعی بر این داریم ابتدا روابط غیر­خطی در پسماندها را با بهره گرفتن از شبکه­ عصبی و رگرسیون بردار پشتیبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیله‌ی شبکه عصبی و رگرسیون بردار پشتیبان پیش‌بینی خواهد شد.
با عنایت به مطالبی که ذکر شد این سوال پیش می ­آید که کدامیک از مدل­های رگرسیون بردار پشتیبان، شبکه عصبی، خودرگرسیو میانگین متحرک انباشته و مدل­های ترکیبی، با دقت بالاتر و خطای کمتری توانایی پیش ­بینی شاخص بورس اوراق بهادار تهران را دارد؟
از آنجا که الگوی داده ­ها در واقعیت اغلب پیچیده می­باشد، مطالعات زیادی به منظور ترکیب مدل­های خطی و غیر­خطی انجام پذیرفته است. بنابراین در ابتدا به معرفی مدل خودرگرسیو میانگین متحرک انباشته و اجزای تشکیل دهنده آن یعنی AR ، MA و ARMA می­پردازیم. سپس بعد از معرفی کلی شبکه ­های عصبی، اجزا و ساختار­های آن، شبکه­ عصبی پیش­خور با الگوریتم یادگیری پس انتشار خطا را که اغلب در سری­های زمانی از آن استفاده می شود شرح خواهیم داد. بعد از مرور بر مبانی نظری مدل­های خودرگرسیو میانگین متحرک انباشته و شبکه­­های عصبی، نگاهی بر نتایج پیچیده­ شبکه ­های عصبی و خودرگرسیو میانگین متحرک انباشته در سری­های زمانی مختلف خواهیم انداخت و در پایان به مرور برخی از مطالعات در زمینه­­ ترکیب مدل­های خطی و غیر­خطی می­پردازیم.

۲-۲) انواع داده ها

انواع داده های مورد استفاده در مباحث اقتصادی مالی را می­توان به سه دسته کلی تقسیم نمود: سری­های زمانی، داده ­های مقطعیو داده ­های پانل(ترکیبی)]۱۱[
۲-۲-۱) داده های سری زما­نی[۳۰]
داده های سری زمانی مربوط به یک دوره زمانی معین است که ممکن است سالانه، فصلی، ماهانه، هفتگی، روزانه باشد. داده های سری زمانی به فراوانی خاصی از مشاهدات و یا مجموعه ای از داده های نقطه­ای مربوط می شود. فراوانی ، تابعی از فاصله و یا ترتیب زمانی است که داده ها بر اساس آن جمع آوری وثبت شده است .
۲-۲-۲ (داده های مقطعی[۳۱]
داده های مقطعی بیانگر اطلاعات مربوط به یک متغیر در یک زمان معین می­باشد.
۲-۲-۳(داده های پانل[۳۲]
داده های ترکیبی یا پانل ترکیبی از داده ­های سری زمانی و مقطعی است. داده های قیمت روزانه تعدادی از سهام با رشد بالا در طول دو سال از نوع داده های پانل هستند .

۲-۳)مدل­های سری زمانی تک متغیره[۳۳]

در مدل­های سری­ زمانی تک متغیره تلاش می­ شود تا متغیرهای اقتصادی و مالی را بر اساس مقادیر گذشته و جاری آن متغیر و همچنین مقادیر جاری و گذشته جملات خطا، مدل سازی و پیش بینی نمایند. مدل­های سری­زمانی در مقابل مدل­های ساختاری[۳۴] مطرح می­گردند. مدل­های ساختاری ماهیتاٌ چند متغیره بوده و تغییرات یک متغیر را توسط تغییرات مقادیر جاری و گذشته متغیرهای دیگر توضیح دهند. اما این مدل­ها نسبت به مدل­های ساختاری دارای دو مزیت عمده به قرار زیر می­باشند:]۳۲،۶۰[
مدل­های ساختاری یک پیش­فرض تئوریک را مبنای برقراری رابطه­ علت و معلول بین متغیرهای مستقل و وابسته قرار می­ دهند، در حالی که مدل­های سری زمانی نیازی به این پیش فرض ندارند.
مدل­های ساختاری در پیش ­بینی خارج از نمونه ­ای[۳۵] چندان خوب عمل نمی­کنند.
۲-۴) برخی مفاهیم سری­های زمانی :
۲-۴-۱) فرآیندهای اکیداً مانا[۳۶]
فرآیندهای اکیداً مانا ، فرایندی است که به ازای رابطه زیر برقرار باشد .
معادله (۲-۱)
که Fتابع توزیع مشترک مجموعه ای از متغیرهای تصادفی است.این را می توان بدین صورت نیز بیان نمود که احتمال سری {}با احتمال سری{}به ازای هرk یکسان است .به عبارتی دیگر یک سری زمانی در صورتی اکیداً مانا است که توزیع مقادیر آن ، همراه با گذشت زمان یکسان بماند.این شرط دلالت بر این دارد که احتمال این که Yدر یک فاصله معین قرار گیرد، در زمان حال، آینده و گذشته یکسان است[۱۱].
۲-۴-۲) فرآیندهای مانای ضعیف[۳۷]
اگر یک سری زمانی شرایط زیر را به ازای هر t تامین کند ، آن را مانای ضعیف گویند :
معادله (۲-۲)
معادله (۲-۳)
معادله (۲-۴)
شرایط سه گانه فوق بیان می کندکه فرآیندهای مانا بایستی دارای میانگین ثابت، واریانس ثابت وساختار خودکواریانس ثابت باشند. [۱۱]

۲-۴-۳ ) خودکوواریانس[۳۸]، خودهمبستگی[۳۹]، خودهمبستگی جزئی[۴۰] [۴۸,۲۷]

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...