۴-۶-۱ طراحیER 70
۴-۶-۲ طراحی مدل گرافی ۷۲
فصل پنجم: ارزیابی ۷۵
۵-۱ مقدمه ۷۶
۵-۲ روش اول: گروه متمرکز ۷۷
۵-۲-۱ آشنایی باگروه متمرکز ۷۷
عنوان صفحه
۵-۲-۲ مزایای گروه متمرکز ۷۷
۵-۲-۳روش شناسی گروه متمرکز ۷۷
۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز ۷۹
۵-۳ روش دوم: پیاده سازی عملی پایگاه داده ۷۹
۵-۳-۱ نرم افزارنئوفرجی ۸۰
۵-۳-۲ داده های موردنیاز ۸۰
۵-۳-۳ ذخیره داده هادرپایگاه داده نئوفرجی ۸۱
۵-۴ نتایج ۸۳
فصل ششم:جمع بندی و کارهای آتی ۹۰
۶-۱ جمع بندی وکارهای آتی ۹۱
منابع ۹۷
فهرست جدول ها
عنوان صفحه
جدول (۳-۱) : پایگاه داده ی سنتی رابطه ای ۴۵
جدول (۳-۲) : پایگاه دادهEAV 45
جدول(۳-۳) : یک شمای کلیازEAV 46
جدول (۵-۱ ): زمان مربوط به پرس وجوهای مختلف ۸۵
فهرست نمودارها
عنوان صفحه
نمودار(۵-۱) پرس و جوهای یک گره………………………………………………………………………………….۸۶
نمودار(۵-۲) پرس و جوهای دو گره…………………………………………………………………………………..۸۷
نمودار(۵-۳) پرس و جوهای سه گره………………………………………………………………………………….۸۷
نمودار(۵-۴) پرس و جوهای تمام گره ها……………………………………………………………………………۸۸
نمودار(۵-۵) مقایسه کمترین-بیشترین و میانگین زمان پرس و جوها……………………………………….۸۹
فهرست شکل ها
عنوان صفحه
شکل(۲-۱ ) نمونه ای اولیه از پایگاه داده گراف…………………………………………………….. …………..۲۷
شکل(۳-۱)پیاده سازی بیماری همه گیری با پایگاه داده رابطه ای……………………………………………۴۴
شکل(۳-۲)یک پیاده سازی ساده از EAV/CR…………………………………………………………………….46
شکل (۳-۳) پیاده سازی بیماری همه گیری با پایگاه داده گرافی………………………………. ………….۴۷
شکل (۴-۱) نمودارER…………………………………………………………………………………………. ……….71
شکل (۴-۲) پایگاه داده گراف طراحی شده برای بیماری های ژنتیکی……………………………………۷۴

( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

شکل(۵-۱) نمایش تمام گره ها روابط در پایگاه داده گرافی………………………………………………….۸۲

چکیده

در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم داده ­های پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریع­تر و کارآمدتر این داده ­ها نیاز به ذخیره الکترونیکی این داده ­ها داریم. داده ­های مربوط به بیماری­های ژنتیکی نیز از این دسته داده ­ها به حساب می­آیند. با توجه به این مسئله می­بایست پایگاه داده­ای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب می ­آید در این مقاله برای ذخیره و بازیابی این داده ­ها از مدل داده­ی گرافی که یکی از زیر مجموعه­های مدل داده ­های غیر ساخت یافته (NOSQL)است استفاده می­نماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص می­کنیم و بر اساس آن مدل داده گرافی را طراحی می­نماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. هم­چنین از نرم افزار Neo4j استفاده نمودیم که داده ­های مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل داده ­ها از روابط بین افراد، این مدل داده مدل مناسبی به شمار می ­آید.
کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده

فصل اول: مقدمه

۱-۱-پیشگفتار

در زمینه پزشکی داده ­ها به سرعت در حال تولید وگسترش هستند. این داده ­ها در اشکال متفاوت­تری نسبت به داده ­های گذشته تولید می­شوند و با توجه به پیشرفت­های علم در این زمینه نیاز به مدیریت­های جدید بسیار بیشتر از گذشته احساس می­ شود.­­ برای ذخیره این داده ­ها پایگاه­داده­ای که قادر به پشتیبانی از انواع مختلف داده ­ها و حجم زیاد داده ­ها باشد و همچنین توانایی انجام مدیریت صحیح و کامل داده ­ها را دارا باشد، نیاز داریم]۱۴[.
در خصوص بیماری­های ژنتیکی داده­هایی که نیاز به ذخیره آن­ها داریم، داده ­های متنوعی هستند. با توجه به ماهیت بیماری­های ژنتیکی برای درک نحوه انتقال این بیماری­ها نیاز به ذخیره وضعیت سلامتی اجداد بیماران نیز داریم که در هر بررسی ممکن است فرد جدیدی به این شجره نامه اضافه شود، همچنین برای کشف مسیر انتقال بیماری­ها روابط بین افراد در این پایگاه­داده بسیار مهم و ضروری می­باشد. برای پشتیبانی از این نیازها و مدیریت روابط بین افراد و انتقال بیماری، پایگاه­داده ­های ساخت­یافته[۱]گزینه مناسبی نیستند، زیرا قادر به پشتیبانی از انواع مختلف داده ها نمی­باشند.
پایگاه­داده ­های غیرساخت­یافته[۲]برای پشتیبانی انواع مختلف داده ها گزینه های مناسب­تری هستند. پایگاه­داده هایNOSQL انواع مختلفی دارند اما با توجه به این که در این نوع بیماری روابط بین افراد بسیار مهم است و همچنین باید در هر زمانی قادر به افزودن موجودیت ها باشیم پایگاه­داده های گرافی مورد مناسبی می­باشند.

۱-۲-بیان مسئله

بدن انسان­ها از تریلیون سلول تشکیل شده و هر سلول دارای یک هسته می­باشد. هسته سلول­ها از تعداد ۴۶ کروموزوم یا۲۳جفت کروموزوم تشکیل شده است. کروموزوم­ها دارای رشته­ های در هم پیچیده­ای به نامDNA هستند که اینDNA ها شامل ژن­ها هستند.هر سلول بدن انسان­ها شامل۲۵۰۰۰تا۳۵۰۰۰ژن است]۱[.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...