پایاننامه ارشد کامپیوتر نرم افزار کشف انتقال بیماریهای ژنتیکی

110 هزار تومان 75 هزار تومان
افزودن به سبد خرید

جهت خرید و دانلود پایاننامه کارشناسی ارشد مدیریت ورزشی شایستگی مدیریتی عملکرد مدیران روی خرید محصول کلیک و یا با ایمیل زیر در ارتباط باشید

sellthesis@gmail.com


پایان نامه کارشناسی ارشد کامپیوتر نرم افزار ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی


خرید محصول پایاننامه ارشد کامپیوتر نرم افزار کشف انتقال بیماریهای ژنتیکی


چکیده:

در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم داده های پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریع تر و کارآمدتر این داده ها نیاز به ذخیره الکترونیکی این داده ها داریم. داده های مربوط به بیماری های ژنتیکی نیز از این دسته داده ها به حساب می آیند. با توجه به این مسئله می بایست پایگاه داده ای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب می آید در این مقاله برای ذخیره و بازیابی این داده ها از مدل داده ی گرافی که یکی از زیر مجموعه های مدل داده های غیر ساخت یافته (NOSQL)است استفاده می نماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص می کنیم و بر اساس آن مدل داده گرافی را طراحی می نماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. هم چنین از نرم افزار Neo4j استفاده نمودیم که داده های مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل داده ها از روابط بین افراد، این مدل داده مدل مناسبی به شمار می آید.
کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده


فهرست مطالب

عنوان صفحه
چکیده

فصل اول: مقدمه 1
1-۱ پیشگفتار 2
1- ۲ بیان مسئله 3
1-3 اهمیت وضرورت انجام تحقيق 6
1-4 جنبه جديدبودن ونوآوري درتحقيق 7
1-5 اهداف مشخص تحقيق 8
1-6 مروری برساختارپایان نامه 8

فصل دوم: مفاهیم 9
2-1 مقدمه 10
2-2 مدل داده چیست؟ 10
2-2-1 مدل های داده ساخت یافته 12
2-2-1-1 مدل داده رابطه ای 12
2-2-1-2 مدل داده شی گرا 14
2-2-1-۳ مدل داده شی رابطه ای 16
2-2-2 مدل داده ای غیرساخت یافته 17
2-2-2-1 مدل داده ای کلید/ارزش 19
2-2-2-2 مدل داده ای سندگرا 21
2-2-2-3 مدل داده ای ستونی 23
2-2-2-4 پایگاه داده های گراف 24
2-3 مدیریت داده ها 29
2-4 داده های پزشکی 30
2-5 کاربردهای مدیریت داده های پزشکی 34
2-6 بیماری های ژنتیکی 36
2-7 انتقال بیماریهای ژنتیکی 37
2-8 آزمایشهای ژنتیکی 38

فصل سوم: پیشینه تحقیق 42
3-1مقدمه 43
3-2 مدل داده رابطه ای برای بیماریهای همه گیری 43
3-3 مدل داده شی رابطه ای برای بیمارستانها 44
3-4مدل داده گرافی برای بیماری های همه گیری 47

فصل چهارم: روش پیشنهادی 48
4-1مقدمه 49
4-2 موجودیتها 53
4-3-صفات مربوط به هریک ازموجودیتها 53
4-3-1انسان سالم 53
4-3-2انسان ناقل 54
4-3-3 انسان درمان شده 54
4-3-4 انسان بیمار 54
4-3-5پزشک 55
4-3-6بیماری 55
۴-۳-۷علائم 57
4-3-8 روشهای درمان 58
4-3-9 دارو 58
4-4مقادیرذخیره شده برروی یالها 59
4-5تعیین قابلیتهای مدل داده 60
4-5-1ایجادکردن 60
4-5-2افزودن 61
4-5-3به روزرسانی 61
4-5-4حذف کردن 61
4-5-5پرس وجو 62
4-5-5-1پرس وجوهای وابسته به یک گره 62
4-5-5-2پرس وجوهای مربوط به دوگره 66
4-5-5-3پرس وجوهای بیش از دوگره 68
4-6طراحی مدل داده 70
۴-۶-۱ طراحیER 70
۴-۶-۲ طراحی مدل گرافی 72

فصل پنجم: ارزیابی 75
5-1 مقدمه 76
5-2 روش اول: گروه متمرکز 77
۵-۲-۱ آشنایی باگروه متمرکز 77
۵-۲-۲ مزایای گروه متمرکز 77
۵-۲-۳روش شناسی گروه متمرکز 77
۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز 79
5-3 روش دوم: پیاده سازی عملی پایگاه داده 79
5-3-1 نرم افزارنئوفرجی 80
5-3-2 داده های موردنیاز 80
5-3-3 ذخیره داده هادرپایگاه داده نئوفرجی 81
5-4 نتایج 83
فصل ششم:جمع بندی و کارهای آتی 90
6-1 جمع بندی وکارهای آتی 91
منابع 97


1-۱-پیشگفتار

در زمینه پزشکی داده ها به سرعت در حال تولید وگسترش هستند. این داده ها در اشکال متفاوت تری نسبت به داده های گذشته تولید می شوند و با توجه به پیشرفت های علم در این زمینه نیاز به مدیریت های جدید بسیار بیشتر از گذشته احساس می شود. برای ذخیره این داده ها پایگاه داده ای که قادر به پشتیبانی از انواع مختلف داده ها و حجم زیاد داده ها باشد و همچنین توانایی انجام مدیریت صحیح و کامل داده ها را دارا باشد، نیاز داریم]14[.
در خصوص بیماری های ژنتیکی داده هایی که نیاز به ذخیره آن ها داریم، داده های متنوعی هستند. با توجه به ماهیت بیماری های ژنتیکی برای درک نحوه انتقال این بیماری ها نیاز به ذخیره وضعیت سلامتی اجداد بیماران نیز داریم که در هر بررسی ممکن است فرد جدیدی به این شجره نامه اضافه شود، همچنین برای کشف مسیر انتقال بیماری ها روابط بین افراد در این پایگاه داده بسیار مهم و ضروری می باشد. برای پشتیبانی از این نیازها و مدیریت روابط بین افراد و انتقال بیماری، پایگاه داده های ساخت یافته گزینه مناسبی نیستند، زیرا قادر به پشتیبانی از انواع مختلف داده ها نمی باشند.
پایگاه داده های غیرساخت یافته برای پشتیبانی انواع مختلف داده ها گزینه های مناسب تری هستند. پایگاه داده هایNOSQL انواع مختلفی دارند اما با توجه به این که در این نوع بیماری روابط بین افراد بسیار مهم است و همچنین باید در هر زمانی قادر به افزودن موجودیت ها باشیم پایگاه داده های گرافی مورد مناسبی می-باشند.


1-۲-بیان مسئله

بدن انسانها از تریلیون سلول تشکیل شده و هر سلول دارای یک هسته می باشد. هسته سلول ها از تعداد 46 کروموزوم یا23جفت کروموزوم تشکیل شده است. کروموزوم ها دارای رشته های در هم پیچیده ای به نامDNA هستند که اینDNA ها شامل ژن ها هستند.هر سلول بدن انسان ها شامل25000تا35000ژن است1.
ژن ها دارای اطلاعاتی هستند که این اطلاعات ویژگی های انسان را می سازد.ژن ها ازترکیب پایه ای به نام نوکلئوتید تشکیل شده اند. ترکیب پایه از4 ساختار تشکیل شده است”ادنینA /گوانینG /سیتوزینC / تیمینT “در حقیقت برای بیان هر ژن از4حرفA,T,C,Gاستفاده می کنیم که اصطلاحا به آن توالی نوکلئوتیدی گفته می شود.
توالی ژن های مربوط به بیماری ها در بدن انسان های نرمال به یک شکل است و بیماری زمانی اتفاق می افتد که در این توالی تغییری ایجاد شود.البته طول توالی نوکلئوتیدی بیماری های مختلف با یکدیگر متفاوت هستند.به طور مثال طول توالی ژن انسولین333کاراکتر است. تا کنون بیشترین طول توالی نوکلئوتیدی شناخته شده مربوط به بیماری دوشن می باشد. طول این توالی2.3مگا می باشد.
به عنوان مثال هایی از بیماری های ژنتیکی می توان از زالی، سرطان های پوست، عقب افتادگی ذهنی، کم خونی داسی شکل، فنیل کتونوری، تالاسمی و نظایر آن نام برد2.

مرور

هیچ دیدگاهی برای این محصول نوشته نشده است.