یارا فایل

مرجع دانلود انواع فایل

یارا فایل

مرجع دانلود انواع فایل

دانلود مقاله درباره تاریخچه علم ژنتیک

اختصاصی از یارا فایل دانلود مقاله درباره تاریخچه علم ژنتیک دانلود با لینک مستقیم و پر سرعت .

دانلود مقاله درباره تاریخچه علم ژنتیک


دانلود مقاله درباره تاریخچه علم ژنتیک

 

 

 

 

 

 

لینک پرداخت و دانلود *پایین مطلب*

فرمت فایل: Word (قابل ویرایش و آماده پرینت)

تعداد صفحه :14

 

بخشی از متن مقاله

دانش زیست شناسی یکی از قدیمی ترین علومی بوده که بشر به آن توجه داشته است. شواهد بسیار زیادی که طی کاوشهای باستان شناسی بدست آمده حکایت از آن دارد که انسانهای پیشین به دانش زیست شناسی توجه داشته اند و در این میان اصلاح نژاد دامها و پرورش گیاهان با باردهی بیشتر از دانش گذشتگان در مورد علم ژنتیک خبر می دهد. اما از حدود یک قرن پیش دانش زیست شناسی  وارد مرحله جدیدی شد که بعدا آن را ژنتیک نامیده اند و این امر انقلابی در علم زیست شناسی به وجود آورد. در قرن هجدهم ، عده ای از پژوهشگران بر آن شدند که نحوه انتقال صفات ارثی را از نسلی به نسل دیگر بررسی کنند؛ این بررسی ها به نتیجه قابل ملاحضه ای ختم نشد. دو دلیل مهم آن عبارت بودند از آگاهی نداشتن به ریاضیات و دلیل دوم انتخاب صفاتی بود که برای پژوهش های اولیه ژنتیک مناسب نبودند.

اولین کسی که توانست قوانین حاکم بر انتقال صفات ارثی را شناسایی کند، کشیشی اتریشی به نام گریگور مندل بود که در سال 1865 این قوانین را که حاصل آزمایشاتش روی گیاه نخود فرنگی بود، ارائه کرد.  این در حالی بودکه جامعه علمی آن دوران به دیدگاه ها و کشفیات او اهمیت چندانی نداد و نتایج کارهای مندل به دست فراموشی سپرده شد. و به نظر می رسید ، پرونده این دانش رو به بسته شدن است.  در سال 1900 میلادی کشف مجدد قوانین ارائه شده از سوی مندل ، توسط درویس ، شرماک و کورنز باعث شد که نظریات او مورد توجه و قبول قرار گرفته و مندل به عنوان پدر علم ژنتیک شناخته شود.

در سال 1953 با کشف ساختمان جایگاه ژنها (DNA) از سوی جیمز واتسن و فرانسیس کریک ، رشته ای جدید در علم زیست شناسی به وجود آمد که زیست شناسی ملکولی نام گرفت . با حدود گذشت یک قرن از کشفیات مندل در خلال سالهای 1971 و 1973 در رشته زیست شناسی ملکولی و ژنتیک که اولی به بررسی ساختمان و مکانیسم عمل ژنها و دومی به بررسی بیماری های ژنتیک و پیدا کردن درمانی برای آنها می پرداخت ، ادغام شدند و رشته ای به نام مهندسی ژنتیک  را به وجود آوردند که طی اندک زمانی توانست رشته های مختلفی اعم از پزشکی ، صنعت و کشاورزی را تحت الشعاع خود قرار دهد و دیدگاه های مختلف عصر حاضر را به خود اختصاص دهد.

اساس  مهندسی ژنتیک و بیوتکنولوژی انتقال یک یا تعدادی از ژنهای یک ارگانیسم  به درون خزانه ژنتیکی  یک ارگانیسم دیگر است. به این ترتیب ارگانیسم جدید واجد ژنهایی خواهد شد که در گذشته فاقد آن بوده و اینک وادار می شود که در شرایط  محیطی مناسب اقدام به بیان آن ژن نماید که محصول آن می تواند منجر به بروز صفت خاص و یا تولید فراورده ای شود.

مهندسی ژنتیک و بیوتکنولوژی در چند سال اخیر توانسته منشأ خدمات ارزنده ای برای نوع بشر باشد. از مهمترین دستاوردهای این دانش می توان تأثیر آن را حیطه های مختلف از جمله  صلاح نژادی حیوانات و گیاهان با هدف تولید فراورده های بیشتر،  تهیه داروها و هورمون ها با درجه خلوص بالا و صرف هزینه های پایین ، درمان بیماری های ژنتیکی با ایجاد تغییرات در سلول تخم و موار متعدد دیگر اشاره کرد. تشخیص قبل از بارداری بیماری های ژنتیکی ، تشخیص صحت رابطه فرزند با پدر و مادر و همچنین تکنیک شناسایی مجرمان از روی بقایای باقی مانده از بدن ، مو و یا خون آنها از جمله توانایی های دیگر ژنتیک مولکولی است.

در نگاهی دیگر دورنمای دانش ژنتیک و بیوتکنولوژی بسیار زیبا جلوه می کند. تولید  اعضای بدن از قلب گرفته تا چشم و دست و پا به صورت مجزا از طریق مهندسی ژنتیک و ارایه آنها به  بانکهای اعضای بدن با هدف کمک به نیازمندان  پیوند عضو ، یکی از این موارد است. به این ترتیب مشکل دفع پیوند حل خواهد شد و مخصوصاً در صورتی که عضو پیوندی از دارای خزانه ژنتیک همان فرد باشد هیچ آنتی ژن بیگانه ای نمیتواند عامل دفع عضو باشد. درمان بسیاری از بیماری های ژنتیکی مخصوصاً  در دوره جنینی  قابل درمان خواهد بود. هویت  افراد از روی کارتهای شناسایی که بر پایه وراثت و ژنتیک آنها  عمل می کند ممکن خواهد شد و مجرمان با گذاشتن کوچکترین اثر بیولوژیکی از خود مثل یک تار مو بسرعت شناسایی خواهند شد.

دنیای آینده در تسخیر دانش ژنتیک خواهد بود و برای این علم نمیتوان پایانی قائل شد. اگر چه به نظر می رسد مثل هر دانش دیگری، این علم هم می تواند ابزاری برای ارضاء حس قدرت طلبی بسیاری از سیاستمداران باشد و تا کنون شاهد جنجالهای بسیاری زیادی هم در این مورد بوده ایم. یکی از مهمترین موارد آن تولید گیاهان تراریخت و کلونینگ و همسانه سازی انسان بوده است.

 

 

گریگور مندل

گریگوری مندل که او را پدر ژنتیک می دانند در روستای برنو که اکنون جزوی از کشور چک است در خانواده ای تنگ دست و آلمانی زبان متولد شد. پدر مندل، یک کشاورز بود که حداقل سه روز در هفته برای مالک زمین در شرایطی بسیار سخت و طاقت فرسا کار می کرد تا بالاخره روزی مالک یک زمین زراعی شد. مندل هم  به پرورش درختان میوه علاقه زیادی داشت و باغ میوه کوچک خود را با پیوندهایی بهبود می بخشید که کشیش شهر، پدر «شریبر»، در اختیارش می گذاشت. یوهان جوان که پس از راهب شدن گرگور مندل نام گرفت، در این کار به پدرش کمک می کرد. و به تدریج با باغبانی و پرورش گل آشنا شد.

پدر شریبر در مدرسه دهکده تدریس می کرد. کودکان در آن مدرسه نه تنها خواندن و نوشتن می آموختند، بلکه با تاریخ طبیعی و علوم نیز آشنا می شدند. مندل هم که  شاگرد ممتازی بود ، درس را در همان مدرسه شرع کرد.
پدر مندل که مرد فقیری بود  ، با وجود امکانات بسیار اندک، هر آنچه در توان داشت، به کار گرفت تا پسرش آینده بهتری داشته باشد. یوهان، تحصیلات ابتدایی را با موفقیت پشت سر گذاشت و برای رفتن به دبیرستان آماده شد. هر چند که رفتن به دبرستان برای خانواده یوهان  بسیار سخت بود و والدین او نمی توانستند از نظر مالی کمک زیادی به او بکنند. به همین دلیل هم ، یوهان مجبور بود برای تأمین نیازهای مالی خود کار کند. با وجود این، او با موفقیت به تحصیل ادامه داد تا این که در شانزده سالگی پدر مندل در یک تصادف به شدت صدمه دید و  مجبور شد کار در مزرعه را رها کند. به این ترتیب، یوهان باید کلیه مخارج تحصیل خود را به تنهایی فراهم می کرد. او به خاطر کار زیاد و سوء تغذیه، مریض شد. با وجود این، دبیرستان را با موفقیت به پایان رساند و خود را برای رفتن به دانشگاه آماده کرد. از آن جا که یوهان سرگرم تحصیل بود و نمی توانست در کار مزرعه به پدر کمک کند، آنتوان مندل ، پدر یوهان  تصمیم گرفت سرپرستی مزرعه را به دامادش واگذار کند. داماد نیز متعهد شد که هنگام ورود یوهان به صومعه، مبلغی را  به او بپردازد. تقریباً بلافاصله پس از این که قرارداد امضا شد، خواهر مندل سهم جهیزیه اش را به برادرش داد تا تحصیلات خود را تکمیل کند. و در انتهای آن سال، تمام بودجه خانواده به اتمام رسید. در چنان شرایطی، تنها امید خانواده، کشیش شدن یوهان بود! مندل امیدوار بود به عنوان کشیش، شغلی همچون معلمی در مدرسه پیدا کند و در اوقات فراغت به مطالعات علمی بپردازد. مندل در صومعه ای مشغول فعالیت شد که دارای یک زیست شناس، یک ستاره شناس، یک فیلسوف و یک آهنگساز بود. طبق یک حکم سلطنتی، آنان مسئولیت تدریس مسائل دینی، فلسفی و ریاضیات را بر عهده داشتند. در واقع صومعه بک دانشگاه کوچک بود.

متن کامل را می توانید بعد از پرداخت آنلاین ، آنی دانلود نمائید، چون فقط تکه هایی از متن به صورت نمونه در این صفحه درج شده است.

/images/spilit.png

دانلود فایل 


دانلود با لینک مستقیم


دانلود مقاله درباره تاریخچه علم ژنتیک

مقاله در مورد شبکه های عصبی , الگوریتم ژنتیک و الگوریتم مورچگان

اختصاصی از یارا فایل مقاله در مورد شبکه های عصبی , الگوریتم ژنتیک و الگوریتم مورچگان دانلود با لینک مستقیم و پر سرعت .

مقاله در مورد شبکه های عصبی , الگوریتم ژنتیک و الگوریتم مورچگان


مقاله در مورد شبکه های عصبی , الگوریتم ژنتیک و الگوریتم مورچگان

لینک پرداخت و دانلود *پایین مطلب*

فرمت فایل:Word (قابل ویرایش و آماده پرینت)

 تعداد صفحه10

 

شبکه عصبی چیست؟

شبکه‌های عصبی را می‌توان با اغماض زیاد، مدل‌های الکترونیکی از ساختار عصبی مغز انسان نامید. مکانیسم فراگیری و آموزش مغز اساساً بر تجربه استوار است. مدل‌های الکترونیکی شبکه‌های عصبی طبیعی نیز بر اساس همین الگو بنا شده‌اند و روش برخورد چنین مدل‌هایی با مسائل، با روش‌های محاسباتی که به‌طور معمول توسط سیستم‌های کامپیوتری در پیش گرفته شده‌اند، تفاوت دارد. می‌دانیم که حتی ساده‌ترین مغز‌های جانوری هم قادر به حل مسائلی هستند که اگر نگوییم که کامپیوترهای امروزی از حل آنها عاجز هستند، حداقل در حل آنها دچار مشکل می‌شوند. به عنوان مثال، مسائل مختلف شناسایی الگو، نمونه‌ای از مواردی هستند که روش‌های معمول محاسباتی برای حل آنها به نتیجه مطلوب نمی‌رسند. درحالی‌که مغز ساده‌ترین جانوران به‌راحتی از عهده چنین مسائلی بر می‌آید. تصور عموم کارشناسان IT بر آن است که مدل‌های جدید محاسباتی که بر اساس شبکه‌های عصبی بنا می‌شوند، جهش بعدی صنعت IT را شکل می‌دهند. تحقیقات در این زمینه نشان داده است که مغز، اطلاعات را همانند الگو‌ها (pattern) ذخیره می‌کند. فرآیند ذخیره‌سازی اطلاعات به‌صورت الگو و تجزیه و تحلیل آن الگو‌، اساس روش نوین محاسباتی را تشکیل می‌دهند. این حوزه از دانش محاسباتی (computation) به هیچ وجه از روش‌های برنامه‌نویسی سنتی استفاده نمی‌کند و به‌جای آن از شبکه‌های بزرگی که به‌صورت موازی آرایش شده‌اند و تعلیم یافته‌اند، بهره می‌جوید.

یک شبکه عصبی مصنوعی (Artificial Neural Network (ANN))  ایده ای است برای پردازش اطلاعات که از سیستم عصبی زیستی الهام گرفته شده و مانند مغز به پردازش اطلاعات می پردازد . عنصر کلیدی این ایده ، ساختار جدید سیستم پردازش اطلاعات است. این سیستم از شمار زیادی عناصر پردازشی فوق العاده بهم پیوسته تشکیل شده(neurons)که برای حل یک مسأله با هم هماهنگ عمل می کند.ANN ها ،نظیر انسانها ، با مثال یاد می گیرند . یک ANN برای انجام وظیفه ای مشخص  ، مانند شناسایی الگو ها و دسته بندی اطلاعات ، در طول یک پروسه یاد گیری ، تنظیم می شود . در سیستم های زیستی  یاد گیری  با تنظیماتی در اتصالات سیناپسی که بین اعصاب قرار دارد همراه است . این  روش ANN ها هم می باشد.

سابقه تاریخی

به نظر می آید شبیه سازی های شبکه عصبی  یکی از پیشرفت های اخیر باشد . اگرچه این  موضوع پیش از ظهور  کامپیوتر ها بنیان گذاری شده  و  حداقل یک مانع بزرگ تاریخی  و  چندین دوره مختلف را پشت سر گذاشته است.

خیلی از پیشرفت های مهم با تقلید ها وشبه سازی های   ساده  و ارزان کامپیوتری  بدست آمده است. در پی یک دوره ابتدائی اشتیاق و فعالیت در این زمینه ، یک دوره ی بی میلی و بدنامی راهم پشت سر گذاشته است . در طول این دوره سرمایه گذاری و پشتیبانی حرفه ای از این موضوع در پایین ترین حد خود بود ، پیشرفت های  مهمی به نسبت تحقیقات محدود در این زمینه صورت گرفت . که بدین وسیله  پیشگامان قادر شدند تا به گسترش تکنولوژی متقاعد کننده ای بپردازند که خیلی برجسته تر از محدودیت هایی بود که توسط Minsky وPapert شناسانده  شد. Minsky وPapert ،کتابی را در سال 1969 منتشر کردند که در آن عقیده عمومی را جع به   میزان محرومیت  شبکه های عصبی را در میان محققان معین کرده بود و بدین صورت این عقیده بدون تجزیه و تحلیل های بیشتر پذیرفته شد. هم اکنون ، زمینه تحقیق شبکه های عصبی  از تجدید حیات علایق و متناطر با آن افزایش سرمایه گذاری لذت می برد .

اولین سلول عصبی مصنوعی در سال 1943 بوسیله یک neurophysiologist به نلمWarren McCulloch ویک منطق دان به نام Walter Pits ساخته شد . اما محدودیتهای تکنولوژی  در آن زمان اجازه کار بیشتر به آنها نداد.

شبکه های عصبی در مقابل کامپیوتر های معمولی

شبکه های عصبی نسبت به کامپیوتر های معمولی مسیر متفاوتی را برای حل مسئله طی می کنند. کامپیوتر های معمولی یک مسیر الگوریتمی را استفاده می کنند به این معنی که کامپیوتر یک مجموعه از دستور العمل ها را به قصد حل مسئله پی می گیرد. بدون اینکه، قدم های مخصوصی که کامپیوتر نیاز به طی کردن دارد، شناخته شده باشند کامپیوتر قادر به حل مسئله نیست. این حقیقت قابلیت حل مسئله ی کامپیوتر های معمولی را  به مسائلی ،محدود می کند که ما قادر به درک آنها هستیم  و می دانیم چگونه حل میشوند. اما  اگر کامپیوتر ها می توانستند کار هایی را انجام دهند که ما دقیقا نمیدانیم چگونه انجام دهیم ،  خیلی  پر فایده تر بودند.

شبکه های عصبی اطلاعات را به روشی مشابه با کاری که مغز انسان انجام می دهد پردازش می کنند. آنها از تعداد زیادی از عناصر پردازشی(سلول عصبی) که فوق العاده بهم پیوسته اند تشکیل شده  است که این عناصر به صورت مواز ی باهم برای حل یک مسئله مشخص کار می کنند .شبکه های عصبی با مثال کار می کنند و نمی توان آنها را برای انجام یک وظیفه خاص برنامه ریزی کرد مثال ها می بایست با دقت انتخاب شوند در غیر این صورت زمان سودمند، تلف می شود و یا حتی بدتر از این شبکه ممکن است نا درست کار کند. امتیاز شبکه عصبی این است که خودش  کشف می کند که چگونه مسئله را حل کند ، عملکرد آن غیر قابل پیش گویی است.

از طرف دیگر ، کامپیوتر های معمولی از یک مسیر مشخص برای حل یک مسئله استفاده می کنند . راه حلی که مسئله از آن طریق حل می  شود  باید از قبل شناخته  شود و به صورت دستورات  کوتاه و غیر مبهمی شرح داده شود. این دستورات سپس به زبا ن های برنامه نویسی سطح بالا برگردانده می شود و بعد از آن به کدهایی که کامپیوتر قادر به درک آنها است تبدیل می شود. به طور کلی این ماشین ها قابل پیش گویی هستند و اگر چیزی به خطا انجام شود به یک اشتباه سخت افزاری یا نرم افزاری بر می گردد.

شبکه های عصبی و کامپیوتر های معمولی با هم در حال رقابت نیستند بلکه کامل کننده یکدیگرند . وظایفی وجود دارد که بیشتر مناسب روش های الگوریتمی هستند نظیر عملیات محاسباتی و وظایفی نیز وجود دارد که بیشتر مناسب شبکه های عصبی هستند . حتی فراتر از این ، مسائلی وجود دارد که نیازمند به سیستمی است که از تر کیب هر دو روش بدست می آید (بطور معمول کامپیوتر های معمولی برای نظارت بر شبکه های عصبی به کار گرفته می شوند ) به این قصد که بیشترین کارایی بدست آید.

شبکه های عصبی معجزه نمی کنند اما اگر خردمندانه به کار گرفته شوند نتایج شگفت آوری را خلق میکنند.

چرا از شبکه های عصبی استفاده می کنیم؟

شبکه های عصبی ، با قابلیت قابل توجه  در استنتاج معانی از داده های پیچیده یا مبهم ، برای استخراج الگوها و شناسایی روشهایی که آگاهی از آنها برای انسان و دیگر تکنیک های کامپیوتری بسیار  پیچیده و دشوار است  به کار گرفته می شوند. یک شبکه عصبی تربیت یافته می تواند به عنوان یک متخصص در مقوله اطلاعاتی ای که برای تجزیه تحلیل به آن داده شده به حساب آید.از این متخصص می توان  برای بر آورد وضعیت های دخواه جدید و جواب سؤال های " چه می شد اگر "  استفاده کرد.

مزیتهای دیگر آن شامل موارد زیر می شود :

  1. یادگیری انطباق پذیر: قابلیت یاد گیری نحوه انجام وظایف بر پایه اطلاعات داده شده برای تمرین وتجربه های مقدماتی .
  2. سازماندهی توسط خود: یک ANN می تواند سازماندهی یا ارائه اش را ، برای اطلا عاتی  که در طول دوره یادگیری در یافت می کند، خودش ایجاد کند.
  3. عملکرد بهنگام(Real time ) : محاسبات  ANN  می تواند بصورت موازی انجام شود، و سخت افزارهای مخصوصی طراحی و  ساخته شده است که می تواند از این قابلیت استفاده کند.
  4. تحمل اشتباه بدون ایجاد وقفه در هنگام کد گذاری اطلاعات : خرابی جزئی یک شبکه منجر به تنزل کارایی متناظر با آن می شود اگر چه تعدادی از قابلیت های شبکه ممکن است حتی با خسارت بزرگی هم باقی بماند.

تفاوت‌های شبکه‌های عصبی با روش‌های محاسباتی متداول و سیستم‌های خبره
گفتیم که شبکه‌های عصبی روش متفاوتی برای پردازش و آنالیز اطلاعات ارائه می‌دهند. اما نباید این گونه استنباط شود که شبکه‌های عصبی می‌توانند برای حل تمام مسائل محاسباتی مورد استفاده واقع شوند. روش‌های محاسباتی متداول همچنان برای حل گروه مشخصی از مسائل مانند امور حسابداری، انبارداری و محاسبات عددی مبتنی بر فرمول‌های مشخص، بهترین گزینه محسوب می‌شوند. جدول 1، تفاوت‌های بنیادی دو روش محاسباتی را نشان می‌دهد.

مشخصه

روش محاسباتی متداول
)
شامل سیستم‌های خبره(

شبکه‌های عصبی مصنوعی


دانلود با لینک مستقیم


مقاله در مورد شبکه های عصبی , الگوریتم ژنتیک و الگوریتم مورچگان

پاورپوینت درباره اپیدمیولوژی و ژنتیک سرطان

اختصاصی از یارا فایل پاورپوینت درباره اپیدمیولوژی و ژنتیک سرطان دانلود با لینک مستقیم و پر سرعت .

پاورپوینت درباره اپیدمیولوژی و ژنتیک سرطان


پاورپوینت درباره اپیدمیولوژی و ژنتیک سرطان

فرمت فایل : power point  (لینک دانلود پایین صفحه) تعداد اسلاید  : 43 اسلاید

 

 

 

 

 

 

 

کلیات :

سرطان ها شایعترین علت مرگ و میر، پس از حوادث و بیماری های قلبی عروقی هستند.
روز به روز بر شیوع سرطان در کشورهای در حال توسعه افزوده می شود.
تقریباً عوامل ژنتیکی در ایجاد همه سرطان ها نقش دارند.
عوامل ژنتیکی در تعامل با عوامل خطر محیطی اثر سرطان زایی خود را اعمال می نمایند.
در بروز حدود 30% از سرطان ها عوامل ارثی نقش دارند.
 
 
 
سرطان چیست :
سرطان به بیماری هایی گفته می شود که در آن یکی از سلول های بدن بدلیل نقص ژنتیکی ناشی از عوامل محیطی و یا علل ارثی بطور افسار گسیخته و خارج از کنترل شروع به تکثیرو تهاجم به سایر بافت ها و اعضای حیاتی بدن نماید.

 

مکانیسم های کنترل چرخه سلولی

üمحل های بازرسی (Checkpoints)
üکوتاه شدن طول تلومر
üسیگنال های شیمیایی داخل و خارج سلول

دانلود با لینک مستقیم


پاورپوینت درباره اپیدمیولوژی و ژنتیک سرطان

پروژه داده کاوی و کاربرد الگوریتم های ژنتیک در داده کاوی. doc

اختصاصی از یارا فایل پروژه داده کاوی و کاربرد الگوریتم های ژنتیک در داده کاوی. doc دانلود با لینک مستقیم و پر سرعت .

پروژه داده کاوی و کاربرد الگوریتم های ژنتیک در داده کاوی. doc


پروژه داده کاوی و کاربرد الگوریتم های  ژنتیک در داده کاوی. doc

 

 

 

 

نوع فایل: word

قابل ویرایش 142 صفحه

 

چکیده:

داده کاوی تلاش برای استخراج دانش انبوه داده های موجود است. داده کاوی به کمک مجموعه ای از روش های آماری و مدل سازی، می تواند الگوها و روابط پنهان موجود در پایگاه های داده را تشخیص دهد. تاکنون ابزارها و روش های مختلف برای پردازش اطلاعات ساخت یافته توسعه داده شده است که در نتیجه آنها ساخت پایگاه های اطلاعاتی و ایجاد انبارهای داده به سادگی صورت می گیرد. امروزه سازمان ها قادرند با هزینه کم اطلاعات وسیعی از وضعیت کسب و کار خود جمع و نگهداری کنند و این موجب شده است که استفاده از روش های داده کاوی، ارزش قابل توجهی را برای سازمان بدست آورد. رویکردهای موجود به مسأله داده کاوی متنوع است . در این گزارش نگاهی به آخرین دستاوردهای این زمینه علمی انداخته خواهد شد.

 

مقدمه:

بشر با پیشرفت فناوری رایانه ای در ثبت و ذخیره سازی داده ها و پردازش آن ها گامی بزرگ جهت کسب دانش برداشته است . در واقع نمایشی از واقعیت ها، معلومات، مفاهیم، رویدادها یا پدیده ها برای برقراری ارتباط، تفسیر یا پردازش، توسط انسان یا ماشین است . از طرف دیگر واژه ی اطلاعات، به معنی دانشی که از طریق خواندن، مشاهده و آموزش به دست می آید اطلاق می شود . در حقیقت می توان گفت اطلاعات داده هایی هستند که پس از جمع آوری پردازش شده اند و شکل مفهومی تولید کرده اند .

بین داده ها و اطلاعات همانند خبر و اطلاع رابطه وجود دارد . خبری که دریافت می شود، پس از ارزیابی به اطلاع تبدیل می شود . داده ها نیز پردازش می شوند تا اطلاعات را پدید آورند . به بیان دیگر اطلاع حاصل تکامل داده ها است . به این ترتیب بین داده ها و اطلاعات یک شکاف وجود دارد که اندازه این شکاف با حجم داده ها ارتباط مستقیم دارد . هر چه داده ها حجیم تر باشند، این شکاف بیشتر خواهد بود و هر چه داده ها کمتر و روش ها و ابزار پردازش داده ها کاراتر باشد، فاصله بین داده ها و اطلاعات کمتر است . امروزه افزایش سریع حجم پایگاه داده ها به شکلی است که توانایی انسان برای درک این داده ها بدون ابزارهای پر قدرت میسر نمی باشد . در این وضعیت، تصمیم گیری ها به جای تکیه بر اطلاعات بر درک مدیران و کاربران تکیه دارند، چرا که تصمیم گیرندگان ابزار قوی برای استخراج اطلاعات با ارزش را در دست ندارند . در واقع شرایط فعلی توصیف کننده ی حالتی است که ما از لحاظ داده غنی، اما از لحاظ اطلاعات ضعیف هستیم .

 

فهرست مطالب:

فصل اول

مقدمه ای بر داده کاوی

چکیده

1-1 مقدمه

1-2 تاریخچه ی داده کاوی

1-3 روش های گردآوری اطلاعات

1-4 داده کاوی چیست ؟

1-4-1  حلقه داده کاوی چیست ؟

1-4-1-1 شناسایی فرصت های تجاری

1-4-1-2 داده کاوی

1-4-1-2-1  مراحل داده کاوی

1-4-1-3 انجام اقدامات

1-4-1-4 اندازه گیری نتایج

1-1 آمار و داده کاوی

حجم داده ها

نوع داده ها

پردازش داده ها

وظایف معمول

اهداف تحقیق

1-6  داده کاوی چه کاری انجام می دهد ؟

1-6-1  عملیات داده کاوی

1-6-1-1 دسته بندی و پیشگویی

1-6-1-1-1 روش های دسته بندی

1-6-1-2  خوشه بندی

1-6-1-3  تحلیل روابط و وابستگی ها

1-6-1-4 پیش بینی

1-7 نرم افزارهای داده کاوی

1-8  پایگاه دادة تحلیلی (Data Warehouse)

1-8-1 تفاوت های پایگاه داده تحلیلی با پایگاه داده عملیاتی

1-8-2 ابزار های سطح پایین (Back-End) پایگاه داده تحلیلی

1-8-3 ابزارهای پرس و جو و تحلیل داده های ذخیره شده درdata warehouse و data mart

1-9 سرویس دهنده های پردازش تحلیلی بر خط

1-9-1 مزایا و معایب سرویس دهنده های OLAP

1-10 مکعب داده

1-11 جدول واقعیت

1-11-1 جدول ابعاد

1-12 داده کاوی در اوراکل

1-12-1 توابع داده کاو اوراکل الگوریتم ها

1-13 گام های مدل سازی جستجوگر مدل

1-14 داده کاوی در Clementine

1-14-1 معماری

1-14-2  متدلوژی clementine الگوریتم ها

فصل دوم

مقدمه ای بر وب کاوی

2-1 مقدمه

2-2 رده بندی های وب کاوی

2-2-1 Web Content Mining

2-2-2 web usage mining

2-2-3 Web Structure Mining

2-3 فایل log

2-3-1 انجام عمل پیش پردازش روی فایل های log

2-4 تشخیص کاربران : (user identification)

2-5 session identification

2-6  تشخیص الگو ها

2-7  تکنیک های آماری

2-8 قوانین ارتباطی

2-9 الگو های ترتیبی

2-10 خوشه بندی

2-11 مشکلات روش تحلیل گزارش های وبweb log analysis method )  )

2-12 نتیجه گیری

فصل سوم

الگوریتم های ژنتیک

3-1 مقدمه

3-2 زمینه های بیولوژیکی

3-3 فضای جستجو

3-4 مسائل NP

3-5 مفاهیم اولیه در الگوریتم ژنتیک

3-5-1 اصول پایه

3-5-2 شمای کلی الگوریتم ژنتیک

3-5-3 ساختار متداول الگوریتم ژنتیک

3-6 کد کردن

3-6-1 انواع کدینگ

3-6-2 روشهای کدینگ

3-6-3 مسائل مربوط به کدینگ

3-7 مرحله ارزیابی (evaluation)

3-8 عملگر تقاطع و جهش

3-9 رمز گشایی

3-10 کروموزوم

3-11 جمعیت

3-12 مقدار برازندگی

3-13 تعریف دیگر عملگر تقاطعی

3-14 تعریف دیگرعملگر جهشی

3-15 مراحل اجرای الگوریتم ژنتیک

3-16 حل یک مساله نمونه توسط الگوریتم ژنتیک

3-17 همگرایی الگوریتم ژنتیک

3-18 نتیجه گیری

فصل چهارم

کاربرد کلاسترینگ

4-1 مقدمه

4-2 مسئلة خوشه بندی توزیع شده

4-3 مشکلات روش متمرکز سازی داده ها

4-4  الگوریتم خوشه بندی K-Means

4-5 الگوریتم خوشه بندی توزیع شده DisK-Means

4-6 ساخت مدل محلی

4-7 ساخت مدل عمومی

4-8 یک روش جدید مبتنی بر رفتار کاربران جهت تخمین بار کاری وب سرورهای شبکه

4-9 کلاسترینگ داده های وب

4-10 کلاسترینگ Session های کاربر

4-10-1 الگوریتم های کلاسترینگ Session  ها

4-10-1-1 کلاسترینگ مبتنی بر مدل

4-10-1-1-1  توصیف بار کاری سیستم های کامپیوتری

تکنیک های ایستا

آنالیز جزء اصلی

تکنیک های پویا

میانگین متحرک (Moving Average)

4-11 کارهای وابسته قبلی

4-12  مدل پیشنهادی

4-13  محیط پیاده سازی

4-14  نتایج ، آنالیز و ارزیابی مدل

4-15  نتیجه گیری

منابع و مراجع

 

فهرست اشکال:

شکل 1  مراحل داده کاوی

شکل 2  جایگاه پایگاه داده تحلیل

شکل 3-1  Data Warehouse process

شکل 3-2 Data Warehouse process

شکل 4  معماری چند لایه

شکل 5 نمونه ای از مکعب داده

شکل 6  مفهوم مکعب داده

شکل 7  داده کاوی در اوراکل

شکل 8  اوراکل یا سایز ابزار

شکل 9  مراحل متدولوژی Clementine

شکل 10  چرخه داده کاوی Clementine

شکل 3-1 نمونه ای از فضای جواب

شکل 3-2  کدینگ باینری

شکل 3-3  کدینگ جهشی

شکل 3-4  کدینگ ارزشی

شکل 3-5  کدینگ درختی

شکل 3-6  فضای کدینگ و فضای جواب

شکل 3-7  رابطه بین کروموزوم ها و جواب ها

شکل 3-8  انواع روابط بین فضای جواب و فضای کدینگ

شکل 3-9 مثال رمز گشایی

شکل 3-10  مثال جهش

شکل 3-11 نمایش یک کروموزوم n بیتی پایه عددی m

شکل 3-12  مثالی از جباجایی تک نقطه ای

شکل 3-13  تقاطع در کروموزومهای که از شکل کد شده چهار متغیر بوجود آمده است

شکل 3-14  تقاطعی دو نقطه ای

شکل 3-15  عمل تقاطعی یکنواخت

شکل 3-16  نمونه ای از عمل جهش

شکل 3-17 مراحل اجرای الگوریتم ژنتیک

شکل 3-18 چرخ دولت

شکل 3-19 نمایش کروموزوم معادل زوج (X,Y)

شکل 11 خوشه بندی توزیع شده

شکل 12  ثابت شدن فلش Cetroid

شکل 13 الگوریتم خوشه بندی توزیع شده Disk-Means

شکل 14  ساخت مدل محلی، ترکیب اطلاعات خوشه ها

شکل 15-1  ساخت مدل محلی، ترکیب اطلاعات خوشه ها

شکل 4-2  ساخت مدل محلی، ترکیب اطلاعات خوشه ها

شکل 4-3  ساخت مدل  محلی، حالت کلی

شکل 16 حاللات مختلف قرار گرفتن چند خوشه کنار هم

شکل 17-1  ساخت مدل محلی، حالت دوم

شکل 6-2  ساخت مدل محلی، حالت دوم

شکل 18  نمونه هایی از CBMG های حاصل از درخواست های کاربران یکی از سیستم های مورد تست

در دانشگاه مشهد

شکل 19  هیستوگرام داده های باقیمانده لینک Presented Courset بعد از حذف داده های پرت

از یکی از سیستم های وب دانشگاه

شکل 20  نمودار P-PPlot داده های لینک Presented Courset

شکل 4  هیستوگرام داده های باقیمانده لینک Show Edueationallog بعد از حذف داده های پرت

 

فهرست جداول:

جدول 3-1  مثال های تقاطع تک نقطه ای

جدول 3-2  مثال های تقاطع دو نقطه ای

جدول 3-3  نمونه ای از عمل جهش

جدول 3-4  انتخاب کروموزومها با استفاده از چرخ رولت

جدول 3-5  نمایش جمعیت اولیه

جدول 3-6  نتایج عمل تقاطع

جدول 3-7 نتایج عمل جهش با Pm=0.2          

جدول 3-8  کروموزوم با بیشترین مقدار برازندگی

جدول 1 جزئیات ترافیک تولید شده توسط برنامه شبیه ساز

 

منابع و مأخذ:

 [1]. An Introduction to Data Mining: http://www.thearling.com/ , retrieved on Mar 2, 2007

[2]. Data Mining: Efficient Data Exploration and Modeling: http://research.microsoft.com/dmx/DataMining/ , retrieved on Mar 2, 2007

[3]. Christine Gertisio and Alan Dussauchoy, "Knowledge Discovery from Industrial Data base", Journal of Intelligent Manufacturing, 15, 29-37, 2004

[4]. Berry, M. and Linoff, G. "Data Mining Techniques: For Marketing, Sales, and Customer Support" New York: John Wiley and Sons, 1997

[5]. Cornelia Gyorodi, Robert Gyorodi, Stefan Holban-"A Comparative Study of Association Rules Mining Algorithms" , SACI 2004, 1 st Romanian-Hungarian Joint Symposium on Applied Computational Intelligence , Timisoara, Romania, May 25-26, page. 213-222, 2004

[6]. Berson, A., Smith S., and Thearling K., "Building Data Mining Applications for CRM" Tata McGraw-Hill, New York, 2004

[7].Fayyad U., Piatetsky-Shapiro G., and Smyth p., "From Data Mining to Knowledge Discovery in Databases," American Association for Artificial Intelligence, 1996

[8]. An overview of data mining techniques: http://www.thearling.com/ , retrieved on Mar 2, 2007

[9]. All Data Mining Software: http://www.the-data-mine.com/bin/view/Software/AllDataMiningSoftware, retrieved on Mar 2, 2007

[10]. ARLITT, M. AND WILLIAMSON, C. 1996: Web Server Workload Characterization: The Search for Invariants. In Proc  Of SIGMETRICS 96, (May 1996), 126—137

[11]. CALZAROSSA, M. AND SERAZZI, G. 1985: A Characterization of the Variation in Time of Workload Arrival Patterns. In IEEE Trans. On Computers 34, 2, 156-162

[12]. ELMS, C. 1980: Clustering –One method for Workload Characterization. In Processing of the International Conference on Computer Capacity Management, San Francisco, Calif . 1980

[13]. FU, K. 1974: Syntactic Methods in Pattern Recognition, Academic Press.

[14]. HARTIGAN, J. AND WONG, N. 1979: A K – means Clustering Algorithms. In Applied Statistics 28, 100-108

[15]. JAIN, A., MURTY, M., AND FLYNN, P. 1999: Data Clustering: A. Review. In ACM Computing Surveys 31, 3, (Sept. 1999), 264-323


دانلود با لینک مستقیم


پروژه داده کاوی و کاربرد الگوریتم های ژنتیک در داده کاوی. doc