فصل اول: کلیات
1-1 مقدمه
با ایجاد سیستمهای مدیریت پایگاه داده عمده مشکلات ساختار، پشتیبانی و مدیریت دادههای حجیم در سیستمهای فایلی برطرف شد اما توجهی به جنبههای رفتاری پایگاه داده نشد. به این معنا که با استفاده از قیود جامعیت شاید بتوان از منفی شدن مبلغ حقوق کارمندان جلوگیری نمود اما نمیتوان مانع از بیشتر شدن حقوق آنها از مدیرانشان شد. در چنین مواردی کاربران پایگاه داده با اجرای یک پرس و جو موارد نقض محدودیتهایی از این قبیل را پیدا نموده و خود اقدام به اصلاح آنها مینمایند.
مواردی این چنین و نیز گزارشات مدیریتی در آغاز ماه از جمله کارهای مشخص و دارای ضابطهای میباشند که انجام آنها تکراری و قابل تفویض به سیستم است.
کاربران غیرمجاز با استفاده از یک سری گزارشات، غیرمستقیم به اطلاعات کلیدی دست یافته و اقدام به تغییر آنها مینمایند. پیدا نمودن چنین تغییراتی که معمولاً بعد از گزارشات اتفاق میافتند، به راحتی امکانپذیر نیست. همانطور که مشاهده میشود در یک پایگاه داده معمولی ردیابی رویدادهایی که در سیستم اتفاق افتادهاند (رخدادها) نیز ممکن نبوده و نیاز به یک سیستم با پشتیبانی جنبههای رفتاری میباشد.
یک پایگاه داده فعال نظیر Oracle قادر به تشخیص رویدادهای نظیر اضافه، حذف و تغییر مقادیر در پایگاه داده میباشد. به عبارت دیگر این سیستمها با ایجاد تغییر در یک قلم داده عکسالعمل نشان میدهند.
پایگاه داده فعال با افزودن قوانین به پایگاههای داده امکان تعامل (کنش و واکنش) بین سیستم و پایگاه داده را ایجاد نمود. این نوع پایگاه داده دارای دو بخش مدیریت داده و مدیریت قوانین میباشد. بخش مدیریت داده مسئول حفظ خواص پایگاه داده در سیستمهای کاربردی بوده و بخش دوم با مدیریت قوانین مسئول واکنش به رویدادهای سیستم میباشد. در این نوع پایگاه داده طراحان سیستم قادرند با تعریف قوانین که نزدیکترین بیان به زبان طبیعی میباشد، سیستم را وادار به عکسالعمل مناسب در مقابل رویدادهای مهم نمایند .
پایگاه داده فعال با استفاده از قوانین قادر به «پشتیبانی گستردهتر قیود جامعیت و سازگاری دادهها، واکنش در مقابل رخدادهای سیستم کاربردی، عدم اجرای تقاضاهای مشکوک، ردیابی رویدادها، گزارشات ماهانه و…» میباشد.
همانطور که گفته شد آنچه که به طور معمول باعث میشود یک پایگاه داده را فعال بدانیم، عکسالعمل سیستم در مقابل وضعیتهایی است که در پایگاه داده و یا حتی خارج از آن به وجود میآید. این وضعیتها میتواند شامل یک حذف غیرمجاز و یا تغییر وضعیت پایگاه داده باشد. باید توجه داشت که داشتن تعامل برای یک پایگاه داده لازم اما کافی نیست. بسیاری از سیستمهای پایگاه داده با رعایت اصول پایهای که در زیر به آن اشاره میشود به طور عام پایگاه داده فعال نامیده می شوند .
اینگونه سیستمها باید یک پایگاه داده باشند، یعنی در صورتی که کاربر فراموش کرد، سیستم مورد نظر پایگاه داده فعال است بتواند از آن به عنوان یک پایگاه داده معمولی استفاده نماید (در صورت لزوم بتوان به عنوان یک پایگاه داده معمولی از آن استفاده نمود).
در اینگونه سیستمها باید امکان تعریف و مدیریت قوانین وجود داشته باشد. این قوانین در پایگاه داده فعال دارای سه جزء رویداد، شرط و واکنش میباشند.
این سیستمها باید دارای یک مدل اجرایی باشند. به این ترتیب که با بروز رویداد و صحت شرط، واکنش قانون اجرا شود. یک پایگاه داده فعال باید قادر به آشکارسازی رویدادها و بررسی شرط قوانین فعال و اجرای فرامین واکنش باشد.
علاوه بر موارد فوق، بهتر است در این سیستمها محیط مناسبی برای تعریف و امکان کامپایل کردن قوانین فراهم شود که به کاربر در تعریف قوانین کمک کند.
فازیسازی پایگاههای داده فعال با هدف نزدیکتر نمودن زبان بیان قوانین به زبان طبیعی طراحان مطرح شد. اغلب تقاضاهای کاربران پایگاه داده فعال، فازی میباشد. به عنوان نمونه در تقاضاهایی نظیر عدم تعلق پاداش به کارمندان «کمکار»، «افزایش» فشارخون، محاسبه حقوق کارمندان در «پایان» هر ماه و… از کلمات فازی استفاده شده است که عدم پشتیبانی مفاهیم فازی و به کار بردن مقادیر دقیق منجر به حصول نتایج نامطلوب در برخی سیستمهای کاربردی میشود.
تفاوت اصلی در فازیسازی پایگاه داده فعال با سایر سیستمهای فازی، در نوع تعریف قوانین میباشد. به این ترتیب که در تعریف قوانین در اینجا از سه جزء اصلی رویداد، شرط و واکنش استفاده میشود در صورتی که سیستمهای مبتنی بر قانون عموماً از دو جزء شرط و واکنش تشکیل شدهاند اما فازی نمودن شرط و واکنش قوانین در پایگاههای داده فعال تفاوت چندانی با شرط و واکنش فازی در سیستمهای مبتنی بر قانون ندارد و در فازی نمودن رویداد نیز میتوان از همان سیاق رویدادهای فازی استفاده نمود این بحث توسط ولسکی و بوازیز در مطرح شده است.
در این پایاننامه سعی شده است بحثهای مطرح شده در پایگاههای داده فعال فازی بطور خلاصه بررسی شود. همچنین در ادامه با معرفی عمل رونوشت برداری و بکارگیری قوانین فازی(تریگرهای فازی) در عمل رونوشت برداری روش بهبود یافته جدیدی معرفی می شود.
1-2 مروری بر فصول پایاننامه
در ادامه این پایاننامه در فصل دوم مفاهیم پایگاه داده فعال ارائه شده است. همچنین مدل اجرایی، نمونههایی از این نوع پایگاه داده و برخی کاربردهای پایگاه داده فعال در ادامه این فصل آمده است.
در فصل سوم مختصری از مفاهیم فازی ارائه شده است.
فصل چهارم شامل چگونگی پشتیبانی مفاهیم فازی در بخشهای مختلف یک پایگاه داده فعال میباشد.
فصل پنجم به بیان طرح استفاده از تریگرهای فازی در پایگاه داده فعال جهت ارائه روش جدید رونوشت برداری فازی میپردازد و مزایای استفاده از روش رونوشت برداری فازی نسبت به روشهای مرسوم قدیمی غیر فازی با یک نمونه پیادهسازی شده مقایسه می گردد.
فصل ششم به بیان چگونگی پیاده سازی تریگرهای فازی در پایگاه داده فعال غیر فازی و نیز پیاده سازی رونوشت برداری فازی بوسیله آن می پردازد.
فصل دوم: پایگاه داده فعال
پایگاه داده فعال با هدف افزودن تعامل به پایگاه داده و با استفاده از تعریف قوانین ایجاد شد. اولین پایگاه داده فعال، توسط Dayal و همکارانش در یک پروژه دانشگاهی به نام Hipac مطرح شد. پایگاه داده این نرمافزار همانند Samos شیءگرا میباشد. علاوه بر پایگاههای داده فعال شیءگرا سیستمهایی با پایگاه دادهی فعال رابطهای نیز ایجاد شدهاند که از جمله آنها میتوان Starburst و [18]Arial را نام برد، این نوع پایگاههای داده به جای واکنش در مقابل فراخوانی متد یا تغییر خصیصهها به تغییر، حذف و اضافه در جداول پایگاه داده حساس میباشند .
پایگاه داده فعال دارای دو بخش مدیریت داده و مدیریت قوانین میباشد. بخش مدیریت داده مسئول حفظ خواص پایگاه داده نظیر سازماندهی، مدیریت و پشتیبانی دادهها میباشد. بخش دوم یا مدیریت قوانین مسئول واکنش به رویدادهایی است که در سیستم اتفاق میافتند.
2-1 مدیریت داده
این بخش مسئول حفظ خواص پایگاه داده میباشد، به طوری که طراحان میتوانند از قابلیتهای پایگاه داده فعال همانند یک پایگاه داده معمولی استفاده نمایند. ضمن اینکه میتوان خواص پایگاه داده را در یک پایگاه داده فعال به صورت مطلوبتری ایجاد نمود.
برقراری قیود جامعیت پشرفته تر در پایگاه داده: این قیود در یک پایگاه داده معمولی فقط روی یک جدول قابل تعریف میباشند در حالی که با استفاده از قوانین پایگاه داده فعال، امکان تعریف محدودیت بر روی چندین جدول نیز وجود دارد.
سازگاری بیشتر: سازگاری بین دادهها با استفاده از قوانین به صورت گستردهتری پشتیبانی میشود.
2-2 مدیریت قوانین
پایگاه داده فعال با استفاده از قوانین تعامل را به پایگاه داده میافزایند. این امر باعث میشود بدون استفاده از کدهای نرمافزارهای خارجی به رویدادهای سیستم در درون پایگاه داده پاسخ داده شود، در نتیجه تغییر در ضوابط سیستم کاربردی با کمترین هزینه و با تغییر قوانین به راحتی امکانپذیر است.
در این فصل انواع تعریف و پیچیدگیهای رفتاری قوانین در این نوع سیستمها و مدلهای اجرایی متفاوت (با توجه به تعریف یک قانون) ارائه خواهد شد.
2-2-1 تعریف قانون
در پایگاه داده فعال هر قانون دارای سه بخش رویداد، شرط و واکنش میباشد و قانونی دارای هر سه جزء فوق باشد اصطلاحاً ECA نامیده میشود.
Rule Rule_Name
[ON Event]
[IF Condition]
THEN Action
به طور کلی وجود دو جزء رویداد و شرط در تعریف قوانین میتواند اختیاری و یا اجباری باشد. در برخی نمونههای پیادهسازی شده پایگاه داده فعال تنها تعریف یکی از دو جزء اختیاری است یعنی امکان عدم تعریف رویداد در قانون وجود دارد و حضور شرط اجباری است. در زبانهایی که تعریف هر دو جزء اختیاری باشد، تعریف یکی از آنها در هر قانون الزامی است در غیر این صورت تبدیل به یک قانون همیشه درست میشود.
در صورت حذف شرط (EA Rule) با بروز رویداد، واکنش آن اجرا میشود و با حذف رویداد (CA Rule) در صورت برقراری شرط، واکنش قانون مربوطه به اجرا درمیآید.
در این قسمت ابتدا به شرح مختصری از هر سه جزء قانون و نکاتی که در استفاده از ECA باید رعایت شوند میپردازیم و سپس انواع رفتارهای مدل اجرایی پایگاه داده فعال بیان میشود.
1)رویداد:
رویدادها در نقطهای از زمان اتفاق میافتند و به سه صورت تقسیمبندی میشوند. در نوع اول با توجه به منبع به وجود آورنده خود به هفت گروه ساختاری، انتزاعی، تراکنش، کاربر، استثناء، زمان، خارجی تقسیم میشوند.
در نوع دوم با توجه به اینکه از یک رویداد ساده تشکیل شدهاند یا از ترکیب جبری منطقی رویدادهای ساده به وجود آمدهاند به دو گروه ساده و مرکب تقسیم میشوند.
در نوع سوم با توجه به زمان بروز نمونههای یک رویداد به سه گروه آغازین، میانی و پایانی تقسیم میشوند که در ادامه به شرح مختصری از انواع رویدادها در این سه گروه میپردازیم.
ساختاری: یک رویداد به دلیل انجام عملیاتی روی ساختار پایگاه داده فعال میشود (در مدل رابطهای تغییر و حذف و اضافه یک رکورد و در مدل شیءگرا تغییر خصیصهها، فراخوانی متد و ارسال پیام).
ON Update emp.id
انتزاعی: رویداد به صورت واضح توسط طراح یا برنامه کاربردی فعال میشود (طراح میتواند گرفتن یک گزارش خاص را یک رویداد معرفی کند که در صورتی که یک مجموعه تهی تولید نکند یک رویداد انتزاعی است).
تراکنش: رویدادها، دستورالعملهای تراکنشی نظیر Start و Abort و Commit میباشند.
ON Begin Transaction Emergency
کاربر: رویداد به دلیل عملکردها و مکانیزمهای برنامهنویسی فعال میشود (دادن پیام مناسب به کاربری که مشغول وارد کردن داده میباشد).
استثناء: انجام عملیات غیرمجاز در سیستم موجب بروز این نوع رویداد میشود (دستیابی غیرمجاز کاربران به اطلاعاتی که مجوز مناسب آن را ندارند).
زمان: این نوع رویدادها در نقطهای از زمان فعال میشوند (مثلاً اول هر ماه).
خارجی: رویدادهایی که به دلیل وقوع رویدادی در خارج از سیستم بروز میکنند در این گروه قرار میگیرند (فشردن کلید).
در نوع دوم رویدادها به دو دسته ساده و مرکب تقسیم میشوند. رویدادی که تنها از یک جزء تشکیل شده است ساده و رویدادهایی که از ترکیب جبری و منطقی رویدادهای ساده به دست میآیند مرکب نامیده میشوند.
متن کامل را می توانید دانلود نمائید چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)
ولی در فایل دانلودی متن کامل پایان نامه
همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند
موجود است
مروری بر SQL
تاریخچه SQL از لابراتوار IBM در سان خوزه کالیفرنیا شروع میشود. جایی که SQL در اواخر دهه 1970 میلادی شکل گرفت.
کلمه SQL برگرفته از حروف اول کلمات Structuted Query Language ساخته شده و اغلب اوقات اشاره به ‘sequel’ میکند.
این زبان ابتدا برای محصول DB2 شرکت IBM (یک سیستم مدیریت پایگاه دادهای رابطهای یا RDBMS که امروزه نیز برای بعضی محیطها فروخته میشود، طراحی شد.)
در واقع SQL امکان RDBMS را فراهم میآورد. SQL یک زبان غیر روالمند میباشد، بر خلاف زبانهای روانمند یا زبانهای نسل سوم (3 GLs) مثل کوبول و C که در آن زمانها ایجاد شده بودند.
تذکر ـ غیر روانمند یعنی چه به جای چگونه، بطور مثــال SQL میگوید که دادهها باید ذخیره، حذف، اضافه یا بازیابی شوند بدون آنکه به چگونگی انجام آنها کاری داشته باشد.
ویژگی مهمی که باعث تفاوت بین DBMS و RDBMS میگردد، آن است که یک RDBMS از یک زبان مبتنی بر مجموعهها استفاده میکند. در اکثر RDBMS ها این زبان، زبان SQL است. در نتیجه SQL زبان مبتنی بر مجموعهها است.
SQL، یک زبان کامپیوتری مبتنی بر استاندارد (American National Standards Institute) ANSI برای بازیابی و بروز رسانی دادهها در یک پایگاه دادهای میباشد و با برنامههای پایگاه دادههایی مانند MS Access ، DB2 ، MS SQL Server ، Oracle، Sybase و … کار میکند.
از طریق SQL، یک برنامه نویس یا گرداننده دادهها میتواند کارهای زیر را انجام دهد:
! تغییر ساختار یک پایگاه دادهای
! تغییر مشخصات امنیتی سیستم
! امکان اعطای اجازه دسترسی کاربران به پایگاه دادهای یا جداول
! پرس و جو از یک پایگاه دادهای
استفاده از SQL و پایگاه دادهای رابطهای نیز از مهمترین اقدامات انجام شده در جهت توسعه کاربرد Client/Server میباشد.
SQL بطور کلی شامل دو گروه از جملات میباشد:
متن کامل را می توانید دانلود نمائید چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)
ولی در فایل دانلودی متن کامل پایان نامه
همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند
موجود است
1- مقدمه
صنعت نرمافزاری در جهان و ایران صنعتی است نو و نسبتاً جدید. با این وجود در طی عمر بسیار کوتاه، این صنعت تحولات وسیع، عمیق و شگرفی را شاهد بوده است. مهمترین این نوع تحولات را میتوان موارد زیر دانست:
مجموعه فوق باعث میشود که هر کشور دنیا برای رشد و توسعه صنعت نرمافزار خود برنامهریزیهای فراوانی بنماید اما از طرف دیگر، تجربه نشان میدهد که چنان چه بدون برنامهریزی درست اقدام به ورود به این عرصه شود، نتیجه مطلوب ممکن است بدست نیاید. بنابراین بسیار مهم است که بدانیم در کدام عرصهها، چگونه و با چه مجموعه فرآوردهها و خدماتی باید وارد شد.
گزارش حاضر برای پاسخگویی به همین مسئله آماده شده است. این گزارش (که اولین گزارش از مجموعه گزارشاتی از این دست است) ابتدا به بررسی وضعیت بازار جهانی میپردازد و سپس تخمینی از حجم بازار داخلی را بدست میدهد.
2-1 Data Base Management System
نرمافزار پایگاه دادهها Data Base، مجموعهای است که داده های ذخیره شده به صورت منطقاً مجتمع و به هم مرتبط و حتی الامکان فاقد افزونگی را که مورد استفاده چند کاربر از یک محیط عملیاتی است به صورت هم زمان و اشتراکی تحت مدیریت یک سیستم کنترل متمرکز DBMS قرار میدهد. پس DBMS نرمافزاری است که به کاربر امکان میدهد که پایگاه داده خود را تعریف و بر روی آن عملیات انجام دهد و بر روی آن تا حدی کنترل داشته باشد.
در سال 1999 DBMS(مدیریت سیستم پایگاه دادهها) از یک رشد 18درصدی برخورداربوده است. درآمد بازار نرمافزار DBMS در سال 2000 حدود 8/8 میلیارد دلار برآورد شده است که نسبت به سال 1999، 10 درصد رشد داشته است. در سال 2000 Object DBMS و DBMS Pre-Relational که شامل HDBMS و NDBMS یک رشد منفی داشته و در مقابل DBMS Relational یک رشد 15% داشته است. در حقیقت DBMSR 80% از کل بازار DBMS را به خود اختصاص داده است .
2-2 XML , Virtual DBMS
( eXtensible Markup Language ) XML در سالهای اخیر به عنوان استاندارد جدیدی برای بیان داده و رد و بدل کردن آن در اینترنت به کار میرود. XML محتوی اطلاعاتی را از فرمت نمایشی آن جدا می کند.
بازار XML و Virtual DBMS در سال 2000 از یک رشد 7/66% برخوردار بوده است. یعنی از مقدار 10 میلیون دلار در سال 1999 به 77 میلیون دلار در سال 2000 رسیده است. جدول زیر نشانگر درآمد بازار , XML Virtual DBMS از سال 1998 تا 2000 توسط فروشندگان آنها می باشد.
XML نشان می دهد که در سال 2004 ، 25/1 میلیارد دلار درآمد خواهد داشت و این رشد بیانگر نیاز به XML در بازار IT میباشد.
اگر وضعیت بازار را بر حسب موقعیت جغرافیایی نیز بسنجیم در سال 2000 اروپای غربی رشد درآمد آن بالغ بر 34 میلیون دلار بوده که 2/44% از سهم بازار را به خود اختصاص داده است و آمریکای شمالی با رشد درآمد کمتر از 34 میلیون دلار، %6/43 از سهم بازار را به خود اختصاص میدهد.
بازار , XML Virtual DBMS نقش مهمی را در موفقیت enterprise information management ایفا نموده است به طوریکه پیشبینی می شود که EIM در بین سالهای 2000 تا 2005 با نرخ رشد سالیانه 85% پیش رود.
نمودارهای زیر درآمد و سود حاصل از , XML Virtual DBMS را با توجه به منطقه و محیط سیستم عامل نشان می دهد . ( در بین سالهای 2000 تا 2005 ).
2-3 Data Management System
مدیریت کلیه دادهها و اطّلاعات دریک سازمان که شامل آنالیز، ردهبندی و نگهداری از دادهها و ارتباطات آنها و بهرهبرداری و گسترش DB (پایگاه دادهها) که شامل توسعه مدل های داده و دیکشنری دادهها و بهینهسازی سیستمهای کاربردی و رعایت استانداردها برای تعریف داده ها و روشهایی که مردم بتوانند آنها را درک کرده و از آنها استفاده کنند.
سرمایهگذاری در زمینه راه حل های مناسب مدیریت داده ها Data Management solution در صنایع تولیدی و صنایع پردازشی رشد خیلی سریعتری نسبت به بازار مدیریت دادهها در این چند سال داشته است. رشد سرمایه گذاری در پیدا کردن راه حل های مناسب مدیریت دادهها 17% درسال افزایش یافته است.
نفوذ داده به واسطه مدیریت محتوی و مستندات ( Document /content Management )
و مدیریت داده محصولات (PDM) برای بهبود سرمایهگذاری و تشکیلات اقتصادیِ کارا بسیار مفید خواهد بود.
رشد در سرمایهگذاری Data Management Solution ( راه حل های مناسب مدیریت داده ) باعث بهبود در رکورد اقتصادی می شود هر چند که بیشتر این رشد متعلق به بازار مدیریت داده محصولات میباشد.
شرکت Daratechپیشبینی میکند که تا سال 2007 سرمایهگذاری کاربران در این زمینه %35 افزایش خواهد داشت.
روند این رشد در برنامهریزی اولیه استراتژیک صنایع تولیدی و پردازشی، باعث یکپارچه کردن طراحی و مهندسی و همچنین تولیدات سریعتر و پردازش مدیریت چرخه حیاتLifecycle process و ارتباط فعال بین مشتری و تهیه کننده می شود.
(ممکن است هنگام انتقال از فایل ورد به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
متن کامل را می توانید دانلود نمائید
چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)
ولی در فایل دانلودی متن کامل پایان نامه
همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند
موجود است
مطالب این پست : پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی
با فرمت ورد word ( دانلود متن کامل پایان نامه )
چکیده
بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی ,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.
در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم.
کلمات کلیدی ،کلاس بندی ، خوشه بندی ، پیش بینی ، تخمین
1-1–مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش[2] بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی[3] یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
اصلی ترین دلیلی که باعث شده داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها, اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی مورد استفاده قرار می گیرد.
داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها.
تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم فراوانی داده شده است. این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم.
ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای داده ها را کشف می کنند که می توان از آن در کاربردهایی نظیر تعیین استراتژی برای کسب و کار، پایگاه دانش[4] و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم .
1
-3-داده کاوی و مفهوم اکتشاف دانش (K.D.D)
با حجم عظیم داده های ذخیره شده در فایلها، بانکهای اطلاعاتی و سایر بانک های داده ای، توسعه ی ابزارهایی برای تحلیل و شاید تفسیر چنین داده هایی و برای استخراج علوم شگفت انگیزی که می توانند در تصمیم گیری مفید باشند، امری بسیار مهم و ضروری است. داده کاوی با عنوان کشف دانش در پایگاه های داده (KDD) شناخته میشود. کشف علومی که قبلا ناشناخته بودهاند و اطلاعاتی که در بانکهای اطلاعاتی موجود بوده و ذاتا بالقوه و مفید هستند.
با وجود آنکه داده کاوی و کشف دانش در پایگاههای داده مترادف همدیگر هستند، ولی در اصل، داده کاوی ذاتاً بخشی و تنها قسمتی جزئی از فرآیند کشف دانش است. فرآیند کشف دانش در بر گیرنده ی چندین مرحله می باشد که از اطلاعات خام، گونه هایی از علوم جدید را بدست می دهد. مراحل کشف دانش به قرار زیر است:
1- پاکسازی داده ها : در این فاز داده های اضافی و نامربوط از مجموعه داده ها حذف می شوند.(داده های ناکامل) [2]
2-یکپارچه سازی داده ها[5] : چندین منبع داده ترکیب می شوند،
3-انتخاب داده ها : انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است که همه آنها در داده کاوی مورد نیاز نیستند . برای فرایند داده کاوی باید داده ها ی مورد نیاز انتخاب شوند . به عنوان مثال در یک پایگاه داده های مربوط به سیستم فروشگاهی ، اطلاعاتی در مورد خرید مشتریان ، خصوصیات آماری آنها ، تامین کنندگان ، خرید ، حسابداری و … وجود دارند . برای تعیین نحوه چیدن قفسه ها تنها به داده ها یی در مورد خرید مشتریان و خصوصیات آماری آنها نیاز است . حتی در مواردی نیاز به کاوش در تمام محتویات پایگاه نیست بلکه ممکن است به منظور کاهش هزینه عملیات ، نمونه هایی از عناصر انتخاب و کاوش شوند .
4-تبدیل داده ها : هنگامی که داده های مورد نیاز انتخاب شدند و داده های مورد کاوش مشخص گردیدند، معمولا به تبدیلات خاصی روی داده ها نیاز است. نوع تبدیل به عملیات و تکنیک داده کاوی مورد استفاده بستگی دارد، تبدیلاتی ساده همچون تبدیل نوع داده ای به نوع دیگر تا تبدیلات پیچیده تر همچون تعریف صفات جدید با انجام عملیاتهای ریاضی و منطقی روی صفات موجود.
5-داده کاوی : بخش اصلی فرایند ، که در آن با استفاده از روش ها و تکنیک های خاص ، استخراج الگو های مفید ، دانش استخراج می شود.
6-زیابی الگو[6] : مشخص کردن الگوهای صحیح و مورد نظر به وسیله معیارهای اندازه گیری.
7-زنمایی دانش : در این بخش به منظور ارائه دانش استخراج شده به کاربر ، از یک سری ابزارهای بصری سازی استفاده می گردد.
[1] Data Mining
[2] Knowledge Discovery
[3] Data Mining
[5] Data integration
[6] Pattern evaluation
متن کامل را می توانید دانلود کنید چون فقط تکه هایی از متن این پایان نامه در این صفحه درج شده است (به طور نمونه)
ولی در فایل دانلودی متن کامل پایان نامه
همراه با تمام ضمائم با فرمت ورد word که قابل ویرایش و کپی کردن می باشند
موجود است
همانگونه که می دانیم کارآموزی نقطه شروعی است برای آماده شدن جهت ورود به بازار کار،و استفاده بهینه از این فرصت مناسب برای کلیه دانشجویان علاقمند به اشتغال در جامعه بسیار سودمند ومفید می باشد.
گزارش در دست حاصل یک ماه و نیم کارآموزی درشرکت داده پردازی فن آوامی باشد که حاوی سرفصلهای مورد آموزش و استفاده در این واحد می باشد،که در نه بخش ارائه شده است.
بخش اول به معرفی گروه فن آوا که یکی از بزرگترین شرکتهای کامپیوتری مهم کشور می باشد اختصاص دارد.
بخش دوم به معرفی خانواده XDSL ومقایسه تکنیکهای DSL وهمچنین نحوه نصب مودمADSL وچک لیست رفع مشکلات احتمالی پرداخته است.
بخش سوم حاوی مطالبی راجع به پروتکل PPPOE می باشد که بعد از معرفی این پروتکل مختصری از مزایای آن ذکر شده است.
دربخش چهارم مشخصات کلی سیستم ATM ازجمله فرمت هدرسلول،اجزاءهدرسلول وساختارولایه تنظیم آن آورده شده است.
بخش پنجم شرح کاملی از پروتکل TCP/IP راشامل می شود.
دربخش ششم خطوطE1 ،دلایل استفاده،وتکنیک دیجیتالی کهE1 برای انتقال Voice و Data استفاده میکند توضیح داده شده است.
فصل هفتم به نقش روتر درشبکههای WAN اشاره می کند.
فصل هشتم افزایش دهنده سرعت Telezoo رامعرفی می کند.
ونهایتادربخش نهم به مباحثی از HTML ودستورات آن اختصاص یافته است.
فهرست :
فصل اول گروه فن آوا
معرفی گروه فن آوا
شرکت توسعه سازه پای
شرکت فن آوا کارت
شرکت ارتباطات فن آوا
شرکت ارتباطات کوه نور
شرکت داده سامانه فن آوا
شرکت گسترش صنایع فن آوا
شرکت مشاوره فن آوا
شرکت فن آوا موج
شرکت داده پردازی فن آوا
شرکت فن آوا ماهواره (سهامی خاص)
شرکت فن آوا سیستم (سهامی خاص)
سرویسهای گروه فن آوا
سرویس VSat گروه فن آوا
سرویس ISP گروه فن آوا
سرویس IDC گروه فن آوا
سرویس پرداخت الکترونیک گروه فن آوا
سرویس پهنای باند گروه فن آوا
سرویس تلفن ثابت گروه فن آوا
جریان کار شرکت داده پردازی فن آوا
فصل دوم خانواده XDSL
تکنولوژی DSL
چگونگی عملکرد تکنولوژی DSL
تجهیزات DSL
معرفی تکنیک ADSL
مدولاسیونهای سیستم ADSL
روش CAP
روش DMT
معرفی تکنیک VDSL
سرعت VDSL
تجهیزات VDSL
آینده VDSL
نصب مودم ADSL
نصب تجهیزات
شکل شماتیک نصب تجهیزات
تست اولیه
نصب راه انداز (Driver) مربوط به مودم
نحوه ساختن ADSL Connection و تنظیمات مربوطه در WinXP
چک لیست مشکلات رایج کاربران
تست کردن POWER
تست کردنDSL Link
تست کردن USB یا Ethernet
چک کردن تنظیمات PPPoE
چک کردن تنظیمات TCP/IP
تست DNS
تنظیمات Browser
تست و تحویل کیفیت خط
فصل سوم PPPOE
تاریخچه PPPOE ( History of PPP over Ethernet )
مختصری از مزایای استفاده از پروتکل PPPOE
فصل چهارم مشخصات کلی سیستم ATM
فرمت هدر سلول ATM
اجزاء هدر سلول ATM
ساختار مدل ATM
لایههای تنظیم ATM
فصل پنجم پروتکل TCP/IP
معرفی پروتکل TCP/IP
لایههای پروتکل TCP/IP
لایه Application
لایه Transport
لایه اینترنت
لایه Network Interface
مشخص نمودن برنامهها
آدرس IP
پورت TCP/UDP
سوکت ( Socket )
پروتکلهای اساسی TCP/IP
پروتکل TCP لایه Transport
پروتکل UDP لایه Transport
پروتکل IP لایه Internet
پروتکل ICMP لایه Internet
پروتکل IGMP لایه Internet
پروتکل ARP لایه Internet
فصل ششم خطوط E
فصل هفتم روتر و نقش آن در شبکههای WAN
فصل هشتم افزایش دهنده سرعت اینترنت
Speedy چگونه کار می کند؟
استفاده از Speedy چگونه است ؟
حداقل امکانات برای اجرای Speedy چیست ؟
Speedy با چه سیستم اتصال به اینترنت کار می کند و آیا جایگزین ISP است ؟
آیا می توان به طور هم زمان از خطوط تلفن Speedy استفاده کرد؟
آیا Speedyدر هر کشور قابل استفاده است ؟
آیا می توان را به همراه تلفن همراه استفاده کرد ؟
آیا Speedy سرعتEMail را نیز بالا می برد ؟
آیا Speedy قابلیت استفاده بر روی بیش از یک کامپیوتر را دارد؟
چگونگی ارائه خدماتADSL شرکت فن آوا در شهرستانها
فصل نهم HTML
شکل کلی دستورات HTML
تعیین تیترها وپاراگراف بندی
تعیین نوع متن،توضیحات وخط افقی
ایجاد پیوند و انتقال تصویر صفحه وب
لیستها در HTML
لیست مرتب
لیستهای نامرتب
لیستهای تعریفی
تعریف جدول
صفات rowspan و colspan
جدول و صفحه آرایی
فرمها و پرسش نامهها
ایجاد پرسش نامه در صفحه وب با HTML
دستور <form>
صفت action
صفت method
نحوه کاربرد form
کنترلهای فرم
کنترلهای متنی
فیلد رمز در form
فیلد متنی چند خطی
منوها باز شونده
لیست لغزنده
کادرهای کنترلی
دکمههای رادیویی
دکمههای Reset و Submit
استفاده از دکمههای تصویری به جای submit
ادامه مراحل کارآموزی
فهرست مآخذ