داده کاوی، فرایند مرتب سازی و طبقه بندی داده های حجیم و آشکارسازی اطلاعات مرتبط باهم می باشد. امروزه داده کاوی به عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده های موجود در سازمان با بکارگیری ابزارهای نرم افزاری، مورد بررسی و تحلیل دقیق قرار می گیرد تا الگوهای پنهان و پیچیده ای که در آنها وجود دارد کشف و استخراج گردد. داده کاوی را می توان نسل سوم تکنولوژیهایی نامید که با داده سروکار دارند. در نسل اول یا نسل سنتی، فقط انجام پرس و جو های ساده امکان پذیر بود، مثلا تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه ای برخط (OLAP) امکان پرس و جوی همزمان چند بعدی فراهم گردید. در این روش به عنوان مثال به سوالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟ » بصورت لحظه ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می شود. اما در نسل سوم یا همان داده کاوی فقط مساله پرس و جو و دریافت گزارش ها از داده ها نیست، بلکه از حجم انبوه داده ها، الگوهایی کشف می شود که هیچ وقت امکان کشف این الگوها در OLAP یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده کاوی بدست می آیند و کاربرد دارند عبارتند از: وابستگی، تسلسل و توالی، طبقه بندی، خوشه بندی و پیش بینی. برای استخراج این الگوها اغلب از روشهای نوینی مانند شبکه عصبی و درختهای تصمیم استفاده می شود. در عمل برای امکان انجام داده کاوی و استفاده از تکنیکهای فوق الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبارداده در حقیقت پایگاه داده ای است که داده های جاری و همچنین سوابق قبلی تراکنشها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می کند. اهداف کلی این مقاله عبارتند از ارایه تعریف دقیقی از انبار داده، بررسی تکنیکها و کاربردهای داده کاوی و کاربرد آن در مدیریت، معرفی شبکه عصبی به عنوان یکی از روشهای اجرای داده کاوی و بیان مفهوم درخت تصمیم و ارتباط آن با داده کاوی.
فهرست :
چکیده
مقدمه ای بر دادهکاوی
فصل اول
چه چیزی سبب پیدایش داده کاوی شده است
مراحل کشف دانش
جایگاه داده کاوی در میان علوم مختلف
داده کاوی چه کارهایی نمی تواند انجام دهد؟
داده کاوی و انبار داده ها
داده کاوی و OLAP
کاربرد یادگیری ماشین و آمار در داده کاوی
فصل دوم
توصیف داده ها در داده کاوی
خلاصه سازی و به تصویر در آوردن داده ها
خوشه بندی
تحلیل لینک
فصل سوم
مدل های پیش بینی داده ها
Classification
Regression
Time series
فصل چهارم
مدل ها و الگوریتم های داده کاوی
شبکه های عصبی
Decision trees
Multivariate Adaptive Regression Splines(MARS)
Rule induction
Knearest neibour and memorybased reansoning(MBR)
رگرسیون منطقی
تحلیل تفکیکی
مدل افزودنی کلی (GAM)
Boosting
فصل پنجم
سلسله مراتب انتخابها
فصل ششم
مراحل فرایند کشف دانش از پایگاه داده های بزرگ
انبارش داده ها
انتخاب داده ها
تبدیل داده ها
کاوش در داده ها
تفسیر نتیجه
فصل هفتم
عملیات های داده کاوی
مدل سازی پیشگویی کننده
تقطیع پایگاه داده ها
تحلیل پیوند
فصل هشتم
قابلیت هایdata mainig
داده کاوی وانبار داده ها
داده کاوی آمار ویادگیری ماشین
کاربرد های داده کاوی
داده کاوی موفق
تحلیل ارتباطات
فصل نهم
طبقه بندی
حدس بازگشتی
سری های زمانی
درخت های انتخاب
استنتاج قانون
الگوریتم های ژنتیک
فصل دهم
فرایند های داده کاوی
مدل فرایند دو سویه
فصل یازدهم
ساختن یک پایگاه داده داده کاوی
جستجوی داده
آماده سازی داده برای مدل سازی
ساختن مدل برای داده کاوی
تائید اعتبار ساده
ارزیابی وتفسیر
فصل دوازدهم
ماتریس های پیچیدگی
ایجادمعماری مدل ونتایج
فصل سیزدهم
نتیجه گیری
منابع ومآخذ
شرح مختصر : داده های مورد استفاده در این پروژه از پایگاه داده دانشگاه آزاد قزوین تهیه شده است، این داده ها اطلاعات ۵۰۰ نفر دانشجوی مقطع کارشناسی رشته مهندسی صنایع (گرایش های تکنولوژی صنعتی و تولید صنعتی) است. که در قالب یک فایل اکسل با ۳۸۳۷۷ رکورد می باشد و سنوات تحصیلی ۱۳۸۴ تا ۱۳۹۰ را شامل می شود. مدلی که برای پیشبینی ارتقاء سطح علمی دانشجویان بر اساس اطلاعات موجود در پایگاه داده دانشگاه آزاد قزوین پیشنهاد میشود در زیر شرح داده میشود : در این مدل پیشنهادی مراحل مختلف فرآیند داده کاوی از جمله جمع آوری دادهها، آماده سازی و پیش پردازش داده ها را روی مجموعه آموزشی ذکر شده انجام داده و الگوریتمهای مختلف داده کاوی از جمله خوشه بندی، قوانین انجمنی، درخت تصمیمگیری، برای دادهها به کار گرفته شده است. ابتدا برای عملکرد بهتر الگوریتمهای داده کاوی یک سری عملیات پیشپردازشی روی دادهها انجام داده شده است. همچنین بعد از تجمیع دادهها داخل یک فایل خصیصههای عددی به خصیصه های گروهی معادل تبدیل شده است. برای مثال تمام نمرات دانشجویان به پنج گروه عالی، خوب، متوسط، ضعیف و مردود تقسیم بندی شده است.
تعداد صفحات : 80
فرمت فایل : Word , pdf
217 صفحه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی ,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.
در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش[1] بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی[2] یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
کاربرد داده کاوی در تجارت الکترونیک
151 صفحه در قالب word
فهرست
چکیده. 8
تکنیکهای داده کاوی و متدلوژیهای ان
داده کاوی و کاربرد آن در کسب و کار هوشمند بانک.... 19
داده کاوی درمدیریت ارتباط بامشتری.. 21
کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی.. 22
داده کاوی آماری و مدیریت بهینه وب سایت ها 25
داده کاوی در مقابل پایگاه داده Data Mining vs database. 26
منابع اطلاعاتی مورد استفاده 28
مسائل کسب و کار برای دادهکاوی.. 31
متدلوژی دادهکاوی و بهترین تمرینهای آن.. 35
یادگیری چیزهایی که درست نیستند. 36
الگوهایی که ممکن است هیچ قانون اصولی را ارائه نکنند. 36
چیدمان مدل ممکن است بازتاب دهنده جمعیت وابسته نباشد. 38
ممکن است داده در سطح اشتباهی از جزئیات باشد. 38
یادگیری چیزهایی که درست ولی بلااستفادهاند. 40
مدلها، پروفایلسازی، و پیشبینی.. 42
مرحله 1: تبدیل مسئله کسب و کار به مسئله دادهکاوی.. 46
مرحله 2: انتخاب داده مناسب... 48
مرحله سوم: پیش به سوی شناخت داده 51
مرحله چهارم: ساختن یک مجموعه مدل.. 52
مرحله پنجم: تثبیت مسئله با دادهها 54
مرحله ششم: تبدیل داده برای آوردن اطلاعات به سطح.. 56
تجارت الکترونیک
فصل اول: مقدمه ای بر تجارت الکترونیکی.. 73
1- طبقههای مختلف تجارت الکترونیکی.. 75
2- تفاوت تجارت الکترونیکی با تجارت سنتی.. 76
3- نقش دولت در تجارت الکترونیک.... 78
فصل دوم : شکل دهی موقعیت بازار. 80
1- چار چوبی برای تحلیل موقعیت بازار. 80
1-4- مطالعه توانمندیها و منابع شرکت : 81
1-5- اندازه گیری جذابیت موقیت : 82
2 ) ویژگی های تحلیل موقعیت بازار در اقتصاد جدید: 82
3_ دو نوع ارزش ( value type ) عمده. 84
3_2_ ارزش های جدید ( New-To-The-World value ) : 86
4 – شناسایی نیاز های برآورده شده و برآورده نشده. 88
4-1_ فرآیند تصمیم گیری مشتری... 88
4-2_ آشکارسازی نیازهای برآورده شده و برآورده نشده. 89
5- تعیین مشتریان ویژهای که شرکت قصد متقاعد کردن آنهارا دارد. 91
5-1- روشهایی برای تقسم بندی بازار: 91
5-2- تقسیم بندی قابل اجرا و معنی دار. 92
_ تقسیم بندی قابل اجرا(Actionable Segmentation) 93
5-3-ترکیب مناسبی از متغیر ها 93
5-4-تناظر بازار و مشتریان هدف... 96
رقبای نزدیک (Adjacent competitors) : 100
بررسی رقبا : (competitor Map) 100
7-2- پویایی های مربوط با مشتریان : 101
آیا شرکت قادر است در مورد ارزش یا ارزشهای ارائه شده با دیگران رقابت کند؟ 105
چگونه یک شرکت یک سرویس آنلاین را توسعه می دهد؟ 107
یک سیستم منابع مناسب و موفق چگونه است؟ 109
معیارهایی برای ارزیابی کیفیت یک سیستم منبع: 112
مدلهای سوددهی برای شرکتهای آنلاین چه هستند؟ 114
2-1- مدلهای مبتنی بر کاربر و شرکت: 115
مدلهای مبتنی بر خلق ارزش توسط شرکت: 117
1- هفت عنصر طراحی برای واسط مشتری.. 121
2- چه چیز تعیین کننده جلوه یک وب سایت است؟ 125
5- اهرمهای مورد استفاده برای سفارشی کردن یک سایت... 136
6- یک سایت چگونه با مشتریان خود ارتباط بر قرار می کند؟ 139
7- اتصال یک وب سایت با وب سایتهای دیگر. 142
8- اشکال مختلف تجارت در وب سایت... 144
تبادل الکترونیکی داده ها (EDI) 147
3- تبادل الکترونیکی داده ها (EDI) 148
منابع 151
چکیده:
این پایان نامه شامل دو بخش می باشد. بخش اول در مورد داده کاوی و تکنیکها ومتدلوژی های ان و بخش دوم در مورد تجارت الکترونیک می باشد.
بخش اول شامل مطالبی در مورد عناصر داده کاوی و سپس کاربردهای داده کاوی در موارد مختلف و تفاوت داده کاوی با پایگاه داده و متدلوژی ها و مراحل داده کاوی وهمچنین وظایف داده کاوی توضیحاتی داده شده است.
بخش دوم در مورد تجارت الکترونیکی که در ان مقدمه ای از تجارت اتکترونیک و شکل دهی موقعیت بازار را بیان نموده است.
مقدمه
از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافتهاند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[3]
حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است.
این واقعیت، ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است، چنان که در عصر حاضر گفته می شود اطلاعات طلاست.
هم اکنون در هر کشور، سازمان، شرکت و غیره برای امور بازرگانی، پرسنلی، آموزشی، آماری و غیره پایگاه داده ها ایجاد یا خریداری شده است. به طوری که این پایگاه داده ها برای مدیران، برنامه ریزان، پژوهشگران جهت، تصمیم گیری های راهبردی، تهیه گزارش های مختلف، توصیف وضعیت جاری خود و سایر اهداف می تواند مفید باشد. بسیاری از این داده ها از نرم افزارهای تجاری، مثل کاربردهای مالی، ERPها، CRMها و web log ها، می آیند. نتیجه این جمع آوری داده ها این میشود که در سازمانها، داده ها غنی ولی دانش ضعیف، است. جمع آوری داده ها، بسیار انبوه میشود و بسرعت اندازه آن افزایش می یابد و استفاده عملی از داده ها را محدود می سازد.[2]
دادهکاوی استخراج و تحلیل مقدار زیادی داده بمنظور کشف قوانین و الگوهای معنی دار در آنهاست. هدف اصلی داده کاوی، استخراج الگوهایی از داده ها، افزایش ارزش اصلی آنها و انتقال داده ها بصورت دانش است.
دادهکاوی، بهمراه OLAP، گزارشگری تشکیلات اقتصادی(Enterprise reporting) و ETL، یک عضو کلیدی در خانواده محصول Business Intelligence(BI)، است.[2Error! Reference source not found.]
حوزههای مختلفی وجود دارد که در آنها حجم بسیاری از داده در پایگاهدادههای متمرکز یا توزیع شده ذخیره میشود. برخی از آنها به قرار زیر هستند: [6Error! Reference source not found.]
در بیشتر این حوزهها، تحلیل دادهها یک روال دستی بود. یک تحلیلگر کسی بود که با دادهها بسیار آشنا بود و با کمک روشهای آماری، خلاصههایی تهیه و گزارشاتی را تولید میکرد. در یک حالت پیشرفتهتر، از یک پردازنده پیچیده پرسش استفاده میشد. اما این روشها با افزایش حجم دادهها کاملا بلااستفاده شدند.
واژه های «دادهکاوی» و «کشف دانش در پایگاه داده»[1] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1 نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها میباشد. دادهکاوی، مرحلهای از فرایند کشف دانش میباشد و شامل الگوریتمهای مخصوص دادهکاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند[3Error! Reference source not found.]. به بیان سادهتر، دادهکاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق میشود. تعریف دیگر اینست که، دادهکاوی گونهای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیمگیری از قطعات داده میباشد، به نحوی که با استخراج آنها، در حوزههای تصمیمگیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. دادهها اغلب حجیم، اما بدون ارزش میباشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه[2] گفته میشود.
ممکن است هنگام انتقال از فایل ورد به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است
متن کامل را می توانید در ادامه دانلود نمائید
چون فقط تکه هایی از متن برای نمونه در این صفحه درج شده است ولی در فایل دانلودی متن کامل همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند موجود است
42 اسلاید