فرمت فایل : word(قابل ویرایش)
تعداد صفحات:15
چکیده:
Center چیست؟
Data Center ها با در اختیار داشتن اتصالات پرسرعت ای به اینترنت، و همچنین در اختیار داشتن سرورهای قوی و متعدد، امکان راهاندازی سرورهای وب را برای عموم مردم ممکن ساختند. شرکتهای تجاری و مردم میتوانستند با اجاره کردن فضای محدودی در این سرورها، سایتهای وب خود را معرض دید عموم قرار دهند.
تا قبل از دهه 90 استفاده از اینترنت برای مردم عادی به سادگی امکانپذیر نبود، چرا که استفاده از امکانات اینترنت نیاز به دانش خاصی داشت. محیط خط فرمانی(Command Line) و ساختار غیر گرافیکی اینترنت سبب شده بود که کاربران عادی علاقه چندانی به استفاده از اینترنت نداشته باشند.
در اوایل دهه 90، پس از به وجود آمدن مفهوم وب در اینترنت (سال 1993 ) و پروتکل HTTP که به سادگی امکان به اشتراک گذاشتن مستندات در اینترنت را در اختیار کاربران قرار میداد، روز به روز بر تعداد کاربران اینترنت افزوده شد. از سوی دیگر با اضافه شدن کاربران اینترنت، حجم مستندات نیز روز به روز افزایش یافت. مسلماً خطوط سابق اینترنتی و سرورهای موجود، توانایی جوابگویی به خیل عظیم کاربران را نداشتند.
همچنین با زیاد شدن کاربران و بالا رفتن حجم مستندات، و نیز سادگی انتشار اطلاعات در اینترنت، مفاهیم تجاری نیز وارد عرصه اینترنت شدند. شرکتهای تجاری نیاز به سرورهایی داشتند که این امکان را به آنها بدهد که به سادگی و با سرعت بتوانند اطلاعات خود را در اختیار مشتریان و کاربران خود قرار دهند.
بالطبع این امکان وجود نداشت که هر شرکت یا سازمانی که قصد راهاندازی سایتهای اینترنتی را دارد، خود راساً اقدام به راهاندازی سرور خود کند، چرا که با وجود کاربران زیاد این سایتها و حجم بالای ترافیک، نیاز به اتصالهایی با سرعتهای بسیار بالا وجود داشت که مسلما حتی در صورتی که این امکان از لحاظ عملی وجود داشته باشد، هزینه بالایی را میطلبید.
راهحلی که برای این مشکل به نظر رسید، راهاندازی مراکز خاصی تحت عنوان Data Center یا مراکز دادهای بود. Data Center ها با در اختیار داشتن اتصالات پرسرعت ای به اینترنت، و همچنین در اختیار داشتن سرورهای قوی و متعدد، امکان راهاندازی سرورهای وب را برای عموم مردم ممکن ساختند.
شرکتهای تجاری و مردم میتوانستند با اجاره کردن فضای محدودی در این سرورها، سایتهای وب خود را معرض دید عموم قرار دهند. برخی شرکتهای بزرگ نیز با توجه به نیاز خود، اقدام به اجاره کردن یک سرور در مرکز دادهای میکردند و آن را از راه دور با ابزارهای خاص کنترل میکردند.
اکنون با توجه به رشد سریع اینترنت، روز به روز به تعداد Data Center ها اضافه میشود به طوری که در حال حاضر در اکثر کشورهای پیشرفته این مراکز وجود دارند. تمرکز این مراکز بخصوص در کشور امریکا بسیار زیاد است. دلیل آن ارزان بودن نرخ اتصال به اینترنت و همچنین در دسترس بودن سرعتهای بالا میباشد.
برخی از این Data Center از طریق خطوط مختلف فیبرنوری، پهنای باندی بیش از 4Gbps را در اختیار دارند و تعداد سرورهای این Data Center معمولا بیش از 1000 است که بر اساس مشخصات به متقاضیان اجاره داده میشود.
پارامترهای زیادی در قیمت اجاره ماهانه یک سرور تاثیرگذار است که میتوان به سرعت CPU، مقدار حافظه RAM و اندازه Hard Disk ، حداکثر ترافیکی که ماهانه در اختیار هر سرور قرار میگیرد، سیستم عامل سرور و همچنین سابقه مرکز دادهای بستگی دارد.
مشخصات یک Data Center
Data Centerهای متفاوتی در نقاط دنیا وجود دارد که با توجه به نیاز و همچنین شرایط منطقهای طراحی و ساخته شدهاند. استاندارد خاصی برای یک Data Center وجود ندارد اما در اینجا سعی شده است به برخی از مشخصات عمومی یک مرکز دادهای اشاره شود. در اختیار داشتن اتصالات مختلف به اینترنت از طریق ISP و ICPهای مختلف: به طور معمول یک Data Center برای اتصال به اینترنت از چندین اتصال مختلف استفاده میکند تا در صورتی که هر یک از اتصالات به دلیلی از کار افتادند، در سرویسدهی مرکز وقفهای پیش نیاید. برخی از Data Center معروف با بیش از 12 اتصال مختلف به اینترنت متصلند.
وجود سیستم قدرت پشتیبان:
یکی از مهمترین مسائل در Data Center سرویسدهی بدون وقفه به مشتریان میباشد. با توجه به امکان قطع برق به دلایل مختلف همچون حوادث غیرمترقبه یا جنگ، نیاز به سیستم برق پشتیبان ضروری است. معمولاً Data Centerهای بزرگ از UPS های مخصوصی استفاده میکنند که امکان سرویسدهی به بیش از 100 کامپیوتر را دارند. علاوه بر سیستم UPS، ژنراتورهای قوی نیز در مرکز دادهای وجود دارد تا در صورت قطع بلندمدت برق، سرویسدهی بدون وقفه انجام شود.
وجود سرورهای متعدد:
هدف اصلی یک Data Center در اختیار گذاشتن سرورهای وب برای مشتریان است. سرورهای مورد استفاده با توجه به نیاز و امکانات Data Center تعیین میشود. تنها تفاوت مهم، نوع سرورهای مورد استفاده توسط Data Center است. در Data Center ها از دو نوع سرور استفاده میشود: سرورهای Rackmount و یا سرورهای Desktop. با توجه به حجم کم سرورهای Rackmount این امکان برای مرکز دادهای فراهم میشود که در فضایی کوچک، تعداد زیادی سرور قرار گیرد. اما مسئله مهم در این نوع سرورها، قیمت بالای این سرورها نسبت به سرورهای Desktop است. علاوه بر این امکان ارتقاء سرورهای Rack Mount تنها به مقدار اندک امکانپذیر است. با توجه به این موضوع اکثر Data Center از سرورهای Desktop استفاده میکنند.
مشخصات فیزیکی:
با توجه به این نکته که اکثر سرورهای وب از نوع Desktop هستند، ساختمانهای مراکز دادهای اکثرا با سقفهای بلند ساخته میشوند که علاوه بر تهویه هوا، امکان قرار دادن سرورهای بیشتر را میدهند. همچنین در تمامی Data Centerها، مسیرهایی برای گذراندن کابلهای شبکه و همچنین کابلهای برق وجود دارد. علاوه بر اینها، وجود سیستم تهویه قوی برای پایین نگاه داشتن دمای سرورها ضروری میباشد. البته مشخصاتی همچون وجود سقف کاذب، کف کاذب و همچنین سیستم اطفاء حریق در برخی موارد توصیه شده است.
مسئله مهم در Data Centerها، امکان استفاده متقاضیان از سرورهای Data Center میباشد که در این بخش به آن میپردازیم.
نحوه در اختیار گرفتن یک سرور وب:
پس از اینکه متقاضی سرور، با شرایط قراردادی که Data Center مفاد آن را تنظیم کرده موافقت کرد، یک سرور در اختیار وی گذاشته میشود. بسته به نوع قرارداد سرور میتواند تنها شامل سیستم عامل و یا نرمافزارهای کمکی همچون نرمافزارهای FTP و یا Control Panel سایت باشد. در صورتی که این نرمافزارها بر روی سرور نصب نشده باشد، متقاضی خود باید این نرمافزارها را نصب کند. متقاضی اکثرا از طریق Remote terminalها و یا نرمافزارهای خاصی مانند PCAnywere سرور خود را از راه دور کنترل میکند. پس از نصب و تنظیمات نرمافزاری، سرور آماده سرویسدهی میشود و بر حسب نیاز متقاضی استفاده میشود.
نکته قابل توجه، کنترل سرورها توسط متقاضی از راه دور است. با توجه به این موضوع مسئولیت کلیه مسائل و مشکلات سرور از جمله از کار افتادن سرویسها و نرمافزارها و یا حملات هکری به عهده متقاضی میباشد.
البته در شرایط خاص و پرداخت مبالغ معین متقاضی میتواند از خدمات Data Center استفاده کند.
هرچند در شرایط بحرانی همچون حملات گسترده که منجر به از کار افتادن تمامی سرورها شود، معمولا Data Center برای سرویسدهی به تمامی سرورها به مشکل برخورد میکنند که در این صورت طبق اولویتهای خود اقدام به رفع مشکل میکنند.
آیا امکان راهاندازی چنین مرکزی در ایران وجود دارد؟ این سوالی است که در بخش بعد به آن میپردازم.
ضرورت راهاندازی Data Center در ایران
شرکتهای ایرانی از روشهای متفاوتی برای راهاندازی سایتهای خود استفاده میکنند. برخی از امکانات ISP های داخلی استفاده میکنند. این روش علیرغم این که امکان پشتیبانی مناسبی را برای مدیر سایت فراهم میکند، اما از سوی دیگر به دلیل پایین بودن پهنای باند ISP های ایرانی و همچنین نامتقارن بودن اتصالات (پایینتر بودن پهنای باند ارسال نسبت به دریافت) و همچنین بالا بودن ترافیک در برخی ساعات خاص، عملا باعث کندشدن سایت میشود.
روش دیگر، استفاده از امکانات شرکتهای خارجی است که به روشهای مختلفی انجام میپذیرد، این روشها علاوه بر بالا بردن هزینهها، مشکلات خاصی را برای سایتهای ایرانی به وجود آورده است که از مهمترین آنها می توان به مسائل امنیتی اشاره کرد که برای مدتی بزرگترین دغدغه مدیران سایتهای ایرانی بود.
همه راهحلهایی که برای راهاندازی سایتهای ایرانی مورد بررسی قرار گرفت، دارای مشکلاتی بودند. البته مشکلاتی که در فصل قبل به آنها پرداختم، تنها مربوط به کاربران ایرانی این سرویسها بود ولی راهحلهای قبلی هزینههایی را هم به شرکت مخابرات به عنوان بزرگترین ارائه دهنده خدمات اینترنت در ایران وارد میکند که در بخشهای بعد به آن اشاره میشود.
مزایای راهاندازی Data Center در ایران
پایین آمدن ترافیک Gatewayهای شرکت مخابرات:
در حال حاضر بیش از 30 سرور در کشورهای غربی (اکثرا کانادا ، امریکا و انگلیس) در اجاره شرکتهای ایرانی قرار دارد. ترافیک ماهانه هر سرور به طور متوسط 400GB میباشد که در مجموع بیش از 12000GB ترافیک به gateway های شبکه Data کشور وارد میکند. با توجه به این که اکثر بازدیدکنندگان این سایتها ایرانی هستند، در حقیقت کاربر ایرانی، برای بازدید سایت ایرانی، علاوه بر این که باعث بالا رفتن ترافیک در gatewayهای شرکت مخابرات میشود، خود نیز متوسط زمان بیشتری را باید منتظر بماند.
فرمت فایل : word(قابل ویرایش)
تعداد صفحات:13
چکیده:
DATA
تا قبل از دهه 90 استفاده از اینترنت برای مردم عادی به سادگی امکانپذیر نبود، چرا که استفاده از امکانات اینترنت نیاز به دانش خاصی داشت. محیط خط فرمانی(Command Line) و ساختار غیر گرافیکی اینترنت سبب شده بود که کاربران عادی علاقه چندانی به استفاده از اینترنت نداشته باشند.
در اوایل دهه 90، پس از به وجود آمدن مفهوم وب در اینترنت (سال (1993 و پروتکل HTTP که به سادگی امکان به اشتراک گذاشتن مستندات در اینترنت را در اختیار کاربران قرار میداد، روز به روز بر تعداد کاربران اینترنت افزوده شد. از سوی دیگر با اضافه شدن کاربران اینترنت، حجم مستندات نیز روز به روز افزایش یافت. مسلماً خطوط سابق اینترنتی و سرورهای موجود، توانایی جوابگویی به خیل عظیم کاربران را نداشتند.
همچنین با زیاد شدن کاربران و بالا رفتن حجم مستندات، و نیز سادگی انتشار اطلاعات در اینترنت، مفاهیم تجاری نیز وارد عرصه اینترنت شدند. شرکتهای تجاری نیاز به سرورهایی داشتند که این امکان را به آنها بدهد که به سادگی و با سرعت بتوانند اطلاعات خود را در اختیار مشتریان و کاربران خود قرار دهند.
بالطبع این امکان وجود نداشت که هر شرکت یا سازمانی که قصد راهاندازی سایتهای اینترنتی را دارد، خود راساً اقدام به راهاندازی سرور خود کند، چرا که با وجود کاربران زیاد این سایتها و حجم بالای ترافیک، نیاز به اتصالهایی با سرعتهای بسیار بالا وجود داشت که مسلما حتی در صورتی که این امکان از لحاظ عملی وجود داشته باشد، هزینه بالایی را میطلبید.
راهحلی که برای این مشکل به نظر رسید، راهاندازی مراکز خاصی تحت عنوان Data Center یا مراکز دادهای بود. Data Center ها با در اختیار داشتن اتصالات پرسرعتهای به اینترنت، و همچنین در اختیار داشتن سرورهای قوی و متعدد، امکان راهاندازی سرورهای وب را برای عموم مردم ممکن ساختند.
شرکتهای تجاری و مردم میتوانستند با اجاره کردن فضای محدودی در این سرورها، سایتهای وب خود را معرض دید عموم قرار دهند. برخی شرکتهای بزرگ نیز با توجه به نیاز خود، اقدام به اجاره کردن یک سرور در مرکز دادهای میکردند و آن را از راه دور با ابزارهای خاص کنترل میکردند.
اکنون با توجه به رشد سریع اینترنت، روز به روز به تعداد Data Center ها اضافه میشود به طوری که در حال حاضر در اکثر کشورهای پیشرفته این مراکز وجود دارند. تمرکز این مراکز بخصوص در کشور امریکا بسیار زیاد است. دلیل آن ارزان بودن نرخ اتصال به اینترنت و همچنین در دسترس بودن سرعتهای بالا میباشد.
برخی از این Data Center از طریق خطوط مختلف فیبرنوری، پهنای باندی بیش از 4Gbps را در اختیار دارند و تعداد سرورهای این Data Center معمولا بیش از 1000 است که بر اساس مشخصات به متقاضیان اجاره داده میشود.
پارامترهای زیادی در قیمت اجاره ماهانه یک سرور تاثیرگذار است که میتوان به سرعت CPU، مقدار حافظه RAM و اندازه Hard Disk ، حداکثر ترافیکی که ماهانه در اختیار هر سرور قرار میگیرد، سیستم عامل سرور و همچنین سابقه مرکز دادهای بستگی دارد.
مشخصات یک Data Center
Data Centerهای متفاوتی در نقاط دنیا وجود دارد که با توجه به نیاز و همچنین شرایط منطقهای طراحی و ساخته شدهاند. استاندارد خاصی برای یک Data Center وجود ندارد اما در اینجا سعی شده است به برخی از مشخصات عمومی یک مرکز دادهای اشاره شود. در اختیار داشتن اتصالات مختلف به اینترنت از طریق ISP و ICPهای مختلف: به طور معمول یک Data Center برای اتصال به اینترنت از چندین اتصال مختلف استفاده میکند تا در صورتی که هر یک از اتصالات به دلیلی از کار افتادند، در سرویسدهی مرکز وقفهای پیش نیاید. برخی از Data Center معروف با بیش از 12 اتصال مختلف به اینترنت متصلند.
وجود سیستم قدرت پشتیبان:
یکی از مهمترین مسائل در Data Center سرویسدهی بدون وقفه به مشتریان میباشد. با توجه به امکان قطع برق به دلایل مختلف همچون حوادث غیرمترقبه یا جنگ، نیاز به سیستم برق پشتیبان ضروری است. معمولاً Data Centerهای بزرگ از UPS های مخصوصی استفاده میکنند که امکان سرویسدهی به بیش از 100 کامپیوتر را دارند. علاوه بر سیستم UPS، ژنراتورهای قوی نیز در مرکز دادهای وجود دارد تا در صورت قطع بلندمدت برق، سرویسدهی بدون وقفه انجام شود.
وجود سرورهای متعدد:
هدف اصلی یک Data Center در اختیار گذاشتن سرورهای وب برای مشتریان است. سرورهای مورد استفاده با توجه به نیاز و امکانات Data Center تعیین میشود. تنها تفاوت مهم، نوع سرورهای مورد استفاده توسط Data Center است. در Data Center ها از دو نوع سرور استفاده میشود: سرورهای Rackmount و یا سرورهای Desktop. با توجه به حجم کم سرورهای Rackmount این امکان برای مرکز دادهای فراهم میشود که در فضایی کوچک، تعداد زیادی سرور قرار گیرد. اما مسئله مهم در این نوع سرورها، قیمت بالای این سرورها نسبت به سرورهای Desktop است. علاوه بر این امکان ارتقاء سرورهای Rack Mount تنها به مقدار اندک امکانپذیر است. با توجه به این موضوع اکثر Data Center از سرورهای Desktop استفاده میکنند.
مشخصات فیزیکی:
با توجه به این نکته که اکثر سرورهای وب از نوع Desktop هستند، ساختمانهای مراکز دادهای اکثرا با سقفهای بلند ساخته میشوند که علاوه بر تهویه هوا، امکان قرار دادن سرورهای بیشتر را میدهند. همچنین در تمامی Data Centerها، مسیرهایی برای گذراندن کابلهای شبکه و همچنین کابلهای برق وجود دارد. علاوه بر اینها، وجود سیستم تهویه قوی برای پایین نگاه داشتن دمای سرورها ضروری میباشد. البته مشخصاتی همچون وجود سقف کاذب، کف کاذب و همچنین سیستم اطفاء حریق در برخی موارد توصیه شده است.
مسئله مهم در Data Centerها، امکان استفاده متقاضیان از سرورهای Data Center میباشد که در این بخش به آن میپردازیم.
فرمت فایل : word(قابل ویرایش)
تعداد صفحات:15
چکیده:
Center چیست؟
Data Center ها با در اختیار داشتن اتصالات پرسرعت ای به اینترنت، و همچنین در اختیار داشتن سرورهای قوی و متعدد، امکان راهاندازی سرورهای وب را برای عموم مردم ممکن ساختند. شرکتهای تجاری و مردم میتوانستند با اجاره کردن فضای محدودی در این سرورها، سایتهای وب خود را معرض دید عموم قرار دهند.
تا قبل از دهه 90 استفاده از اینترنت برای مردم عادی به سادگی امکانپذیر نبود، چرا که استفاده از امکانات اینترنت نیاز به دانش خاصی داشت. محیط خط فرمانی(Command Line) و ساختار غیر گرافیکی اینترنت سبب شده بود که کاربران عادی علاقه چندانی به استفاده از اینترنت نداشته باشند.
در اوایل دهه 90، پس از به وجود آمدن مفهوم وب در اینترنت (سال 1993 ) و پروتکل HTTP که به سادگی امکان به اشتراک گذاشتن مستندات در اینترنت را در اختیار کاربران قرار میداد، روز به روز بر تعداد کاربران اینترنت افزوده شد. از سوی دیگر با اضافه شدن کاربران اینترنت، حجم مستندات نیز روز به روز افزایش یافت. مسلماً خطوط سابق اینترنتی و سرورهای موجود، توانایی جوابگویی به خیل عظیم کاربران را نداشتند.
همچنین با زیاد شدن کاربران و بالا رفتن حجم مستندات، و نیز سادگی انتشار اطلاعات در اینترنت، مفاهیم تجاری نیز وارد عرصه اینترنت شدند. شرکتهای تجاری نیاز به سرورهایی داشتند که این امکان را به آنها بدهد که به سادگی و با سرعت بتوانند اطلاعات خود را در اختیار مشتریان و کاربران خود قرار دهند.
بالطبع این امکان وجود نداشت که هر شرکت یا سازمانی که قصد راهاندازی سایتهای اینترنتی را دارد، خود راساً اقدام به راهاندازی سرور خود کند، چرا که با وجود کاربران زیاد این سایتها و حجم بالای ترافیک، نیاز به اتصالهایی با سرعتهای بسیار بالا وجود داشت که مسلما حتی در صورتی که این امکان از لحاظ عملی وجود داشته باشد، هزینه بالایی را میطلبید.
راهحلی که برای این مشکل به نظر رسید، راهاندازی مراکز خاصی تحت عنوان Data Center یا مراکز دادهای بود. Data Center ها با در اختیار داشتن اتصالات پرسرعت ای به اینترنت، و همچنین در اختیار داشتن سرورهای قوی و متعدد، امکان راهاندازی سرورهای وب را برای عموم مردم ممکن ساختند.
شرکتهای تجاری و مردم میتوانستند با اجاره کردن فضای محدودی در این سرورها، سایتهای وب خود را معرض دید عموم قرار دهند. برخی شرکتهای بزرگ نیز با توجه به نیاز خود، اقدام به اجاره کردن یک سرور در مرکز دادهای میکردند و آن را از راه دور با ابزارهای خاص کنترل میکردند.
اکنون با توجه به رشد سریع اینترنت، روز به روز به تعداد Data Center ها اضافه میشود به طوری که در حال حاضر در اکثر کشورهای پیشرفته این مراکز وجود دارند. تمرکز این مراکز بخصوص در کشور امریکا بسیار زیاد است. دلیل آن ارزان بودن نرخ اتصال به اینترنت و همچنین در دسترس بودن سرعتهای بالا میباشد.
برخی از این Data Center از طریق خطوط مختلف فیبرنوری، پهنای باندی بیش از 4Gbps را در اختیار دارند و تعداد سرورهای این Data Center معمولا بیش از 1000 است که بر اساس مشخصات به متقاضیان اجاره داده میشود.
پارامترهای زیادی در قیمت اجاره ماهانه یک سرور تاثیرگذار است که میتوان به سرعت CPU، مقدار حافظه RAM و اندازه Hard Disk ، حداکثر ترافیکی که ماهانه در اختیار هر سرور قرار میگیرد، سیستم عامل سرور و همچنین سابقه مرکز دادهای بستگی دارد.
مشخصات یک Data Center
Data Centerهای متفاوتی در نقاط دنیا وجود دارد که با توجه به نیاز و همچنین شرایط منطقهای طراحی و ساخته شدهاند. استاندارد خاصی برای یک Data Center وجود ندارد اما در اینجا سعی شده است به برخی از مشخصات عمومی یک مرکز دادهای اشاره شود. در اختیار داشتن اتصالات مختلف به اینترنت از طریق ISP و ICPهای مختلف: به طور معمول یک Data Center برای اتصال به اینترنت از چندین اتصال مختلف استفاده میکند تا در صورتی که هر یک از اتصالات به دلیلی از کار افتادند، در سرویسدهی مرکز وقفهای پیش نیاید. برخی از Data Center معروف با بیش از 12 اتصال مختلف به اینترنت متصلند.
وجود سیستم قدرت پشتیبان:
یکی از مهمترین مسائل در Data Center سرویسدهی بدون وقفه به مشتریان میباشد. با توجه به امکان قطع برق به دلایل مختلف همچون حوادث غیرمترقبه یا جنگ، نیاز به سیستم برق پشتیبان ضروری است. معمولاً Data Centerهای بزرگ از UPS های مخصوصی استفاده میکنند که امکان سرویسدهی به بیش از 100 کامپیوتر را دارند. علاوه بر سیستم UPS، ژنراتورهای قوی نیز در مرکز دادهای وجود دارد تا در صورت قطع بلندمدت برق، سرویسدهی بدون وقفه انجام شود.
وجود سرورهای متعدد:
هدف اصلی یک Data Center در اختیار گذاشتن سرورهای وب برای مشتریان است. سرورهای مورد استفاده با توجه به نیاز و امکانات Data Center تعیین میشود. تنها تفاوت مهم، نوع سرورهای مورد استفاده توسط Data Center است. در Data Center ها از دو نوع سرور استفاده میشود: سرورهای Rackmount و یا سرورهای Desktop. با توجه به حجم کم سرورهای Rackmount این امکان برای مرکز دادهای فراهم میشود که در فضایی کوچک، تعداد زیادی سرور قرار گیرد. اما مسئله مهم در این نوع سرورها، قیمت بالای این سرورها نسبت به سرورهای Desktop است. علاوه بر این امکان ارتقاء سرورهای Rack Mount تنها به مقدار اندک امکانپذیر است. با توجه به این موضوع اکثر Data Center از سرورهای Desktop استفاده میکنند.
مشخصات فیزیکی:
با توجه به این نکته که اکثر سرورهای وب از نوع Desktop هستند، ساختمانهای مراکز دادهای اکثرا با سقفهای بلند ساخته میشوند که علاوه بر تهویه هوا، امکان قرار دادن سرورهای بیشتر را میدهند. همچنین در تمامی Data Centerها، مسیرهایی برای گذراندن کابلهای شبکه و همچنین کابلهای برق وجود دارد. علاوه بر اینها، وجود سیستم تهویه قوی برای پایین نگاه داشتن دمای سرورها ضروری میباشد. البته مشخصاتی همچون وجود سقف کاذب، کف کاذب و همچنین سیستم اطفاء حریق در برخی موارد توصیه شده است.
مسئله مهم در Data Centerها، امکان استفاده متقاضیان از سرورهای Data Center میباشد که در این بخش به آن میپردازیم.
نحوه در اختیار گرفتن یک سرور وب:
پس از اینکه متقاضی سرور، با شرایط قراردادی که Data Center مفاد آن را تنظیم کرده موافقت کرد، یک سرور در اختیار وی گذاشته میشود. بسته به نوع قرارداد سرور میتواند تنها شامل سیستم عامل و یا نرمافزارهای کمکی همچون نرمافزارهای FTP و یا Control Panel سایت باشد. در صورتی که این نرمافزارها بر روی سرور نصب نشده باشد، متقاضی خود باید این نرمافزارها را نصب کند. متقاضی اکثرا از طریق Remote terminalها و یا نرمافزارهای خاصی مانند PCAnywere سرور خود را از راه دور کنترل میکند. پس از نصب و تنظیمات نرمافزاری، سرور آماده سرویسدهی میشود و بر حسب نیاز متقاضی استفاده میشود.
نکته قابل توجه، کنترل سرورها توسط متقاضی از راه دور است. با توجه به این موضوع مسئولیت کلیه مسائل و مشکلات سرور از جمله از کار افتادن سرویسها و نرمافزارها و یا حملات هکری به عهده متقاضی میباشد.
البته در شرایط خاص و پرداخت مبالغ معین متقاضی میتواند از خدمات Data Center استفاده کند.
هرچند در شرایط بحرانی همچون حملات گسترده که منجر به از کار افتادن تمامی سرورها شود، معمولا Data Center برای سرویسدهی به تمامی سرورها به مشکل برخورد میکنند که در این صورت طبق اولویتهای خود اقدام به رفع مشکل میکنند.
آیا امکان راهاندازی چنین مرکزی در ایران وجود دارد؟ این سوالی است که در بخش بعد به آن میپردازم.
ضرورت راهاندازی Data Center در ایران
شرکتهای ایرانی از روشهای متفاوتی برای راهاندازی سایتهای خود استفاده میکنند. برخی از امکانات ISP های داخلی استفاده میکنند. این روش علیرغم این که امکان پشتیبانی مناسبی را برای مدیر سایت فراهم میکند، اما از سوی دیگر به دلیل پایین بودن پهنای باند ISP های ایرانی و همچنین نامتقارن بودن اتصالات (پایینتر بودن پهنای باند ارسال نسبت به دریافت) و همچنین بالا بودن ترافیک در برخی ساعات خاص، عملا باعث کندشدن سایت میشود.
روش دیگر، استفاده از امکانات شرکتهای خارجی است که به روشهای مختلفی انجام میپذیرد، این روشها علاوه بر بالا بردن هزینهها، مشکلات خاصی را برای سایتهای ایرانی به وجود آورده است که از مهمترین آنها می توان به مسائل امنیتی اشاره کرد که برای مدتی بزرگترین دغدغه مدیران سایتهای ایرانی بود.
همه راهحلهایی که برای راهاندازی سایتهای ایرانی مورد بررسی قرار گرفت، دارای مشکلاتی بودند. البته مشکلاتی که در فصل قبل به آنها پرداختم، تنها مربوط به کاربران ایرانی این سرویسها بود ولی راهحلهای قبلی هزینههایی را هم به شرکت مخابرات به عنوان بزرگترین ارائه دهنده خدمات اینترنت در ایران وارد میکند که در بخشهای بعد به آن اشاره میشود.
مزایای راهاندازی Data Center در ایران
پایین آمدن ترافیک Gatewayهای شرکت مخابرات:
در حال حاضر بیش از 30 سرور در کشورهای غربی (اکثرا کانادا ، امریکا و انگلیس) در اجاره شرکتهای ایرانی قرار دارد. ترافیک ماهانه هر سرور به طور متوسط 400GB میباشد که در مجموع بیش از 12000GB ترافیک به gateway های شبکه Data کشور وارد میکند. با توجه به این که اکثر بازدیدکنندگان این سایتها ایرانی هستند، در حقیقت کاربر ایرانی، برای بازدید سایت ایرانی، علاوه بر این که باعث بالا رفتن ترافیک در gatewayهای شرکت مخابرات میشود، خود نیز متوسط زمان بیشتری را باید منتظر بماند.
فرمت فایل : word(قابل ویرایش)
تعداد صفحات:180
فهرست مطالب:
عنوان صفحه
مقدمه
چکیده
فصل اول : سیر تحول سیستمهای پشتیبان تصمیم
1-1 مقدمه : سیر تحول………………………………………………………………………………………………….1
……………………………………………………………………………………………………..2DASD1-2 ظهور
1-3 تکنولوژی زبانهای نسل چهارم و کامپیوتر های شخصی ……………………………………………..3
1-4 سیستم استخراج ……………………………………………………………………………………………………3
1-5 یک تغییر در بحث ………………………………………………………………………………………………..14
1-6 سیستمهای عملیاتی در مقابل سیستمهای پشتیبان تصمیم ……………………………………………20
1-7 انبار داده تعریف شده ……………………………………………………………………………………………22
فصل دوم : معماری انبار داده
2-1 مقدمه …………………………………………………………………………………………………………………25
2-2 خصوصیات تعریف انبارداده ………………………………………………………………………………….25
2-3 مروری بر لایه های مختلف انبارداده ………………………………………………………………………31
2-4 معماری در سه ناحیه اصلی …………………………………………………………………………………..46
2-5 معماری انبار داده و پیاده سازی گزینه منتخب ………………………………………………………….58
2-6 از نیازمندیها تا طراحی داده ……………………………………………………………………………………63
………………………………………………………………………………………81 SNOWFLAK 2-7 شمای
فصل سوم : معرفی تکنولوژیهای موجود برای طراحی و ساخت انبارداده
3-1 مقدمه …………………………………………………………………………………………………………………85
3-2 مروری بر استخراج در انبارداده ……………………………………………………………………………..85
3-3 مروری بر عمل انتقال در انبارهای داده …………………………………………………………………..89
3-4 مروری بر بارگذاری و تغییر شکل داده در انبار داده …………………………………………………91
…………………………………………………………97(Replication) 3-5 مروری بر کپی سازی داده
فصل چهارم : پیاده سازی یک انبارداده آزمایشی
4-1 مقدمه ………………………………………………………………………………………………………………108
4-2 مدل بانک اطلاعاتی حقوق و دستمزد …………………………………………………………………..109
4-3 پیاده سازی پیکربندی محیط طراحی شده ……………………………………………………………..116
4-4 تجمیع اطلاعات دریک شما ………………………………………………………………………………..147
فصل پنجم : نتیجه گیری و پیشنهاد
5-1 مقدمه ………………………………………………………………………………………………………………166
………………………………………….166Oracle 9i Warehouse Builder5-2 مرورری بر ابزار
…………………………………………………168Oracle Warehouse Builder5-3 راهکار مجتمع
5-4 تعریف اشیاء ……………………………………………………………………………………………………..169
5-5 نگاشتها …………………………………………………………………………………………………………….177
فهرست شکل ها
عنوان صفحه
شکل 1-.1……………………………………………………………………………………………………………………..2
شکل 1-2………………………………………………………………………………………………………………………4
شکل 1-3………………………………………………………………………………………………………………………6
شکل 1-4………………………………………………………………………………………………………………………7
شکل 1-5………………………………………………………………………………………………………………………9
شکل 1-6…………………………………………………………………………………………………………………….11
شکل 1-7…………………………………………………………………………………………………………………….13
شکل 1-8…………………………………………………………………………………………………………………….15
شکل 1-9…………………………………………………………………………………………………………………….17
شکل 1-10………………………………………………………………………………………………………………….19
شکل 2-1……………………………………………………………………………………………………………………27
شکل 2-2……………………………………………………………………………………………………………………28
شکل 2-3……………………………………………………………………………………………………………………32
شکل 2-4……………………………………………………………………………………………………………………33
شکل 2-5……………………………………………………………………………………………………………………41
شکل 2-6……………………………………………………………………………………………………………………43
شکل 2-7……………………………………………………………………………………………………………………46
شکل 2-8……………………………………………………………………………………………………………………49
شکل 2-9……………………………………………………………………………………………………………………54
شکل 2-10………………………………………………………………………………………………………………….56
شکل 2-11…………………………………………………………………………………………………………………60
شکل 2-12…………………………………………………………………………………………………………………61
شکل 2-13…………………………………………………………………………………………………………………64
شکل 2-14…………………………………………………………………………………………………………………66
شکل 2-15…………………………………………………………………………………………………………………68
شکل 2-16…………………………………………………………………………………………………………………70
شکل 2-17…………………………………………………………………………………………………………………71
شکل 2-18 ………………………………………………………………………………………………………………..74
شکل 2-19…………………………………………………………………………………………………………………81
شکل 2-20…………………………………………………………………………………………………………………83
شکل 3-1……………………………………………………………………………………………………………………94
شکل 3-2…………………………………………………………………………………………………………………..102
شکل 3-3………………………………………………………………………………………………………………….104
شکل 3-4………………………………………………………………………………………………………………….107
شکل 4-1………………………………………………………………………………………………………………….109
شکل 4-2………………………………………………………………………………………………………………….109
شکل 4-3………………………………………………………………………………………………………………….112
شکل 4-4………………………………………………………………………………………………………………….114
شکل 4-5………………………………………………………………………………………………………………….115
شکل 4-6………………………………………………………………………………………………………………….117
شکل 4-7………………………………………………………………………………………………………………….117
شکل 4-8………………………………………………………………………………………………………………….118
شکل 4-9………………………………………………………………………………………………………………….118
شکل 4-10……………………………………………………………………………………………………………….119
شکل 4-11……………………………………………………………………………………………………………….120
شکل 4-12……………………………………………………………………………………………………………….120
شکل 4-13……………………………………………………………………………………………………………….121
شکل 4-14……………………………………………………………………………………………………………….122
شکل 4-15……………………………………………………………………………………………………………….122
شکل 4-16……………………………………………………………………………………………………………….123
شکل 4-17……………………………………………………………………………………………………………….123
شکل 4-18……………………………………………………………………………………………………………….124
شکل 4-19……………………………………………………………………………………………………………….125
شکل 4-20……………………………………………………………………………………………………………….126
شکل 4-21……………………………………………………………………………………………………………….127
شکل 4-22……………………………………………………………………………………………………………….128
شکل 4-23……………………………………………………………………………………………………………….128
شکل 4-24……………………………………………………………………………………………………………….129
شکل 4-25……………………………………………………………………………………………………………….130
شکل 4-26……………………………………………………………………………………………………………….128
شکل 4-27……………………………………………………………………………………………………………….131
شکل 4-28……………………………………………………………………………………………………………….131
شکل 4-29……………………………………………………………………………………………………………….132
شکل 4-30……………………………………………………………………………………………………………….132
شکل 4-31……………………………………………………………………………………………………………….133
شکل 4-32……………………………………………………………………………………………………………….134
شکل 4-33……………………………………………………………………………………………………………….135
شکل 4-34……………………………………………………………………………………………………………….136
شکل 4-35……………………………………………………………………………………………………………….137
شکل 4-36……………………………………………………………………………………………………………….138
شکل 4-37……………………………………………………………………………………………………………….139
شکل 4-38……………………………………………………………………………………………………………….140
شکل 4-39……………………………………………………………………………………………………………….140
شکل 4-40……………………………………………………………………………………………………………….141
شکل 4-41……………………………………………………………………………………………………………….142
شکل 4-42……………………………………………………………………………………………………………….143
شکل 4-43……………………………………………………………………………………………………………….144
شکل 4-44……………………………………………………………………………………………………………….145
شکل 4-45……………………………………………………………………………………………………………….146
شکل 4-46……………………………………………………………………………………………………………….147
شکل 4-47……………………………………………………………………………………………………………….148
شکل 4-48……………………………………………………………………………………………………………….148
شکل 4-49……………………………………………………………………………………………………………….149
شکل 4-50……………………………………………………………………………………………………………….150
شکل 4-51……………………………………………………………………………………………………………….151
شکل 4-52……………………………………………………………………………………………………………….152
شکل 4-53……………………………………………………………………………………………………………….153
شکل 4-54……………………………………………………………………………………………………………….154
شکل 4-55……………………………………………………………………………………………………………….155
شکل 4-56……………………………………………………………………………………………………………….156
شکل 4-57……………………………………………………………………………………………………………….156
شکل 4-58……………………………………………………………………………………………………………….157
شکل 4-59……………………………………………………………………………………………………………….158
شکل 4-60……………………………………………………………………………………………………………….159
شکل 4-61……………………………………………………………………………………………………………….159
شکل 4-62……………………………………………………………………………………………………………….160
شکل 4-63……………………………………………………………………………………………………………….161
شکل 4-64……………………………………………………………………………………………………………….161
شکل 4-65……………………………………………………………………………………………………………….162
شکل 4-66……………………………………………………………………………………………………………….162
شکل 4-67……………………………………………………………………………………………………………….163
شکل 4-68……………………………………………………………………………………………………………….163
شکل 4-69……………………………………………………………………………………………………………….164
شکل 4-70……………………………………………………………………………………………………………….165
شکل 4-71……………………………………………………………………………………………………………….165
شکل 5-1…………………………………………………………………………………………………………………170
شکل 5-2…………………………………………………………………………………………………………………171
شکل 5-3…………………………………………………………………………………………………………………173
شکل 5-4…………………………………………………………………………………………………………………173
شکل 5-5…………………………………………………………………………………………………………………174
شکل 5-6…………………………………………………………………………………………………………………175
شکل 5-7…………………………………………………………………………………………………………………175
شکل 5-8…………………………………………………………………………………………………………………176
شکل 5-9…………………………………………………………………………………………………………………177
شکل 5-10………………………………………………………………………………………………………………177
شکل 5-11………………………………………………………………………………………………………………178
فهرست جدول ها
عنوان صفحه
جدول 4-1………………………………………………………………………………………………………………….110
جدول 4-2………………………………………………………………………………………………………………….112
جدول 5-1………………………………………………………………………………………………………………….172
جدول 5-2………………………………………………………………………………………………………………….178
انبار داده (Data Warehouse)یک سیستم تحویل اطلاعات است که در آن، داده اولیه جهت اتخاذ تصمیمات استراتژیک به اطلاعات قابل استفاده تبدیل می شود. کلیه اطلاعات برمبنای تاریخ آنها از سیستمهای عملیاتی مختلف دریافت شده، و این اطلاعات با اطلاعات مربوط به آن از منابع خارجی دیگر ترکیب می شوند. این اطلاعات جمع آوری شده به صورت کارآمدی به منظور ایجاد اطلاعات مختلف برای کلاسهای متفاوت کاربران تغییر شکل داده می شودو در نهایت روشهای تحویل داده پیاده سازی می شود. آقای بیل اینمون که پدرانبار داده نامیده شده ، تعریف زیر را برای آن ارائه می کند:
«انبار داده، مجموعه داده موضوع گرا، یکپارچه، غیر فرار و زمان دار است که به منظور پاسخگویی به پرسجوهای تحلیلی و آماری در جهت اتخاذ تصمیمات مدیریتی جمع آوری می شوند.»
با این توصیف انبار داده، بستر اصلی ایجاد یک محیط برای سیستمهای پشتیبان تصمیم (DSS) ها می باشدکه در عصر خاصر از اهمیت خاصی دردنیا برخوردار است. اگر چه در کشور فعالیتهای مؤثری در زمینه ایجاد اینگونه سیستمها انجام گرفته است، اما هنوز بستر فرهنگی مناسبی درزمینه فعالیتهای درراستای هوشمندی تجاری(Business Intelligence) وجود ندارد.امید است انجام چنین فعالیتهای تحقیقاتی به پیشبرد این روند کمک شایان ذکری نماید.
به منظور ایجاد یک بستر مناسب جهت تحویل اطلاعات به سیستم پشتیبان تصمیم (DSS) ، انبارداده ایجاد می شود . بانک اطلاعاتی نمونه که جهت ایجاد انبارداده آزمایشی انتخاب شده ، بانک اطلاعاتی سیستم حقوق و دستمزد یک شرکت دارای سه شعبه در سه نقطه مکانی مختلف می باشد که روی یک Station شبیه سازی شده است.
برای ایجاد محیط مورد نظرمی بایست براساس چند محور مورد نظر طراح اطلاعات از منابع مختلف جمع آوری شده و براساس ساختار جدید در محیط مقصد که همان انبار داده می باشد بارگذاری شود، از میان ساختار های داده بررسی شده ساختار Star Schema پیاده سازی شد و از میان روشهای انتقال اطلاعات روشهای مختلف Replication مورد بررسی قرار گرفته و یکی از این روشها با عنوان روش ترکیبی (Hybrid) برای پیاده سازی انتخاب شد.
در نهایت سیستمی ایجاد شد که قادر به پاسخگویی درخواستهای درنظر گرفته شده براساس محورهای ازقبل تعیین شده می باشد.البته لازم به ذکر است که کلیه مراحل تولید انبارداده می توانست از طریق ابزارهای تولید موجود استفاده شود که به عنوان پیشنهاد در فصل پنجم به بررسی یکی از این ابزارهای قدرتمند با نام Oracle Data warehouse Builder پرداخته شده است.
منشاء اصلی پردازش DSS به روزهای خیلی دور در تاریخ سیستمهای کامپیوتری و اطلاعاتی بر میگردد. جالب است بدانیم که سیستمهای پشتیبان تصمیم دارای قدمت طولانی وپیچیده در تکنولوژی اطلاعاتی است.و سیر تحول آن تا به امروز ادامه داشته است .]۳[
شکل ۱-۱ سیر تحول پردازش اطلاعات از ۱۹۶۰ تا ۱۹۸۰ را نشان میدهد.
درحدود دهه۱۹۶۰ جهان کامپیوتر موفق بهایجاد نرم افزارهایی شد که با استفاده از فایلهای Master اجرا میشدند.این نرم افزارها در قالب برنامه ها و گزارشاتی بودند، که معمولاٌ به زبان COBOL نوشته میشد. پانچ کارتها یک ابزار ذخیر سازی عمومی به حساب میآمدند. فایلهای Master توسط نوارهای مغناطیسیی نگهداری میشدند که برای ذخیره سازی ارزان قیمت حجم زیادی از داده مناسب بودند، اما بخاطراینکه دسترسی به اطلاعات میبایست به صورت متوالی باشداین روش زیاد مفید نبود. در یک گذار در فایل نوار مغناطیسی که از۱۰۰% رکوردها عبور میشود، عموما فقط ۵ درصد ازاین رکوردها یا حتی کمتر مورد نظر بودند. بعلاوه بسته به داده درون فایل و پردازشی که باید روی آن انجام میشد، دسترسی به فایل نوار ورودی بیشتر از ۲۰ تا ۳۰ دقیقه به طول میانجامید.]۳[
در اواسط دهه ۱۹۶۰، به طور گستردهای رشد استفاده از فایلهای Master و نوار مغناطیسی افزایش یافتند و در پی آن مقادیر هنگفتی داده افزونه نیز به وجود آمد. ازدیاد فایل Master و داده افزونه منجر به بروز چندین مشکل شد:]۳[
- نیاز به داده همزمان به محض عمل به روز رسانی
- پیچیدگی نگهداری برنامه ها
- پیچیدگیایجاد برنامههای جدید
- نیاز به سخت افزار گران برای پشتیبانی کلیه فایلهای Master
جالب است که اگر فقط ابزار ذخیره سازی داده، نوار مغناطیسی باشد، جهان پردازش اطلاعات شاهد هیچ پیشرفتی نبود، . اگر هرگز چیزی برای ذخیره داده حجیم به وجود نمی آمد، سیستمهای سریع و خیلی بزرگ درجهان ظاهر نمیشد، ونیز هرگز سیستمهای ATM و شبیه آن به وجود نمیآمد. حقیقتا، اگر قابلیت ذخیره سازی و مدیریت داده در انواع جدید ابزارهای ذخیره سازی وجود نداشت، هرگز بستر لازم برای همکاری تکنسینها و تجار با هم به وجود نمی آمد.]۳[
در ۱۹۷۰ تقریبا هر روز یک تکنولوژی جدید برای ذخیره سازی و دسترسی داده به وجود میآمد.در دهه ۱۹۷۰ زمان تحول وسیله ذخیره سازی دستیابی مستقیم (DASD )بود. دیسک ذخیره سازی اصولا با نوار مغناطیسی از نظر قابلیت دسترسی مستقیم تفاوت داشت. ونیازی نبود که رکوردها ۱,۲,…,n تا n+1 رکورد مرور شود.]۳[
آدرس رکورد n+1 ام شناخته شده بود، موضوع سادهای بود که بفهمیم رکورد n+1 ام دقیقا در کجای دیسک قرار دارد. ازاین گذشته، زمان مورد نیاز برای دسترسی به رکورد n+1 ام، کمتر از زمان مورد نیاز برای مرور یک نوار بود. در حقیقت زمان مورد نیاز برای قرار دادن یک رکورد در DASD فقط به اندازه چند میلی ثانیه بود.]۳[
به همراه DASD نوع جدیدی از نرم افزارها تولید شد که به عنوان یک سیستم مدیریت
بانک اطلاعاتی مطرح گردید. هدف از ساخت DBMS بدین منظور بود که برای برنامه نویسان ذخیره سازی و دستیابی داده در محیطDASD آسان گردد.به علاوهاین ابزار، عملیات مختلفی را برای ذخیره سازی داده در DASD، از جمله فهرست گذاری داده و غیره راانجام میداد. از طریق DASD وDBMSیک راه حل تکنیکی برای حل مشکلات فایلهای Master پد
فرمت:word(قابل ویرایش)
تعداد صفحات:91
پروژه پایانی کارشناسی ناپیوسته کامپیوتر- نرم افزار
چکیده:
در دو دهه قبل تواناییهای فنی بشر برای تولید و جمعآوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسبوکار، علوم، خدمات دولتی و پیشرفت در وسائل جمعآوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهوارهای، در این تغییرات نقش مهمی دارند.
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژیهای جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. دادهکاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی دادهکاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی میکنند، که این دانش به صورت ضمنی در پایگاه دادههای عظیم، انبارهداده[1] و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.
به لحاظ اینکه در چند سال اخیر مبحث دادهکاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرمافزارهای آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.
در این مقاله درفصل مروری بر دادهکاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه دادهها را ذکر کردیم که دادهکاوی یکی از مراحل آن است.
در فصل 2 یکی از شیوههای دادهکاوی که از سبد خرید گرفته شده است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دستهبندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح میدهیم و در آخر آن دو را با هم مقایسه میکنیم .
در فصل 3 مباحث وبکاوی و متنکاوی را که در بسیاری از مراجع جزء کاربردهای دادهکاوی به حساب میآید شرح داده خواهد شد.
فهرست مطالب:
عنوان صفحه
فهرست اشکال …………………………………………………………………………………………………………………………….. 10
فهرست جداول ……………………………………………………………………………………………………………………………. 11
فصل1: مقدمهای بر دادهکاوی …………………………………………………………………. 13
1-1 تعریف دادهکاوی ………………………………………………………………………………………………………………….. 15
2-1 تاریخچه دادهکاوی ……………………………………………………………………………………………………………….. 16
3-1 چه چیزی سبب پیدایش دادهکاوی شده است؟ ……………………………………………………………………………. 17
4-1 اجزای سیستم دادهکاوی …………………………………………………………………………………………………………. 19
5-1 جایگاه دادهکاوی در میان علوم مختلف …………………………………………………………………………………….. 21
6-1 قابلیتهای دادهکاوی ………………………………………………………………………………………………………………… 22
7-1 چرا به دادهکاوی نیاز داریم؟ ……………………………………………………………………………………………………. 23
8-1 دادهکاوی چه کارهایی نمیتواند انجام دهد؟ ……………………………………………………………………………… 25
9-1 کاربردهای دادهکاوی …………………………………………………………………………………………………………….. 25
1-9-1 کاربردهای پیشبینیکننده ……………………………………………………………………………………… 27
2-9-1 کاربردهای توصیفکننده ………………………………………………………………………………………. 27
10-1 ابزارهای تجاری دادهکاوی ……………………………………………………………………………………………………. 28
11-1 دادهکاوی و انباردادهها …………………………………………………………………………………………………………. 29
1-11-1 تعاریف انبارداده …………………………………………………………………………………………………. 29
2-11-1 چهار خصوصیت اصلی انبارداده …………………………………………………………………………….. 30
3-11-1 موارد تفاوت انبارداده و پایگاه داده ………………………………………………………………………… 31
12-1 دادهکاوی و OLAP …………………………………………………………………………………………………………… 33
1-12-1 OLAP …………………………………………………………………………………………………………… 33
2-12-1 انواع OLAP ……………………………………………………………………………………………………. 34
13-1 مراحل فرایند کشف دانش از پایگاه دادهها ………………………………………………………………………………. 34
1-13-1 انبارش دادهها …………………………………………………………………………………………………….. 35
2-13-1 انتخاب دادهها …………………………………………………………………………………………………….. 36
3-13-1 پاکسازی- پیشپردازش- آمادهسازی …………………………………………………………………….. 36
4-13-1 تبدیل دادهها ………………………………………………………………………………………………………. 36
5-13-1 کاوش در دادهها (Data Mining) ……………………………………………………………………… 37
6-13-1 تفسیر نتیجه ………………………………………………………………………………………………………… 38
فصل 2: قوانین ارتباطی ………………………………………………………………… 39
1-2 قوانین ارتباطی ………………………………………………………………………………………………………………………. 40
2-2 اصول پایه …………………………………………………………………………………………………………………………….. 41
1-2-2 شرح مشکل جدی ………………………………………………………………………………………………… 41
2-2-2 پیمایش فضای جستجو …………………………………………………………………………………………… 43
3-2-2 مشخص کردن درجه حمایت مجموعه اقلام ………………………………………………………………. 45
3-2 الگوریتمهای عمومی ……………………………………………………………………………………………………………… 45
1-3-2 دستهبندی ……………………………………………………………………………………………………………. 45
2-3-2 BFS و شمارش رویدادها ……………………………………………………………………………………… 46
3-3-2 BFS و دونیمسازی TID-list ………………………………………………………………………………. 47
4-3-2 DFS و شمارش رویداد ………………………………………………………………………………………… 47
5-3-2 DFS و دو نیمسازی TID-list ……………………………………………………………………………… 48
4-2 الگوریتم Apriori ……………………………………………………………………………………………………………….. 48
1-4-2 مفاهیم کلیدی ……………………………………………………………………………………………………… 48
2-4-2 پیادهسازی الگوریتم Apriori ……………………………………………………………………………….. 49
3-4-2 معایب Apriori و رفع آنها ……………………………………………………………………………………. 54
5-2 الگوریتم رشد الگوی تکرارشونده ……………………………………………………………………………………………. 55
1-5-2 چرا رشد الگوی تکرار سریع است؟ …………………………………………………………………………. 58
6-2 مقایسه دو الگوریتم Apriori و FP-growth ………………………………………………………………………….. 59
7-2 تحلیل ارتباطات …………………………………………………………………………………………………………………….. 63
فصل 3: وبکاوی و متنکاوی ……………………………………………………….. 65
1-3 وبکاوی …………………………………………………………………………………………………………………………….. 66
1-1-3 الگوریتمهای هیتس و لاگسام ………………………………………………………………………………….. 69
2-1-3 کاوش الگوهای پیمایش مسیر …………………………………………………………………………………. 76
2-3 متنکاوی …………………………………………………………………………………………………………………………….. 80
1-2-3 کاربردهای متنکاوی …………………………………………………………………………………………….. 82
1-1-2-3 جستجو و بازیابی …………………………………………………………………………………. 83
2-1-2-3 گروهبندی و طبقهبندی ………………………………………………………………………….. 83
3-1-2-3 خلاصهسازی ………………………………………………………………………………………. 84
4-1-2-3 روابط میان مفاهیم ………………………………………………………………………………… 84
5-1-2-3 یافتن و تحلیل گرایشات ………………………………………………………………………… 84
6-1-2-3 برچسب زدن نحوی (pos) ……………………………………………………………………. 85
7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک ………………………………….. 85
2-2-3 فرایند متنکاوی ……………………………………………………………………………………………………. 86
3-2-3 روشهای متنکاوی ………………………………………………………………………………………………… 87
مراجع ……………………………………………………………………………………….. 89
فهرست اشکال:
عنوان صفحه
1-1 مراحل فرایند کشف دانش ………………………………………………………………………………………………………. 17
2-1 سیر تکاملی صنعت پایگاه داده …………………………………………………………………………………………………. 19
3-1 معماری یک نمونه سیستم دادهکاوی …………………………………………………………………………………………. 20
4-1 نرخ رشد اطلاعات ………………………………………………………………………………………………………………… 24
5-1 کاربرد پیشبینی کننده ……………………………………………………………………………………………………………. 27
6-1 دادهها از انباردادهها استخراج میگردند …………………………………………………………………………………….. 32
7-1 دادهها از از چند پایگاه داده استخراج میگردند ………………………………………………………………………….. 32
1-2 شبکهای برای ………………………………………………………………………………………………….. 43
2-2 درخت ………………………………………………………………………………………………………….. 44
3-2 دستهبندی الگوریتمها ……………………………………………………………………………………………………………… 46
4-2 پایان الگوریتم Apriori ………………………………………………………………………………………………………… 52
5-2 درخت الگوی تکرار ……………………………………………………………………………………………………………… 57
6-2 اندازهگیری کارکرد درجه حمایت برای پایگاه داده D1 40K …………………………………………………….. 61
7-2 اندازهگیری Apriori با درجه حمایت/تراکنش …………………………………………………………………………. 62
8-2 اندازهگیری FP-growth با درجه حمایت/تراکنش …………………………………………………………………… 62
1-3 مقداردهی اولیه الگوریتم HITS ……………………………………………………………………………………………… 72
2-3 مثالی از الگوهای پیمایش ……………………………………………………………………………………………………….. 80
3-3 فرایند متنکاوی ……………………………………………………………………………………………………………………. 86
4-3 مثال یافتن روابط ……………………………………………………………………………………………………………………. 88
فهرست جداول:
عنوان صفحه
1-2 کاوش FP-tree با ایجاد پایگاههای الگوشرطی …………………………………………………………………………. 58
2-2 پارامترها ………………………………………………………………………………………………………………………………. 59
3-2 نتایج برای فاکتور درجه حمایت 5% ………………………………………………………………………………………….. 60
4-2 نتایج برای D1 150K با درجه حمایت ……………………………………………………………………………………. 61
1-3 تراکنشهای توصیف شده توسط مجموعهای از URLها …………………………………………………………….. 75
2-3 نمایش URLها به عنوان بردارهایی از فعالیت گروه تراکنش ………………………………………………………… 75
3-3 یک SOM مرسوم که توسط توصیف URLها تولید شده است …………………………………………………… 76