بررسی سیستمهای چند عامله با استفاده از تئوری بازیها
129 صفحه در قالب word
فهرست مطالب
1- عامل و سیستمهای چند عامله. 4
1-3- حوزههای کاری هوش مصنوعی توزیع شده. 6
1-4- دلایل گرایش به هوش مصنوعی توزیع شده. 9
1-4-3- مزایای طراحی و پیادهسازی.. 12
1-4-6- همجوشی (کلاسهای جدید از مسائل). 14
1-5- مسائل مطرح در هوش مصنوعی توزیع شده. 14
1-6- تعریف عامل و عاملهای هوشمند.. 17
1-7- عامل به عنوان یک سیستم نرمافزاری.. 19
1-8- مفهوم عامل از دیدگاه عام. 20
1-9- مروری برخصوصیات عامل.. 20
1-10- ویژگیهای دیگر عاملها 25
1-13- تفاوتهای سیستم مبتنی بر عامل و سیستمهای خبره. 35
1-14-1- قابل دستیابی / غیر قابل دستیابی.. 36
1-14-2- محیط قطعی یا غیر قطعی.. 37
1-14-3- محیط مقطعی یا غیر مقطعی.. 38
1-14-5- محیط گسسته یا پیوسته. 38
1-16- خصوصیات سیستمهای چند عاملی: 46
1-17- دلایل استفاده از سیستمهای چندعامله. 47
1-17-1- نیاز برخی دامنهها به سیستمهای چندعامله: 47
1-17-2- افزایش سرعت عمل با موازی سازی.. 48
1-17-5- آسانتر شدن برنامهسازی.. 49
1-18- آزمون نظریههای سایر رشتههای علمی.. 49
1-19- معماریهای ارایه شده برای سیستمهای چندعامله. 49
1-20- سازماندهی سیستمهای چندعامله. 51
1-20-1- ساختار سلسله مراتبی.. 51
1-21- پارامترهای مطرح در ارزیابی سیستمهای چندعامله. 54
1-22- سیستمهای مقیاس وسیع(Large Scale systems): 55
1-23- کنترل غیر متمرکز : (Decentralized Control) 56
2- تئوری بازیها و کاربردهای آنها درسیستمهای چند عامله. 60
2-3- تفاوت میان تصمیمگیری و بازی.. 62
2-4- طبقهبندی نظریه بازیها 63
2-5- برخی مفاهیم و اصطلاحات... 68
2-6- موارد استفاده از نظریه بازیها 74
2-7- فرض های اساسی در نظریه بازیها 75
2-8- شاخههای اصلی نظریه بازیها 75
2-10- نمایش بازی در فرم استراتژیک یا نرمال.. 79
2-12- پیدا کردن جواب در بازیهای ایستا 82
2-16- بازی پویا در فرم بسط یافته. 85
2-22- پیدا کردن جواب در بازیهای پویا 91
3-1-4- مدل برگرفته شده از محیط.. 95
3-2- اجزای یادگیری تقویتی.. 97
3-6- فرآیند تصمیم گیری مارکوف... 101
3-7- روشهای حل فرآیندهای تصمیم گیری مارکوف... 103
3-10- فرایند تحلیل سلسله مراتبی (AHP) 106
3-11- ویژگیهای فرایند تحلیل سلسله مراتبی.. 106
3-12- ساختار سلسله مراتبی.. 107
3-13- اصول فرایند تحلیل سلسله مراتبی.. 108
3-15-1- روش حداقل مربعات ( least squares method ) 109
3-15-2- روش حداقل مربعات لگاریتمی (logarithmic least squares method) 110
3-15-3- روش بردار ویژه ( Eigenvector Method ): 111
3-15-4- روش های تقریبی(Approximation Method). 112
3-16- سازگاری سیستم و ماتریس سازگار. 112
3-17- محاسبه نرخ ناسازگاری.. 113
چکیده
در این رساله، روش مناسبی جهت محاسبه نقطه تعادل نش در الگوریتمهای یادگیری تقویتی چندعاملی با تعداد زیاد عاملها مطرح شدهاست، که قادراست با ادغام محاسبات مربوط به نقطه تعادل نش و ایجاد مصالحه بین اکتشاف- استخراج، محاسبات را به صورت بهینه کاهش دهند. ترکیب یادگیری تقویتی تک- عاملی و تئوری بازی ایده اصلی اکثر روشهای یادگیری چندعاملی است. این روشها سعی دارند تا کل فرآیند یادگیری را به تعدادی متناهی از حالتهای تصمیمگیری چندعاملی با خاصیت مارکوف تقسیم کرده و با انتخاب نقطه تعادل نش در هر کدام از این مراحل به تدبیر بهینه برای هر عامل همگرا شوند. بنابراین محاسبه نقطه تعادل نش مسئله مهمی است که در حال حاضر مشکلاتی شامل پیچیدگی محاسبات در روشهای شناخته شده محاسبه نقطه تعادل نش، چندگانگی نقطه تعادل نش، و مختلط بودن نقطه تعادل نش باعث شده که اکثر روشهای پیشنهادی یادگیری تقویتی چندعاملی جایگاه مناسبی در حل مسائل دنیای واقعی پیدا نکنند. ناگفته نماند که تقریباً تمام روشهای یادگیری تقویتی چندعاملی مطرح شده، مبتنی بر روشهای off-policy بودهاند که نیازی به در نظر گرفتن مسئله رویه انتخاب عمل و اکتشاف در اثبات همگرایی ندارند. بنابراین در رویههای اجرایی پیشنهاد دادهاند که ابتدا نقطه تعادل نش محاسبه شده و سپس با روش ϵ-greedy مصالحه بین اکتشاف و استخراج برقرار شود.
محاسبه نقطه تعادل ϵ-نش در بازیهای نرمال در این رساله به صورت یک مسئله مینیممسازی تعریف شده که جواب آن توسط الگوریتمهای ژنتیک بدست آمدهاست. علاوه بر کاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه کردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه کند که مسئله چندگانگی نقاط تعادل نش را نیز مرتفع میسازد.
مقدمه
محاسبه نقطه تعادل ϵ-نش در بازیهای نرمال در این رساله به صورت یک مسئله مینیممسازی تعریف شده که جواب آن توسط الگوریتمهای ژنتیک بدست آمدهاست. علاوه بر کاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه کردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه کند که مسئله چندگانگی نقاط تعادل نش را نیز مرتفع میسازد.
در پایان، روشهای پیشنهادی در حل مسئله بازار برق مورد استفاده قرار گرفتهاست. در ابتدای هر روز، شرکت برق با هدف کاهش هزینه و در عین حال تأمین نیازهای مصرفی با توجه به توپولوژی شبکه، به کمک برنامهریزی خطی میزان خرید برق از هر ژنراتور را با توجه به قیمتهای پیشنهادی آنها اعلام میکند. علاوه بر آن در پایان هر ماه با توجه به تناسب قیمتهای پیشنهادی، مبلغی را به عنوان پاداش به هر ژنراتور میدهد. ژنراتورها با توجه به میزان سودی که از فروش برق بدست میآورند، پارامترهای مربوط به جدول ارزشهای خود در آن روز را اصلاح میکنند. این جدولها منعکس کننده مسئله تعیین قیمت با توجه به خواستههای شرکت برق و نحوه قیمتگذاری سایر ژنراتورها است. ژنراتورها در ابتدای هر روز با توجه به این جدول به دنبال پیدا کردن بهترین پیشنهاد به شرکت برق هستند که در واقع همان مسئله تعیین نقطه تعادل نش است. با کمک یادگیری تقویتی چندعاملی، ارزشهای این جدولها به مرور اصلاح شده و عاملها قادر به جمعآوری سود بیشتری در طول یک ماه خواهند بود. شبیهسازیهای انجام شده روند صعودی افزایش میزان سود را نشان میدهند.
ممکن است هنگام انتقال از فایل ورد به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است
متن کامل را می توانید در ادامه دانلود نمائید
چون فقط تکه هایی از متن پایان نامه برای نمونه در این صفحه درج شده است ولی در فایل دانلودی متن کامل پایان نامه همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند موجود است