یارا فایل

مرجع دانلود انواع فایل

یارا فایل

مرجع دانلود انواع فایل

پایان نامه بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها

اختصاصی از یارا فایل پایان نامه بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها دانلود با لینک مستقیم و پرسرعت .

پایان نامه بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها


پایان نامه بررسی سیستم‌های چند عامله با استفاده از  تئوری بازی‌ها

 

 

 

 

 

 

 


فرمت فایل : WORD (قابل ویرایش)

تعداد صفحات:129

سمینار برای دریافت درجه کارشناسی ارشد”M.Sc”
مهندسی  برق – کنترل

فهرست مطالب:
چکیده    1
مقدمه    2
1-    عامل و سیستم‌های چند عامله    4
1-1- مقدمه    4
1-2- هوش مصنوعی توزیع شده    4
1-3- حوزه‌های کاری هوش مصنوعی توزیع شده    6
1-4- دلایل گرایش به هوش مصنوعی توزیع شده    9
1-4-1- پایه تکنولوژیکی    9
1-4-2- توزیع ذاتی    10
1-4-3- مزایای طراحی و پیاده‌سازی    12
1-4-4- دلایل معرفت شناسی    13
1-4-5- بنیاد اجتماعی    14
1-4-6- همجوشی (کلاس‌های جدید از مسائل)    14
1-5- مسائل مطرح در هوش مصنوعی توزیع شده    14
1-6- تعریف عامل و عامل‌های هوشمند    17
1-6-1- تعریف عامل    18
1-7- عامل به عنوان یک سیستم نرم‌افزاری    19
1-8- مفهوم عامل از دیدگاه عام    20
1-9- مروری برخصوصیات عامل    20
1-10- ویژگی‌های دیگر عامل‌ها    25
1-11- طبقه بندی عاملها    29
1-12- مقایسه عامل با شیء    33
1-13- تفاوت‌های سیستم مبتنی بر عامل و سیستم‌های خبره    35
1-14- انواع محیط عامل    35
1-14-1- قابل دستیابی / غیر قابل دستیابی    36
1-14-2- محیط قطعی یا غیر قطعی    37
1-14-3- محیط مقطعی یا غیر مقطعی    38
1-14-4- محیط ایستا / پویا    38
1-14-5- محیط گسسته یا پیوسته    38
1-15- سیستم‌های چند عامله    39
1-16- خصوصیات سیستم‌های چند عاملی:    46
1-17- دلایل استفاده از سیستم‌های چندعامله    47
1-17-1- نیاز برخی دامنه‌ها به سیستم‌های چندعامله:    47
1-17-2- افزایش سرعت عمل با موازی سازی    48
1-17-3- قابلیت اطمینان    48
1-17-4- توسعه پذیری    48
1-17-5- آسانتر شدن برنامه‌سازی    49
1-18- آزمون نظریه‌های سایر رشته‌های علمی    49
1-19- معماری‌های ارایه شده برای سیستم‌های چندعامله    49
1-19-1- مدل OMG     50
1-19-2- استاندارد FIPA     50
1-19-3- استاندارد KAOS    50
1-19-4- مدل General Magic    51
1-20- سازماندهی سیستم‌های چندعامله    51
1-20-1- ساختار سلسله مراتبی    51
1-20-2- ساختار مسطح    52
1-20-3- ساختار جزء به کل    53
1-20-4- ساختار پیمانه‌ای    53
1-21- پارامترهای مطرح در ارزیابی سیستمهای چندعامله    54
1-22- سیستمهای مقیاس وسیع(Large Scale systems):    55
1-23- کنترل غیر متمرکز : (Decentralized Control)    56
1-24- نتیجه‌گیری    57
2-    تئوری بازی‌ها و کاربردهای آن‌ها درسیستم‌های چند عامله    60
2-1- مقدمه    60
2-2- نظریه بازی ‌ها چیست؟    60
2-3- تفاوت میان تصمیم‌گیری و بازی    62
2-4- طبقه‌بندی نظریه بازی‌ها    63
2-5- برخی مفاهیم و اصطلاحات    68
2-6- موارد استفاده از نظریه بازی‌ها    74
2-7- فرض های اساسی در نظریه بازیها    75
2-8- شاخه‌های اصلی نظریه بازی‌ها    75
2-9- بازی‌های ایستا    77
2-10- نمایش بازی در فرم استراتژیک یا نرمال    79
2-11- فرم ماتریسی بازی    82
2-12- پیدا کردن جواب در بازیهای ایستا    82
2-13- بازیهای رقابتی    83
2-14- بازیهای تصادفی    84
2-15- بازیهای پویا    85
2-16- بازی پویا در فرم بسط یافته    85
2-17- درخت‌ بازی    87
2-18- عناصر فرم بسط یافته:    88
2-19- پیشینه بازی:    88
2-20- مجموعه اطلاعاتی:    89
2-21- استراتژی    90
2-22- پیدا کردن جواب در بازیهای پویا    91
3-    بررسی روش‌های یادگیری    93
3-1- یادگیری تقویتی    93
3-1-1- خط مشی    94
3-1-2- تابع پاداش    94
3-1-3- تابع مقدار    94
3-1-4- مدل برگرفته شده از محیط    95
3-2- اجزای یادگیری تقویتی    97
3-3- اهداف و پاداش    98
3-4- Q-Learning    99
3-5- خاصیت مارکوف    100
3-6- فرآیند تصمیم گیری مارکوف    101
3-7- روشهای حل فرآیندهای تصمیم گیری مارکوف    103
3-8- تابع ارزش    104
3-9- تابع ارزش بهینه:    105
3-10- فرایند تحلیل سلسله مراتبی (AHP)    106
3-11- ویژگیهای فرایند تحلیل سلسله مراتبی    106
3-12- ساختار سلسله مراتبی    107
3-13- اصول فرایند تحلیل سلسله مراتبی    108
3-14- محاسبه وزن    108
3-15- روشهای محاسبه وزن    109
3-15-1- روش حداقل مربعات ( least squares method )    109
3-15-2- روش حداقل مربعات لگاریتمی (logarithmic least squares method)    110
3-15-3- روش بردار ویژه ( Eigenvector Method ):    111
3-15-4- روش های تقریبی(Approximation Method)    112
3-16- سازگاری سیستم و ماتریس سازگار    112
3-17- محاسبه نرخ ناسازگاری    113
4-    نتیجه‌گیری    116
5-    مراجع    118
6-    ABSTRACT    121



 
چکیده

در این رساله، روش مناسبی جهت محاسبه نقطه تعادل نش در الگوریتم‌های یادگیری تقویتی چندعاملی با تعداد زیاد عامل‌ها مطرح شده‌است، که قادراست با ادغام محاسبات مربوط به نقطه تعادل نش و ایجاد مصالحه بین اکتشاف- استخراج، محاسبات را به صورت بهینه کاهش دهند. ترکیب یادگیری تقویتی تک- عاملی و تئوری بازی ایده اصلی اکثر روشهای یادگیری چندعاملی است. این روش‌ها سعی دارند تا کل فرآیند یادگیری را به تعدادی متناهی از حالت‌های تصمیم‌گیری چندعاملی با خاصیت مارکوف تقسیم کرده و با انتخاب نقطه تعادل نش در هر کدام از این مراحل به تدبیر بهینه برای هر عامل همگرا شوند. بنابراین محاسبه نقطه تعادل نش مسئله مهمی است که در حال حاضر مشکلاتی شامل پیچیدگی محاسبات در روشهای شناخته شده محاسبه نقطه تعادل نش، چندگانگی نقطه تعادل نش، و مختلط بودن نقطه تعادل نش باعث شده که اکثر روشهای پیشنهادی یادگیری تقویتی چندعاملی جایگاه مناسبی در حل مسائل دنیای واقعی پیدا نکنند. ناگفته نماند که تقریباً تمام روشهای یادگیری تقویتی چندعاملی مطرح شده، مبتنی بر روشهای off-policy بوده‌اند که نیازی به در نظر گرفتن مسئله رویه انتخاب عمل و اکتشاف در اثبات همگرایی ندارند. بنابراین در رویه‌های اجرایی پیشنهاد داده‌اند که ابتدا نقطه تعادل نش محاسبه شده و سپس با روش ϵ-greedy مصالحه بین اکتشاف و استخراج برقرار شود.
محاسبه نقطه تعادل ϵ-نش در بازی‌های نرمال در این رساله به صورت یک مسئله مینیمم‌سازی تعریف شده که جواب آن توسط الگوریتم‌های ژنتیک بدست آمده‌است. علاوه بر کاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه کردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه کند که مسئله چندگانگی نقاط تعادل نش را نیز مرتفع می‌سازد.


  مقدمه

محاسبه نقطه تعادل ϵ-نش در بازی‌های نرمال در این رساله به صورت یک مسئله مینیمم‌سازی تعریف شده که جواب آن توسط الگوریتم‌های ژنتیک بدست آمده‌است. علاوه بر کاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه کردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه کند که مسئله چندگانگی نقاط تعادل نش را نیز مرتفع می‌سازد.
در پایان، روشهای پیشنهادی در حل مسئله بازار برق مورد استفاده قرار گرفته‌است. در ابتدای هر روز، شرکت برق با هدف کاهش هزینه و در عین حال تأمین نیازهای مصرفی با توجه به توپولوژی شبکه، به کمک برنامه‌ریزی خطی میزان خرید برق از هر ژنراتور را با توجه به قیمت‌های پیشنهادی آنها اعلام می‌کند. علاوه بر آن در پایان هر ماه با توجه به تناسب قیمت‌های پیشنهادی، مبلغی را به عنوان پاداش به هر ژنراتور می‌دهد. ژنراتورها با توجه به میزان سودی که از فروش برق بدست می‌آورند، پارامترهای مربوط به جدول ارزش‌های خود در آن روز را اصلاح می‌کنند. این جدول‌ها منعکس کننده مسئله تعیین قیمت با توجه به خواسته‌های شرکت برق و نحوه قیمت‌گذاری سایر ژنراتورها است. ژنراتور‌ها در ابتدای هر روز با توجه به این جدول به دنبال پیدا کردن بهترین پیشنهاد به شرکت برق هستند که در واقع همان مسئله تعیین نقطه تعادل نش است. با کمک یادگیری تقویتی چندعاملی، ارزش‌های این جدول‌ها به مرور اصلاح شده و عامل‌ها قادر به جمع‌آوری سود بیشتری در طول یک ماه خواهند بود. شبیه‌سازیهای انجام شده روند صعودی افزایش میزان سود را نشان می‌دهند.
 

فصل اول
عامل و سیستم های چند عامله

1-    عامل و سیستم‌های چند عامله

1-1-  مقدمه
یکی از مهمترین مقوله هایی که انتظار می رود در باره  یک حوزه علمی جدید، مشخص شود، آشنایی با ماهیت آن حوزه است. بدین معنی که این حوزه چیست، چگونه و چرا به وجود آمده است، سعی دارد چه مسائلی را حل کند، برای حل چه مسائلی کاربرد دارد و قلمروی آن تا کجاست؟
در دو دهه اخیر، با افزایش توجه به محاسبات توزیع شده و علاقه به استفاده از تکنیک‌های هوش مصنوعی در این نوع محاسبات، شاخه جدیدی از هوش مصنوعی به نام هوش مصنوعی توزیع شده  شکل گرفته است. "هوش مصنوعی توزیع شده" عبارتی است که پژوهشگران در اولین گردهمایی رسمی، کارگاهی آموزشی در سال 1980 در دانشگاه ام آی تی در آمریکا پیشنهاد کردند.
در این حوزه جدید، به حل مسائل به صورت توزیع شده، توسط گروهی از موجودیت‌های خودمختار  حل کننده مسئله به نام عامل  پرداخته می‌شود. در اجتماع عامل‌ها، هر عامل خودمختار دارای اهداف، باورها، قابلیت‌ها و ویژگی‌های خاصی می‌باشد.
1-2-   هوش مصنوعی توزیع شده
در اولین تعاریف ارائه شده برای هوش مصنوعی توزیع شده بیان شده است که این حوزه، زیر مجموعه‌ای از هوش مصنوعی است که به مدل‌های دانش و تکنیک‌های ارتباط و استدلال مورد نیاز عامل‌های محاسباتی هوشمند برای مشارکت در اجتماعی از عامل‌ها می‌پردازد.]11[. در تعاریف دیگر آمده است که هوش مصنوعی توزیع شده، مطالعه، ساخت و بکارگیری سیستم‌هایی است که در آنها چندین عامل در حال تعامل با یکدیگر، مجموعه‌ای از اهداف را دنبال می‌کنند و مجموعه‌ای از وظایف را انجام می‌دهند. ]14[.
در سال 1980 هوش مصنوعی توزیع شده متوجه آن دسته از مسائلی گردید که برای آنها یک حل کننده مسئله و یا یک واحد محاسباتی کافی نیست، بلکه نیاز به همکاری بین موجودیتهای مستقل حل مسائل (عامل‌ها) برای حل اینگونه مسائل می‌باشد. ]12[. این تعریف مورد تغییر و بحث‌‌های بسیاری قرار گرفت که از جمله احتمال وجود چندین وظیفه برای سیستم مطرح شد. در حالی که عامل‌ها ممکن است دارای اهداف ناسازگار نیز باشد. در سال 1981 هوش مصنوعی توزیع شده متوجه وضعیت‌های حل مسئله‌ای گردید که در آنها چندین عامل برای رسیدن به مجموعه‌ای مشترک از اهداف همکاری می‌کنند.
در سال 1983، یک سیستم همکاری حل مسئله به صورت شبکه‌ای توزیع شده از اجتماع عامل‌های نیمه خودمختار معرفی شد که هر کدام قادر به حل مسئله می‌باشند و برای حل یک مسئله با یکدیگر همکاری می‌کنند. ]2[. بر این اساس سیستم هوش مصنوعی توزیع شده، شبکه‌ای از سیستم‌های مجزا و هوشمند است که با یکدیگر همکاری دارند. ]5[. در تعاریف سال‌های اخیر سیستم هوش مصنوعی توزیع شده از تعداد زیادی عامل تشکیل شده است که هر عامل توانایی محدودی در حل مسائل داشته و هوش کلی سیستم نیز نتیجه تعامل‌های بین این عامل‌های با توانایی محدود در نتیجه‌گیری است. البته به نظر می‌رسد که محققین علاقه‌مند به عدم توزیع (به صورت پیوند گرا) بیشتر از این تعریف پیروی می‌کنند و به نظر می‌رسد که همان تعریف اولیه نزدیکی بیشتری با اکثر تعاریف در این زمینه داشته باشد.
در سال 1985 هوش مصنوعی توزیع شده متوجه راه‌حل نتیجه شده از مشارکت مجموعه‌ای از منابع دانش غیر متمرکز و ارتباط بین آنها شد که هر کدام در پردازنده‌ای جدا از هم قرار گرفته‌اند ]13[ . این ارتباط الزاماً یک ارتباط از پیش تعریف شده نمی‌باشد. یکسال بعد، در تعریفی جدید حداقل هوش و نتیجه‌گیری در هوش مصنوعی توزیع شده بدین صورت بیان گردید که سیستم هوش مصنوعی توزیع شده باید حداقل شامل دو عامل باشد. این عامل‌ها دارای درجه‌ای از اطلاعات و خودمختاری در راستای دستیابی به هدف خود بوده و از دیدگاه هوش مصنوعی مهارتهایی نظیر قابلیت استنتاج، برنامه‌ریزی و غیره را از خود بروز می‌دهند.
در سال 1987 هوش مصنوعی توزیع شده، در رابطه با اجتماع، همکاری و تعامل بین عامل‌های هوشمند مستقل برای حل مسائل پیچیده و کلی تعریف گردید. ]10[. در مسائل فرض شد ]6[. در سال 1988 بحث همزمانی در سیستم‌های هوشمند عنوان گردید. ]1[. در جدول 1-1 خلاصه‌ای از تعاریف ارائه شده برای هوش مصنوعی توزیع شده و معیارهایی که در هر تعریف اهمیت داشته‌اند، دیده می‌شوند.
با توجه به تعاریف مطرح شده دیده می‌شود که در اکثر تعاریف هوش مصنوعی توزیع شده به وجود چندین عامل یا موجودیت حل کننده مسئله ارائه شده است که به شکل توزیع شده به منظور خاصی با یکدیگر تعامل دارند. منظور یا مقصود این تعامل می‌تواند حل یک مسئله، انجام یک یا چند وظیفه یا دستیابی به یک یا چند هدف تأیین شده برای اجتماع عامل‌ها باشد. این تعامل نیز می‌تواند به شکل همکاری یا هماهنگی یا یک ارتباط ساده باشد. در رابطه با میزان پیچیدگی عامل‌ها یا موجودیت‌های حل مسئله نیز نظراتی ارائه شده است. بعضی از محققین اعتقاد دارند که عامل‌ها هوشمند بوده و دارای قابلیت‌هایی مانند استدلال و برنامه‌ریزی می‌باشند.


دانلود با لینک مستقیم

عنوان پایان نامه: بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها

اختصاصی از یارا فایل عنوان پایان نامه: بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها دانلود با لینک مستقیم و پرسرعت .

عنوان پایان نامه: بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها


بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها


دانلود با لینک مستقیم

بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها

اختصاصی از یارا فایل بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها دانلود با لینک مستقیم و پرسرعت .

بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها


بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها

بررسی سیستم‌های چند عامله با استفاده از تئوری بازی‌ها

129 صفحه در قالب word

 

 

 

فهرست مطالب

چکیده. 1

مقدمه  2

1-       عامل و سیستم‌های چند عامله. 4

1-1- مقدمه. 4

1-2- هوش مصنوعی توزیع شده. 4

1-3- حوزه‌های کاری هوش مصنوعی توزیع شده. 6

1-4- دلایل گرایش به هوش مصنوعی توزیع شده. 9

1-4-1- پایه تکنولوژیکی.. 9

1-4-2- توزیع ذاتی.. 10

1-4-3- مزایای طراحی و پیاده‌سازی.. 12

1-4-4- دلایل معرفت شناسی.. 13

1-4-5- بنیاد اجتماعی.. 14

1-4-6- همجوشی (کلاس‌های جدید از مسائل). 14

1-5- مسائل مطرح در هوش مصنوعی توزیع شده. 14

1-6- تعریف عامل و عامل‌های هوشمند.. 17

1-6-1- تعریف عامل.. 18

1-7- عامل به عنوان یک سیستم نرم‌افزاری.. 19

1-8- مفهوم عامل از دیدگاه عام. 20

1-9- مروری برخصوصیات عامل.. 20

1-10- ویژگی‌های دیگر عامل‌ها 25

1-11- طبقه بندی عاملها 29

1-12- مقایسه عامل با شیء. 33

1-13- تفاوت‌های سیستم مبتنی بر عامل و سیستم‌های خبره. 35

1-14- انواع محیط عامل.. 35

1-14-1- قابل دستیابی / غیر قابل دستیابی.. 36

1-14-2- محیط قطعی یا غیر قطعی.. 37

1-14-3- محیط مقطعی یا غیر مقطعی.. 38

1-14-4- محیط ایستا / پویا 38

1-14-5- محیط گسسته یا پیوسته. 38

1-15- سیستم‌های چند عامله. 39

1-16- خصوصیات سیستم‌های چند عاملی: 46

1-17- دلایل استفاده از سیستم‌های چندعامله. 47

1-17-1- نیاز برخی دامنه‌ها به سیستم‌های چندعامله: 47

1-17-2- افزایش سرعت عمل با موازی سازی.. 48

1-17-3- قابلیت اطمینان.. 48

1-17-4- توسعه پذیری.. 48

1-17-5- آسانتر شدن برنامه‌سازی.. 49

1-18- آزمون نظریه‌های سایر رشته‌های علمی.. 49

1-19- معماری‌های ارایه شده برای سیستم‌های چندعامله. 49

1-19-1- مدل OMG 50

1-19-2- استاندارد FIPA 50

1-19-3- استاندارد KAOS. 50

1-19-4- مدل General Magic. 51

1-20- سازماندهی سیستم‌های چندعامله. 51

1-20-1- ساختار سلسله مراتبی.. 51

1-20-2- ساختار مسطح.. 52

1-20-3- ساختار جزء به کل.. 53

1-20-4- ساختار پیمانه‌ای.. 53

1-21- پارامترهای مطرح در ارزیابی سیستمهای چندعامله. 54

1-22- سیستمهای مقیاس وسیع(Large Scale systems): 55

1-23- کنترل غیر متمرکز : (Decentralized Control) 56

1-24- نتیجه‌گیری.. 57

2-      تئوری بازی‌ها و کاربردهای آن‌ها درسیستم‌های چند عامله. 60

2-1- مقدمه. 60

2-2- نظریه بازی ‌ها چیست؟. 60

2-3- تفاوت میان تصمیم‌گیری و بازی.. 62

2-4- طبقه‌بندی نظریه بازی‌ها 63

2-5- برخی مفاهیم و اصطلاحات... 68

2-6- موارد استفاده از نظریه بازی‌ها 74

2-7- فرض های اساسی در نظریه بازیها 75

2-8- شاخه‌های اصلی نظریه بازی‌ها 75

2-9- بازی‌های ایستا 77

2-10- نمایش بازی در فرم استراتژیک یا نرمال.. 79

2-11- فرم ماتریسی بازی.. 82

2-12- پیدا کردن جواب در بازیهای ایستا 82

2-13- بازیهای رقابتی.. 83

2-14- بازیهای تصادفی.. 84

2-15- بازیهای پویا 85

2-16- بازی پویا در فرم بسط یافته. 85

2-17- درخت‌ بازی.. 87

2-18- عناصر فرم بسط یافته: 88

2-19- پیشینه بازی: 88

2-20- مجموعه اطلاعاتی: 89

2-21- استراتژی.. 90

2-22- پیدا کردن جواب در بازیهای پویا 91

3-     بررسی روش‌های یادگیری.. 93

3-1- یادگیری تقویتی.. 93

3-1-1- خط مشی.. 94

3-1-2- تابع پاداش... 94

3-1-3- تابع مقدار. 94

3-1-4- مدل برگرفته شده از محیط.. 95

3-2- اجزای یادگیری تقویتی.. 97

3-3- اهداف و پاداش.... 98

3-4- Q-Learning. 99

3-5- خاصیت مارکوف... 100

3-6- فرآیند تصمیم گیری مارکوف... 101

3-7- روش‌های حل فرآیندهای تصمیم گیری مارکوف... 103

3-8- تابع ارزش.... 104

3-9- تابع ارزش بهینه: 105

3-10- فرایند تحلیل سلسله مراتبی (AHP) 106

3-11- ویژگیهای فرایند تحلیل سلسله مراتبی.. 106

3-12- ساختار سلسله مراتبی.. 107

3-13- اصول فرایند تحلیل سلسله مراتبی.. 108

3-14- محاسبه وزن.. 108

3-15- روشهای محاسبه وزن.. 109

3-15-1- روش حداقل مربعات ( least squares method ) 109

3-15-2- روش حداقل مربعات لگاریتمی (logarithmic least squares method) 110

3-15-3- روش بردار ویژه ( Eigenvector Method ): 111

3-15-4- روش های تقریبی(Approximation Method). 112

3-16- سازگاری سیستم و ماتریس سازگار. 112

3-17- محاسبه نرخ ناسازگاری.. 113

4-     نتیجه‌گیری.. 116

5-     مراجع.. 118

6-       ABSTRACT.. 121

 

 

چکیده

 

در این رساله، روش مناسبی جهت محاسبه نقطه تعادل نش در الگوریتم‌های یادگیری تقویتی چندعاملی با تعداد زیاد عامل‌ها مطرح شده‌است، که قادراست با ادغام محاسبات مربوط به نقطه تعادل نش و ایجاد مصالحه بین اکتشاف- استخراج، محاسبات را به صورت بهینه کاهش دهند. ترکیب یادگیری تقویتی تک- عاملی و تئوری بازی ایده اصلی اکثر روشهای یادگیری چندعاملی است. این روش‌ها سعی دارند تا کل فرآیند یادگیری را به تعدادی متناهی از حالت‌های تصمیم‌گیری چندعاملی با خاصیت مارکوف تقسیم کرده و با انتخاب نقطه تعادل نش در هر کدام از این مراحل به تدبیر بهینه برای هر عامل همگرا شوند. بنابراین محاسبه نقطه تعادل نش مسئله مهمی است که در حال حاضر مشکلاتی شامل پیچیدگی محاسبات در روشهای شناخته شده محاسبه نقطه تعادل نش، چندگانگی نقطه تعادل نش، و مختلط بودن نقطه تعادل نش باعث شده که اکثر روشهای پیشنهادی یادگیری تقویتی چندعاملی جایگاه مناسبی در حل مسائل دنیای واقعی پیدا نکنند. ناگفته نماند که تقریباً تمام روشهای یادگیری تقویتی چندعاملی مطرح شده، مبتنی بر روشهای off-policy بوده‌اند که نیازی به در نظر گرفتن مسئله رویه انتخاب عمل و اکتشاف در اثبات همگرایی ندارند. بنابراین در رویه‌های اجرایی پیشنهاد داده‌اند که ابتدا نقطه تعادل نش محاسبه شده و سپس با روش ϵ-greedy مصالحه بین اکتشاف و استخراج برقرار شود.

محاسبه نقطه تعادل ϵ-نش در بازی‌های نرمال در این رساله به صورت یک مسئله مینیمم‌سازی تعریف شده که جواب آن توسط الگوریتم‌های ژنتیک بدست آمده‌است. علاوه بر کاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه کردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه کند که مسئله چندگانگی نقاط تعادل نش را نیز مرتفع می‌سازد.

 

 

  مقدمه

 

محاسبه نقطه تعادل ϵ-نش در بازی‌های نرمال در این رساله به صورت یک مسئله مینیمم‌سازی تعریف شده که جواب آن توسط الگوریتم‌های ژنتیک بدست آمده‌است. علاوه بر کاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه کردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه کند که مسئله چندگانگی نقاط تعادل نش را نیز مرتفع می‌سازد.

در پایان، روشهای پیشنهادی در حل مسئله بازار برق مورد استفاده قرار گرفته‌است. در ابتدای هر روز، شرکت برق با هدف کاهش هزینه و در عین حال تأمین نیازهای مصرفی با توجه به توپولوژی شبکه، به کمک برنامه‌ریزی خطی میزان خرید برق از هر ژنراتور را با توجه به قیمت‌های پیشنهادی آنها اعلام می‌کند. علاوه بر آن در پایان هر ماه با توجه به تناسب قیمت‌های پیشنهادی، مبلغی را به عنوان پاداش به هر ژنراتور می‌دهد. ژنراتورها با توجه به میزان سودی که از فروش برق بدست می‌آورند، پارامترهای مربوط به جدول ارزش‌های خود در آن روز را اصلاح می‌کنند. این جدول‌ها منعکس کننده مسئله تعیین قیمت با توجه به خواسته‌های شرکت برق و نحوه قیمت‌گذاری سایر ژنراتورها است. ژنراتور‌ها در ابتدای هر روز با توجه به این جدول به دنبال پیدا کردن بهترین پیشنهاد به شرکت برق هستند که در واقع همان مسئله تعیین نقطه تعادل نش است. با کمک یادگیری تقویتی چندعاملی، ارزش‌های این جدول‌ها به مرور اصلاح شده و عامل‌ها قادر به جمع‌آوری سود بیشتری در طول یک ماه خواهند بود. شبیه‌سازیهای انجام شده روند صعودی افزایش میزان سود را نشان می‌دهند.


 

ممکن است هنگام انتقال از فایل ورد به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است

متن کامل را می توانید در ادامه دانلود نمائید

چون فقط تکه هایی از متن پایان نامه برای نمونه در این صفحه درج شده است ولی در فایل دانلودی متن کامل پایان نامه همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند موجود است


دانلود با لینک مستقیم

سمینار ارشد رشته برق - بررسی سیستم‌ های چند عامله با استفاده از تئوری بازی‌ ها با فرمت word

اختصاصی از یارا فایل سمینار ارشد رشته برق - بررسی سیستم‌ های چند عامله با استفاده از تئوری بازی‌ ها با فرمت word دانلود با لینک مستقیم و پرسرعت .

سمینار ارشد رشته برق - بررسی سیستم‌ های چند عامله با استفاده از تئوری بازی‌ ها با فرمت word


 سمینار ارشد رشته برق - بررسی سیستم‌ های چند عامله با استفاده از تئوری بازی‌ ها با فرمت word

چکیده. 1

مقدمه  2

1-      عامل و سیستم‌های چند عامله. 4

1-1- مقدمه. 4

1-2- هوش مصنوعی توزیع شده. 4

1-3- حوزه‌های کاری هوش مصنوعی توزیع شده. 6

1-4- دلایل گرایش به هوش مصنوعی توزیع شده. 9

1-4-1- پایه تکنولوژیکی.. 9

1-4-2- توزیع ذاتی.. 10

1-4-3- مزایای طراحی و پیاده‌سازی.. 12

1-4-4- دلایل معرفت شناسی.. 13

1-4-5- بنیاد اجتماعی.. 14

1-4-6- همجوشی (کلاس‌های جدید از مسائل). 14

1-5- مسائل مطرح در هوش مصنوعی توزیع شده. 14

1-6- تعریف عامل و عامل‌های هوشمند.. 17

1-6-1- تعریف عامل.. 18

1-7- عامل به عنوان یک سیستم نرم‌افزاری.. 19

1-8- مفهوم عامل از دیدگاه عام. 20

1-9- مروری برخصوصیات عامل.. 20

1-10- ویژگی‌های دیگر عامل‌ها 25

1-11- طبقه بندی عاملها 29

1-12- مقایسه عامل با شیء. 33

1-13- تفاوت‌های سیستم مبتنی بر عامل و سیستم‌های خبره. 35

1-14- انواع محیط عامل.. 35

1-14-1- قابل دستیابی / غیر قابل دستیابی.. 36

1-14-2- محیط قطعی یا غیر قطعی.. 37

1-14-3- محیط مقطعی یا غیر مقطعی.. 38

1-14-4- محیط ایستا / پویا 38

1-14-5- محیط گسسته یا پیوسته. 38

1-15- سیستم‌های چند عامله. 39

1-16- خصوصیات سیستم‌های چند عاملی: 46

1-17- دلایل استفاده از سیستم‌های چندعامله. 47

1-17-1- نیاز برخی دامنه‌ها به سیستم‌های چندعامله: 47

1-17-2- افزایش سرعت عمل با موازی سازی.. 48

1-17-3- قابلیت اطمینان.. 48

1-17-4- توسعه پذیری.. 48

1-17-5- آسانتر شدن برنامه‌سازی.. 49

1-18- آزمون نظریه‌های سایر رشته‌های علمی.. 49

1-19- معماری‌های ارایه شده برای سیستم‌های چندعامله. 49

1-19-1- مدل OMG 50

1-19-2- استاندارد FIPA 50

1-19-3- استاندارد KAOS. 50

1-19-4- مدل General Magic. 51

1-20- سازماندهی سیستم‌های چندعامله. 51

1-20-1- ساختار سلسله مراتبی.. 51

1-20-2- ساختار مسطح.. 52

1-20-3- ساختار جزء به کل.. 53

1-20-4- ساختار پیمانه‌ای.. 53

1-21- پارامترهای مطرح در ارزیابی سیستمهای چندعامله. 54

1-22- سیستمهای مقیاس وسیع(Large Scale systems): 55

1-23- کنترل غیر متمرکز : (Decentralized Control) 56

1-24- نتیجه‌گیری.. 57

2-      تئوری بازی‌ها و کاربردهای آن‌ها درسیستم‌های چند عامله. 60

2-1- مقدمه. 60

2-2- نظریه بازی ‌ها چیست؟. 60

2-3- تفاوت میان تصمیم‌گیری و بازی.. 62

2-4- طبقه‌بندی نظریه بازی‌ها 63

2-5- برخی مفاهیم و اصطلاحات... 68

2-6- موارد استفاده از نظریه بازی‌ها 74

2-7- فرض های اساسی در نظریه بازیها 75

2-8- شاخه‌های اصلی نظریه بازی‌ها 75

2-9- بازی‌های ایستا 77

2-10- نمایش بازی در فرم استراتژیک یا نرمال.. 79

2-11- فرم ماتریسی بازی.. 82

2-12- پیدا کردن جواب در بازیهای ایستا 82

2-13- بازیهای رقابتی.. 83

2-14- بازیهای تصادفی.. 84

2-15- بازیهای پویا 85

2-16- بازی پویا در فرم بسط یافته. 85

2-17- درخت‌ بازی.. 87

2-18- عناصر فرم بسط یافته: 88

2-19- پیشینه بازی: 88

2-20- مجموعه اطلاعاتی: 89

2-21- استراتژی.. 90

2-22- پیدا کردن جواب در بازیهای پویا 91

3-     بررسی روش‌های یادگیری.. 93

3-1- یادگیری تقویتی.. 93

3-1-1- خط مشی.. 94

3-1-2- تابع پاداش... 94

3-1-3- تابع مقدار. 94

3-1-4- مدل برگرفته شده از محیط.. 95

3-2- اجزای یادگیری تقویتی.. 97

3-3- اهداف و پاداش.... 98

3-4- Q-Learning. 99

3-5- خاصیت مارکوف... 100

3-6- فرآیند تصمیم گیری مارکوف... 101

3-7- روشهای حل فرآیندهای تصمیم گیری مارکوف... 103

3-8- تابع ارزش.... 104

3-9- تابع ارزش بهینه: 105

3-10- فرایند تحلیل سلسله مراتبی (AHP) 106

3-11- ویژگیهای فرایند تحلیل سلسله مراتبی.. 106

3-12- ساختار سلسله مراتبی.. 107

3-13- اصول فرایند تحلیل سلسله مراتبی.. 108

3-14- محاسبه وزن.. 108

3-15- روشهای محاسبه وزن.. 109

3-15-1- روش حداقل مربعات ( least squares method ) 109

3-15-2- روش حداقل مربعات لگاریتمی (logarithmic least squares method) 110

3-15-3- روش بردار ویژه ( Eigenvector Method ): 111

3-15-4- روش های تقریبی(Approximation Method). 112

3-16- سازگاری سیستم و ماتریس سازگار. 112

3-17- محاسبه نرخ ناسازگاری.. 113

4-     نتیجه‌گیری.. 116

5-     مراجع.. 118

6-       ABSTRACT.. 121

 


دانلود با لینک مستقیم