موضوع فارسی :تمایز الگوریتم الحاقی GPU شتاب
موضوع انگلیسی :GPU-accelerated adjoint algorithmic differentiation
تعداد صفحه :12
فرمت فایل :PDF
سال انتشار :2016
زبان مقاله : انگلیسی
چکیده
بسیاری از مسائل علمی مانند آموزش طبقه بندی و یا بازسازی تصاویر پزشکی را می توان بیان
به عنوان حداقل رساندن مشتقپذیر توابع هزینه واقعی ارزش و حل مبتنی بر گرادیان تکراری
مواد و روش ها. الحاقی تمایز الگوریتم (AAD) را قادر می سازد محاسبه شیب چنین خودکار
توابع هزینه به عنوان برنامه های کامپیوتری اجرا شده است. به backpropagate مشتقات الحاقی، بیش از حد
حافظه به طور بالقوه مورد نیاز برای ذخیره مشتقات جزئی میانی در یک ساختار داده اختصاص داده شده،
به عنوان '' نوار '' نامیده می شود. موازی مشکل است زیرا موضوعات نیاز به همگام سازی دسترسی خود
در طول مداخله و پس انتشار خطا. این وضعیت برای معماری بسیاری از هسته تشدید، مانند
واحد پردازش گرافیکی (GPU ها)، به دلیل تعداد زیادی از موضوعات سبک وزن و محدود
اندازه حافظه به طور کلی و همچنین هر موضوع. ما نشان دهد که چگونه این محدودیت ها می توان اگر واسطه
تابع هزینه است با استفاده از عملیات بردار و ماتریس GPU شتاب که به رسمیت شناخته شده بیان
توابع به عنوان ذاتی توسط نرم افزار AAD ما است. ما این رویکرد در مقایسه با ساده و بی تکلف و برداری
پیاده سازی شده برای پردازنده است. ما با استفاده از چهار توابع هزینه به طور فزاینده پیچیده برای ارزیابی عملکرد
با توجه به مصرف حافظه و زمان انجام محاسبات شیب. با استفاده از vectorization، CPU و GPU
مصرف حافظه می تواند قابل ملاحظه نسبت به اجرای ساده و بی تکلف مرجع کاهش می یابد، در
برخی از موارد حتی منظور از پیچیدگی است. vectorization استفاده از اجازه از کتابخانه های موازی، بهینه
در طول جلو و عقب پاس که در تند بالا برای نسخه CPU برداری منجر
نسبت به اجرای مرجع ساده و بی تکلف. نسخه GPU به دست آورد تسریع اضافی از
7.5 ± 4.4، نشان دادن که قدرت پردازش GPU های را می توان برای AAD استفاده از این مفهوم استفاده شده است.
علاوه بر این، ما نشان می دهد که چگونه این نرم افزار می توان به طور سیستماتیک برای مشکلات پیچیده تر گسترش
مانند بازسازی جذب غیرخطی توموگرافی-فلورسانس واسطه