یارا فایل

مرجع دانلود انواع فایل

یارا فایل

مرجع دانلود انواع فایل

دانلود پایان نامه صحت گفتار

اختصاصی از یارا فایل دانلود پایان نامه صحت گفتار دانلود با لینک مستقیم و پرسرعت .

دانلود پایان نامه صحت گفتار


دانلود پایان نامه صحت گفتار

 

 

 

 

 

 

 


فرمت فایل : word(قابل ویرایش)

تعداد صفحات:141

فهرست مطالب :

فصل اول مقدمه

مدل اعضای صوتی انسان

-2 مدل منبع – فیلتر گفتار

فصل دوم

Speech analysist

مقدمه:

فریم بندی سیگنال صحبت

فیلتر پیش تأکید

جداسازی سیگنال صحبت از روی سیگنال زمینه

پیدا کردن اولین و آخرین فریم واکه‌دار

مرحله 4 پیدا کردن نقطة انتهایی و ابتدایی

پیاده سازی الگوریتم‌ها

استخراج ضرائب کپزرم

محاسبة ضرایب دلتاکپترال

پردازش روی فریم‌های واکه دار:

روش اول: استفاده از autocorrelation

روش دوم: استفاده از ضرائب کپستروم

پیاده سازی الگوریتم‌ها

فرکانس فرمنت

استخراج فرکانس فرمنت از طریق حل ریشه‌های LPC

آنالیز پیشگویی خطی (LPC)

مدل تولید صحبت

روش همبستگی

روش کوواریانس

مقایسه روش‌های همبستگی و کوواریانس

مرتبه پیشگو

کوانتیزاسیون برداری

الگوریتم LBG

فصل سوم: انحراف پویای زمانی (Dynamic time warpping)

مقدمه:

– هم ترازی‌سازی زمانی و نرمالیزاسیون

مروری بر Dynamic programing

محدودیتهای نرمالیزاسیون زمانی

محدودیتهای نقطه انتها

شرایط یکنواختی

محدودیت پیوستگی محلی

محدودیت در مسیر سراسری

وزن دهی شیب منحنی

انحراف زمانی پویا (dynamic – lime warping)

 

فصل چهارم

استفاده از مدلهای مارکف مخفی

در تشخیص گفتار

2-3- مدل مارکف مخفی (HMM) ]21[

مدل کاسه و گلوله

1-2-3- اجزای یک HMM

2-2-3- سه مسئله اساسی در HMM

حل مسئله 1

-1-2-2-3- الگوریتم پیشرو – پسرو

2-2-2-3- حل مسئله 2

3-2-2-3- حل مسئله 3

1-4- الگوریتم بام – ولچ ]21[ و ]11[

-4- مسائل مربوط به پیاده سازی روش ML

الف – مقیاس بندی

ب. دنباله های مشاهده چندتایی

پ. تخمین اولیه پارامترهای HMM

فصل 5: بازشناسی و ارزیابی نحوه بیان کلمات مقطع قرآنی

بازشناسی گفتار بوسیله الگوریتم DTW

تاثیر طول پنجره در کیفیت گفتار جداشده در زمینه

تطابق چندالگویی

روش اول: استفاده در میانگین الگوها:

الگوریتم پیدا کردن کلمة مناسب

فلوچارت مربوط به الگوریتم knn

حذف میانگین ضرایب کپستروم

MEI Scald-MFCC

پیاده سازی

طراحی ساختار مدل مخفی مارکوف

مقدار دهی اولیه Hmm

تخمین بیشترین شباهت

بازشناسی گفتار

بخش دوم لرزیابی نحوة بیان گفتار قرآنی

ارزیابی نحوه بیان گفتار قرآنی بوسیله و تطابق الگو

Log spectral Distance

Weignted cepstral Distance

Cepstral Distance

Distance base on LPC

پیدا کردن منحنی فاصله‌ها

امتیازدهی به گوینده

استفاده از هر ارزیابی نحوة بیان

استفاده از Hmm در ارزیابی نحوة بیان

 

فصل اول مقدمه:
صحت و گفتار نقش اساسی در ارتباط انسانها ایفا می‌کنند و یکی از دلایل پیشرفت انسانها است.
برای برقراری ارتباط کامپیوتر با انسان بوسیلة گفتار در کار لازم است انجام شود. یکی سنتزل گفتار است. و دیگری بازشناسی گفتار، سنتز گفتار بیان گفتار بوسیلة کامپیوتر می‌باشد و بازشناسی یعنی فهمیدن گفتار در بازشناسی گفتار. هدف بدست آوردن دنبالة آوایی یک گفتار می‌باشد و این دنبالة آوایی می‌تواند بر اساس واج، سیلاب، کلمه، جمله و ... باشد. بازشناسی گفتار عکس عمل سنتز است و گفتار را به متن تبدیل می‌کند. اما انجام بازشناسی گفتار به دلیل خاصیت صدای انسانها، دارای پیچیدگی‌های زیادی است. اما اغلب بازشناسی کامل و درست غیر ممکن است. حتی خود انسانها هم نمی‌توانند به طور کامل همه صداها را بفهمند و میزان، درک گوش انسانها حدود 70% می‌باشد. شکل 1-1 ارتباط گفتاری بین انسانها و کامپیوتر را نشان می‌دهد. به دلیل نقش مهم و کاربردهای فراوانی که بازشناسی گفتار دارد، تحقیقات و مقاله‌های زیادی در این زمینه انجام شده و راه حل‌های متفاوتی پیشنهاد شده است،‌ ولی بازشناسی گفتار کاملاً درست هنوز امکان‌پذیر نمی‌باشد.
بازشناسی گفتار دارای کاربردهای زیادی است. از جمله کاربردهای بازشناسی گفتار، حل مشکل تایپ است، با کمک بازشناسی گفتار می‌توان جمله‌ها را یکی پس از دیگری خواند و کامپیوتر آنها را تایپ کند. یکی دیگر از کاربردهای بازشناسی گفتار، حل مشکل صحبت دو فرد مختلف همزبان است. یکی از مشکلات انسانها ارتباط با افرادی است که با زبانهای متفاوت صحبت می‌کنند. ارتباط بدون دانستن زبان مشکل است. و یادگیری یک زبان دیگر کار وقت گیر و پر زحمتی است ولی به کمک بازشناسی گفتار به یادگیری زبانهای مختلف احتیاجی نخواهد بود و می‌توان با یک دستگاه کوچک با فردی که با زبان دیگری صحبت می‌کند، صحبت نمود. یک کامپیوتر کوچک صدای شما را گرفته و به تعدادی از کلمات تبدیل می‌نماید. سپس این کلمات به زبان دیگر ترجمه شده و در نهایت با زبان جدید گفته می‌شوند. دو مرحلة آخر این سیستم جزو مسایل انجام شده گفتار هستند و با کامل نمودن مسئله بازشناسی گفتار بدون دانستن زبان‌های دیگر به آنها تکلم نمود.
شکل 1-2 نشان دهنده ارتباط دو فرد با زبان‌های مختلف است. یکی از کاربردهای دیگر بازشناسی گفتار، برقراری ارتباط با کامپیوتر است. همان گونه که به انسانهای دیگر دسترس می‌دهید، به کامپیوتر هم می‌توان دستور داد و با آن صحبت کرد. یا حتی می‌توانید از او بخواهید کاری برایتان انجام دهد.
حتی با کمک بازشناسی گفتار می‌توان به انسانهای نابینا و ناشنوا کمک کرد. به طور مثال نابینایان می‌توانند با صحبت کردن و دادن دستور به کامپیوتر با آن کار کنند.
از دستاوردهای جدید بازشناسی گفتار و پردازش مدت کاربرد آن در آموزش‌های زبان دوم می‌باشد. بدین ترتیب که با ایجاد سیستمی‌که قابلیت آشکارسازی خطای تلفظ بین لهجه‌های زبان اصلی و لهجة یک فردی که به زبان دوم فرد سخن می‌گوید، وی را در یادگیری و تصحیح تلفظ و لهجه آن زبان کمک نمی‌کنند.
بازشناسی گفتار می‌تواند برای شرایط مختلفی انجام گیرد. هر کدام از این شرایط می‌توانند باعث مشکل شدن، پیچیدگی بازشناسی شوند. یکی از این شرایط، وابسته بودن بازشناسی به یک گوینده یا مستقل بودن آن از گوینده است. مستقل بودن از گوینده به معنای آن است که بتوان کار بازشناسی را برای هر فرد انجام داد. از دیگر شرایط بازشناسی گسسته یا پیوسته بودن گفتار است. راحتی بازشناسی گفتار گسسته، داشتن ابتدا و انتهای عصر کلمه یا اساساً خود کلمه یا همان واحد آوایی می‌باشد. همچنین از دیگر شرایطی که در بازشناسی مطرح است،تعداد واژگان می‌باشد. یعنی بازشناسی گفتار برای چه تعداد کلمه‌ای صورت می‌پذیرد.
هدف از انجام پروژة فوق در ابتدا بازشناسی کلمات گسسته قرانی و در مرحلة دوم ارزیابی نحوة بیان و تلفظ کلمات قرآنی می‌باشد. از آنجائیکه برای مقایسه بین کلمة ادا شده توسط کاربر و صدای استاد باید یک سیستم بهینه وجود داشته باشد. در مرحلة اول سعی می‌کنیم، سیستم را به حالت بهینه خود برسانیم و سپس پارامترهای این سیستم جهت انجام مرحلة  دوم استفاده کنیم.
اما چون در هنگام ارزیابی نحوة‌ بیان کلمه قرآنی، کلمه مورد نظر از قبل مشخص است، بناباین در مرحله دوم احتیاجی به بازشناسی گفتار نمی‌باشد.
در بخش اول برای بهتر درک کردن مفهوم بازشناسی به بررسی سیستم تولید صوت و شنوایی انسان می‌پردازیم. سپس وارد مفاهیم بازشناسی گفتار خواهیم شد. در این مرحله روشهای جداسازی سیگنال زمینه از روی سیگنال صحبت مورد بررسی قرار می‌گیرد. سپس نحوة استخراج ماتری ضرائب کپستروم و در نهایت بازشناسی گفتار بوسیلة الگوریتم انحراف زمانی پویا (DTU)  و مدل مخفی مارکوف مورد بررسی قرار می‌گیرد.
پس از آشنایی با ابزارهای بازشناسی گفتار، نحوة پیاده سازی الگوریتم‌های فوق ذکر خواهد شد. بعد از راه‌اندازی سیستم بازشناسی گفتار کلمات مقطع، بوسیلة الگوریتم DTN مشاهده شد نرخ بازشناسی گفتار پائینی است و حدود %47 می‌باشد. از این رو در جهت بهبود پارامترهای سیستم و بهینه کردن آن در مراحل بازشناسی و پارامترهای آن تغییراتی داده شد، که به ذکر آنها پرداخته خواهد شد.
پس از بهینه کردن پارامترهای سیستم بازشناسی گفتار و رسانیدن نرخ بازشناسی گفتار به 99% برای 20 کلمه قرآنی الگوریتم‌های ارزیابی نحوة بیان بوسیلة روش DTA بحث خواهد شد.
در بخش انتهایی به بررسی مدل مخفی مارکوف خواهیم پرداخت. سپس مراحل پیاده سازی الگوریتم فوق بوسیلة نرم افزار  و نکات عملی آن گفته خواهد شد. در نهایت سیستم بازشناسی گفتار کلمات مقطع قرآنی و نحوة پیاده سازی آن مورد بررسی قرار خواهد گرفت و در مرحلة بعدی الگوریتم ارزیابی نحوة بیان بوسیلة ذکر خواهد شد.
تغییر محیط اکوستیکی روی نتیجه بازشناسی اثر خواهد گذاشت. از آنجائیکه سیستم فوق برای نمونه‌های آزمایشگاهی آموزش داده شده با تغییر محیط اکوستیکی مطمئناً نتایج بازشناسی تغییر خواهد کرد و نمونه‌های واقعی دارای نوین میکروفن، محیط و همچنین برگشت صدا خواهند بود.
در انتها به بررسی سیستم‌های بهبود گفتار خواهیم پرداخت، هدف از این بخش حذف هزینه ورودی از طریق میکروفن و از بین بردن تأثیرهای محیط بر روی سیگنال صدا می‌باشد.
در این بخش به دو روش اشاره خواهیم: ابتدا روش spectral subtraction
که به میزان یک روش عمدی برای حذف نویز می‌رود ذکر خواهد شد.
سپس به معرفی یک الگوریتم جدید در حذف نویز میکروفن خواهیم پرداخت.
مدل اعضای صوتی انسان
در شکل (1-2) یک دیاگرام شماتیک از مکانیزم تولید صحبت انسان نشان داده شده است. هنگام صحبت معمولی،‌ قفسه سین با فشار وارد کردن به ششها باعث می‌شود که هوای فشرده از ششها از طریق حنجره بیرون رانده شود. تارهای صوتی که درست در پشت غدة تیروئید قرار گرفته‌اند،‌ اگر تحت تنش قرار گیرند، با عبور هوا مرتعش می‌شوند و بدین ترتیب هوا نیز متناسب با فرکانس ارتعاش تارهای صوتی مرتعش شده و در این حالت حروف صدادار تولید می‌گردند.


دانلود با لینک مستقیم

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.