دانلود سمینار کارشناسی ارشد مهندسی برق سنتز کننده های گفتار با فرمت pdf تعداد صفحات52
این سمینار جهت ارایه در مقطع کارشناسی ارشد طراحی وتدوین گردیده است وشامل کلیه مباحث مورد نیاز سمینارارشد این رشته می باشد.نمونه های مشابه این عنوان با قیمت های بسیار بالایی در اینترنت به فروش می رسد.گروه تخصصی مااین سمینار رابا قیمت ناچیزی جهت استفاده دانشجویان عزیز در رابطه با منبع اطلاعاتی در اختیار شما قرار می دهد.حق مالکیت معنوی این اثر مربوط به نگارنده است وفقط جهت استفاده ازمنابع اطلاعاتی وبالا بردن سطح علمی شما دراین سایت ارایه گردیده است.
دانلود سمینار کارشناسی ارشد مهندسی برق جداسازی گفتار و موزیک با فرمت PDF تعداد صفحات110
این سمینار جهت ارایه در مقطع کارشناسی ارشد طراحی وتدوین گردیده است وشامل کلیه مباحث مورد نیاز سمینارارشد این رشته می باشد.نمونه های مشابه این عنوان با قیمت های بسیار بالایی در اینترنت به فروش می رسد.گروه تخصصی مااین سمینار رابا قیمت ناچیزی جهت استفاده دانشجویان عزیز در رابطه با منبع اطلاعاتی در اختیار شما قرار می دهد.حق مالکیت معنوی این اثر مربوط به نگارنده است وفقط جهت استفاده ازمنابع اطلاعاتی وبالا بردن سطح علمی شما دراین سایت ارایه گردیده است.
با استفاده از برنامه
تبدیل گفتار به نوشتار صحبت کنید
ترجمه کنید
گوش دهید
ارسال کنید و جستجو نمایید!
این نرم افزار به شما این اجازه را می دهد تا گفتار را به راحتی به نوشتار تبدیل نمایید.
نرم افزار نوشتار را در کلیپ بورد خودش کپی کرده و به راحتی قادر است برای شما سخن بگوید و این نوشته خاص را برایتان بخواند.
تمام ویژگی های یک ترجمه و مترجم نیز در این برنامه وجود دارد.
با نصب این برنامه کاربردی بر روی گوشی اندرویدی خود می توانید به صورت کاملا زنده و آنلاین مطالب را ترجمه کرده و سپس آن را برای دوستان خود ارسال نمایید.
شما می توانید این یادداشت ها را به کلیپ بورد کپی کنید و گوش بدهید.
می توانید این یادداشت ها را با ایمیل، SMS، رسانه های اجتماعی و برنامه های پیام رسان فوری مانند واتساپ، وایبر، اسکایپ و غیره ارسال و اشتراک گذاری کنید.
شما همچنین می توانید از این برنامه برای آموزش حرفه ای زبان نیز استفاده نمایید.
زبان های پشتیبانی شده
زبان های فارسی، انگلیسی، عربی، فرانسوی، اسپانیایی، ایتالیایی، بلغاری، کاتالان، دانمارکی، یونانی، استونیایی، فنلاندی، عبری، هندی، مجاری، اندونزیایی، ژاپنی، هائیتی، کره ای، لیتوانیایی، لتونی، مالایی، نروژی، لهستانی، پرتغالی، رومانیایی، دانمارکی، روسی، اسلواکی، اسلوونیایی، تایلندی، ترکی، اوکراینی، اردو، ویتنامی و چینی نیز پشتیبانی می نماید.
توجه داشته باشید که این برنامه نیاز به اتصال به اینترنت دارد.
فرمت فایل : word(قابل ویرایش)
تعداد صفحات:141
فصل اول مقدمه
مدل اعضای صوتی انسان
-2 مدل منبع – فیلتر گفتار
فصل دوم
Speech analysist
مقدمه:
فریم بندی سیگنال صحبت
فیلتر پیش تأکید
جداسازی سیگنال صحبت از روی سیگنال زمینه
پیدا کردن اولین و آخرین فریم واکهدار
مرحله 4 پیدا کردن نقطة انتهایی و ابتدایی
پیاده سازی الگوریتمها
استخراج ضرائب کپزرم
محاسبة ضرایب دلتاکپترال
پردازش روی فریمهای واکه دار:
روش اول: استفاده از autocorrelation
روش دوم: استفاده از ضرائب کپستروم
پیاده سازی الگوریتمها
فرکانس فرمنت
استخراج فرکانس فرمنت از طریق حل ریشههای LPC
آنالیز پیشگویی خطی (LPC)
مدل تولید صحبت
روش همبستگی
روش کوواریانس
مقایسه روشهای همبستگی و کوواریانس
مرتبه پیشگو
کوانتیزاسیون برداری
الگوریتم LBG
فصل سوم: انحراف پویای زمانی (Dynamic time warpping)
مقدمه:
– هم ترازیسازی زمانی و نرمالیزاسیون
مروری بر Dynamic programing
محدودیتهای نرمالیزاسیون زمانی
محدودیتهای نقطه انتها
شرایط یکنواختی
محدودیت پیوستگی محلی
محدودیت در مسیر سراسری
وزن دهی شیب منحنی
انحراف زمانی پویا (dynamic – lime warping)
فصل چهارم
استفاده از مدلهای مارکف مخفی
در تشخیص گفتار
2-3- مدل مارکف مخفی (HMM) ]21[
مدل کاسه و گلوله
1-2-3- اجزای یک HMM
2-2-3- سه مسئله اساسی در HMM
حل مسئله 1
-1-2-2-3- الگوریتم پیشرو – پسرو
2-2-2-3- حل مسئله 2
3-2-2-3- حل مسئله 3
1-4- الگوریتم بام – ولچ ]21[ و ]11[
-4- مسائل مربوط به پیاده سازی روش ML
الف – مقیاس بندی
ب. دنباله های مشاهده چندتایی
پ. تخمین اولیه پارامترهای HMM
فصل 5: بازشناسی و ارزیابی نحوه بیان کلمات مقطع قرآنی
بازشناسی گفتار بوسیله الگوریتم DTW
تاثیر طول پنجره در کیفیت گفتار جداشده در زمینه
تطابق چندالگویی
روش اول: استفاده در میانگین الگوها:
الگوریتم پیدا کردن کلمة مناسب
فلوچارت مربوط به الگوریتم knn
حذف میانگین ضرایب کپستروم
MEI Scald-MFCC
پیاده سازی
طراحی ساختار مدل مخفی مارکوف
مقدار دهی اولیه Hmm
تخمین بیشترین شباهت
بازشناسی گفتار
بخش دوم لرزیابی نحوة بیان گفتار قرآنی
ارزیابی نحوه بیان گفتار قرآنی بوسیله و تطابق الگو
Log spectral Distance
Weignted cepstral Distance
Cepstral Distance
Distance base on LPC
پیدا کردن منحنی فاصلهها
امتیازدهی به گوینده
استفاده از هر ارزیابی نحوة بیان
استفاده از Hmm در ارزیابی نحوة بیان
فصل اول مقدمه:
صحت و گفتار نقش اساسی در ارتباط انسانها ایفا میکنند و یکی از دلایل پیشرفت انسانها است.
برای برقراری ارتباط کامپیوتر با انسان بوسیلة گفتار در کار لازم است انجام شود. یکی سنتزل گفتار است. و دیگری بازشناسی گفتار، سنتز گفتار بیان گفتار بوسیلة کامپیوتر میباشد و بازشناسی یعنی فهمیدن گفتار در بازشناسی گفتار. هدف بدست آوردن دنبالة آوایی یک گفتار میباشد و این دنبالة آوایی میتواند بر اساس واج، سیلاب، کلمه، جمله و ... باشد. بازشناسی گفتار عکس عمل سنتز است و گفتار را به متن تبدیل میکند. اما انجام بازشناسی گفتار به دلیل خاصیت صدای انسانها، دارای پیچیدگیهای زیادی است. اما اغلب بازشناسی کامل و درست غیر ممکن است. حتی خود انسانها هم نمیتوانند به طور کامل همه صداها را بفهمند و میزان، درک گوش انسانها حدود 70% میباشد. شکل 1-1 ارتباط گفتاری بین انسانها و کامپیوتر را نشان میدهد. به دلیل نقش مهم و کاربردهای فراوانی که بازشناسی گفتار دارد، تحقیقات و مقالههای زیادی در این زمینه انجام شده و راه حلهای متفاوتی پیشنهاد شده است، ولی بازشناسی گفتار کاملاً درست هنوز امکانپذیر نمیباشد.
بازشناسی گفتار دارای کاربردهای زیادی است. از جمله کاربردهای بازشناسی گفتار، حل مشکل تایپ است، با کمک بازشناسی گفتار میتوان جملهها را یکی پس از دیگری خواند و کامپیوتر آنها را تایپ کند. یکی دیگر از کاربردهای بازشناسی گفتار، حل مشکل صحبت دو فرد مختلف همزبان است. یکی از مشکلات انسانها ارتباط با افرادی است که با زبانهای متفاوت صحبت میکنند. ارتباط بدون دانستن زبان مشکل است. و یادگیری یک زبان دیگر کار وقت گیر و پر زحمتی است ولی به کمک بازشناسی گفتار به یادگیری زبانهای مختلف احتیاجی نخواهد بود و میتوان با یک دستگاه کوچک با فردی که با زبان دیگری صحبت میکند، صحبت نمود. یک کامپیوتر کوچک صدای شما را گرفته و به تعدادی از کلمات تبدیل مینماید. سپس این کلمات به زبان دیگر ترجمه شده و در نهایت با زبان جدید گفته میشوند. دو مرحلة آخر این سیستم جزو مسایل انجام شده گفتار هستند و با کامل نمودن مسئله بازشناسی گفتار بدون دانستن زبانهای دیگر به آنها تکلم نمود.
شکل 1-2 نشان دهنده ارتباط دو فرد با زبانهای مختلف است. یکی از کاربردهای دیگر بازشناسی گفتار، برقراری ارتباط با کامپیوتر است. همان گونه که به انسانهای دیگر دسترس میدهید، به کامپیوتر هم میتوان دستور داد و با آن صحبت کرد. یا حتی میتوانید از او بخواهید کاری برایتان انجام دهد.
حتی با کمک بازشناسی گفتار میتوان به انسانهای نابینا و ناشنوا کمک کرد. به طور مثال نابینایان میتوانند با صحبت کردن و دادن دستور به کامپیوتر با آن کار کنند.
از دستاوردهای جدید بازشناسی گفتار و پردازش مدت کاربرد آن در آموزشهای زبان دوم میباشد. بدین ترتیب که با ایجاد سیستمیکه قابلیت آشکارسازی خطای تلفظ بین لهجههای زبان اصلی و لهجة یک فردی که به زبان دوم فرد سخن میگوید، وی را در یادگیری و تصحیح تلفظ و لهجه آن زبان کمک نمیکنند.
بازشناسی گفتار میتواند برای شرایط مختلفی انجام گیرد. هر کدام از این شرایط میتوانند باعث مشکل شدن، پیچیدگی بازشناسی شوند. یکی از این شرایط، وابسته بودن بازشناسی به یک گوینده یا مستقل بودن آن از گوینده است. مستقل بودن از گوینده به معنای آن است که بتوان کار بازشناسی را برای هر فرد انجام داد. از دیگر شرایط بازشناسی گسسته یا پیوسته بودن گفتار است. راحتی بازشناسی گفتار گسسته، داشتن ابتدا و انتهای عصر کلمه یا اساساً خود کلمه یا همان واحد آوایی میباشد. همچنین از دیگر شرایطی که در بازشناسی مطرح است،تعداد واژگان میباشد. یعنی بازشناسی گفتار برای چه تعداد کلمهای صورت میپذیرد.
هدف از انجام پروژة فوق در ابتدا بازشناسی کلمات گسسته قرانی و در مرحلة دوم ارزیابی نحوة بیان و تلفظ کلمات قرآنی میباشد. از آنجائیکه برای مقایسه بین کلمة ادا شده توسط کاربر و صدای استاد باید یک سیستم بهینه وجود داشته باشد. در مرحلة اول سعی میکنیم، سیستم را به حالت بهینه خود برسانیم و سپس پارامترهای این سیستم جهت انجام مرحلة دوم استفاده کنیم.
اما چون در هنگام ارزیابی نحوة بیان کلمه قرآنی، کلمه مورد نظر از قبل مشخص است، بناباین در مرحله دوم احتیاجی به بازشناسی گفتار نمیباشد.
در بخش اول برای بهتر درک کردن مفهوم بازشناسی به بررسی سیستم تولید صوت و شنوایی انسان میپردازیم. سپس وارد مفاهیم بازشناسی گفتار خواهیم شد. در این مرحله روشهای جداسازی سیگنال زمینه از روی سیگنال صحبت مورد بررسی قرار میگیرد. سپس نحوة استخراج ماتری ضرائب کپستروم و در نهایت بازشناسی گفتار بوسیلة الگوریتم انحراف زمانی پویا (DTU) و مدل مخفی مارکوف مورد بررسی قرار میگیرد.
پس از آشنایی با ابزارهای بازشناسی گفتار، نحوة پیاده سازی الگوریتمهای فوق ذکر خواهد شد. بعد از راهاندازی سیستم بازشناسی گفتار کلمات مقطع، بوسیلة الگوریتم DTN مشاهده شد نرخ بازشناسی گفتار پائینی است و حدود %47 میباشد. از این رو در جهت بهبود پارامترهای سیستم و بهینه کردن آن در مراحل بازشناسی و پارامترهای آن تغییراتی داده شد، که به ذکر آنها پرداخته خواهد شد.
پس از بهینه کردن پارامترهای سیستم بازشناسی گفتار و رسانیدن نرخ بازشناسی گفتار به 99% برای 20 کلمه قرآنی الگوریتمهای ارزیابی نحوة بیان بوسیلة روش DTA بحث خواهد شد.
در بخش انتهایی به بررسی مدل مخفی مارکوف خواهیم پرداخت. سپس مراحل پیاده سازی الگوریتم فوق بوسیلة نرم افزار و نکات عملی آن گفته خواهد شد. در نهایت سیستم بازشناسی گفتار کلمات مقطع قرآنی و نحوة پیاده سازی آن مورد بررسی قرار خواهد گرفت و در مرحلة بعدی الگوریتم ارزیابی نحوة بیان بوسیلة ذکر خواهد شد.
تغییر محیط اکوستیکی روی نتیجه بازشناسی اثر خواهد گذاشت. از آنجائیکه سیستم فوق برای نمونههای آزمایشگاهی آموزش داده شده با تغییر محیط اکوستیکی مطمئناً نتایج بازشناسی تغییر خواهد کرد و نمونههای واقعی دارای نوین میکروفن، محیط و همچنین برگشت صدا خواهند بود.
در انتها به بررسی سیستمهای بهبود گفتار خواهیم پرداخت، هدف از این بخش حذف هزینه ورودی از طریق میکروفن و از بین بردن تأثیرهای محیط بر روی سیگنال صدا میباشد.
در این بخش به دو روش اشاره خواهیم: ابتدا روش spectral subtraction
که به میزان یک روش عمدی برای حذف نویز میرود ذکر خواهد شد.
سپس به معرفی یک الگوریتم جدید در حذف نویز میکروفن خواهیم پرداخت.
مدل اعضای صوتی انسان
در شکل (1-2) یک دیاگرام شماتیک از مکانیزم تولید صحبت انسان نشان داده شده است. هنگام صحبت معمولی، قفسه سین با فشار وارد کردن به ششها باعث میشود که هوای فشرده از ششها از طریق حنجره بیرون رانده شود. تارهای صوتی که درست در پشت غدة تیروئید قرار گرفتهاند، اگر تحت تنش قرار گیرند، با عبور هوا مرتعش میشوند و بدین ترتیب هوا نیز متناسب با فرکانس ارتعاش تارهای صوتی مرتعش شده و در این حالت حروف صدادار تولید میگردند.
فرمت فایل : word(قابل ویرایش)
تعداد صفحات:18
۱-۱ : زبان آموزی ۱
۱-۲ : نظریه های زبان آموزی ۲
الف: نظریه شناخت گرایی ۲
ب: نظریه شرطی شدگی رفتار زبانی ۳
ج) نظریه ذاتی، ذهنی بودن زبان: ۶
د) دیگوتسکی و ارتباط اجتماعی ۸
۱-۳٫ مهارت های گفتاری ۱۰
مراحل رشد گفتاری کودک ۱۱
۱-۱-۳٫ مرحله اول: پیش زبانی ۱۱
۱-۲-۳٫ مرحله دو، گفتار تک واژه ای: (Holophrastic speech) ۱۲
۲-۳-۳٫ مرحله سوم، گفتار دو واژه ای یا تلگرافی ۱۳
۱-۴-۳٫ مرحله چهارم، گفتار پیشرفتی ۱۳
۱-۵-۳٫ مرحله پنجم: گفتاری تلفظ صحیح صداها (صداها در گفتار) ۱۴
۱-۴٫ گفتار ثابت ۱۴
۱-۵٫ مهارت شنیداری ۱۵
منابع و مآخذ ۱۸
فصل اول
زبان آموزی ورشد گفتار
1-1 : زبان آموزی
زبان آموزی ورشد گفتار در هشتاد سال گذشته مورد توجه قرار گرفته به ویژه درنیمه دوم قرن بیستم بطور دقیق تر مورد بررسی قرار گرفته است. زبان آموزی کودک به همراه توصیف وبررسی ساخت زبان وچگونگی کارکرد آن مورد توجه زبان شناسان قرار گرفته است. یافته های مربوط به زبان آموزی، مراحل فراگیری زبان، تدوین دستور زبان کودک وارائه ویژگی های همگانی زبان از نتایج مهم این بررسی ها بوده است.
یافته های زبان آموزی همچنین در بررسی چگونگی گسترش مهارت های زبانی نیز وزبان پریشی مورد توجه بوده است به علاوه یافته های یاد شده در زمینه بررسی آموزش زبان دوم وهمچنین زبان خارجی وارائه فرضیه ها وروش های آموزش زبان دوم تأثیر به سزایی داشته است. زبان آموزی هم از لحاظ نظریه های یادگیری وهم از لحاظ بررسی مراحل رشد زبانی قابل توجه است. زبان آموزی درزمانی پس از یک سالگی شروع می شود وتا پنج سالگی تقریباً به حالت ثابت نزدیک می شود. دوره زبان آموزی درحدود 5/3 به طول می انجامد.(مشکوه الدینی، 1376، ص 272) بررسی زبان آموزی به چگونگی رشد مهارت های گفتاری وشنیداری را مشخص می سازد . از یافته های موضوع می توان درآموزش مهارت های زبان استفاده کرد. کودک تا پیش از سواد آموزی قادر است از زبان بطور مناسب دربرقراری ارتباط زبانی استفاده نماید. بعلاوه هر سخنگوی زبان علاوه برقواعد دستوری ، قواعد کاربردی زبان را نیز به تدریج می آموزد؛ یعنی از طریق تعامل با محیط واطرافیان اصول کاربرد شناختی زبان را نیز فرامی گیرد.زبان آموزی تنها به توانایی های آوایی، واژگانی، دستوری وسبکی محدود نمی شود؛ بلکه به ویژگی های کاربردی زبان نیزشامل می گردد. البته دانش زبانی کودک ناخودآگاه است بکارگیری وقضاوت ناخود آگاه زبان توسط کودک شم زبانی نامیده می شود.
نتیجه تسلط کودک برمهارت های زبانی کسب توانایی به کارگیری زبان است . درصورتی که کودک توانایی زبان را داشته باشد نه تنها دانش ومهارت های زبانی وارتباطی خود را بکار می برد بلکه خواهد توانست درآینده نیز براین خلاقیت زبانی تکیه کند .
به نظر انسترون وبلیایف زبان آموزی برافزایش وتقویت توانش زبانی، توانش ارتباطی، خلاقیت زبانی، تفکر درباره زبان وهمچنین مهارت های آمادگی خواندن ونوشتن درآینده تأثیر می گذارد (بلیایف ، 1368 ،ص77) .
1-2 : نظریه های زبان آموزی
الف: نظریه شناخت گرایی
پیاژه، روانشناس بزرگ سویسی، به اصل شناخت دریادگیر ی کودک توجه داشت. از این رو به پدیده زبان آموزی علاقه مند نبود. او زبان را به عنوان منبعی برای داده های لازم جهت بررسی چگونگی رشد شناخت درنظر می گرفت. به نظر او زبان آموزی یک پدیده ثانویه است که دردرون شناخت طبیعی کودک از محیط خود، شکل می گیرد. از این رو پیاژه زبان آموزی را وابسته به شناخت می دانست. وقتی زبان را به عنوان مجرایی برای ایجاد ارتباط میان کودک و محیط اجتماعی او در نظر گرفته است . پیاژه معتقد بودکه ذهن کودک برای کسب شناخت، از جهان اطراف همواره فعال است واز این لحاط ، اطلاعاتی از راه زبان توسط افراد محیط به او می رسد؛ به گسترش شناخت او چندان کمک نمی کند. او رشد زبان کودک را ناشی از رشد شناختی واجتماعی او می دانست. با این حال ، پیاژه این فرض را که تنها رشد شناختی برای رشد زبان آموزی کافی باشد انکار می کند. به عقیده او میزان مناسبی از رشد شناختی برای رشد زبانی لازم است، با این حال تنها رشد شناختی را برای زبان آموزی کافی نمی داند ، بلکه برخی فرآیندهای دیگر را نیز ضروری می داند.( مشکوه الدینی ، 1376، ص274)
مهمترین نظریه های یادگیری مبتنی بر شناخت گرایی عبارتند از: نظریه یادگیری گشتالت گرایان ، نظریه معنا دار دیوید آزوبل، نظریه پردازش اطلاعات، نظریه شناختی پیاژه ونظریه شناختی بروند.