فایل شناسايي گفتار با مدل سازي فازي - هوش مصنوعی

دسته بندي : کالاهای دیجیتال » رشته کامپیوتر و IT (آموزش_و_پژوهش)
دانلود پایان نامه شناسايي گفتار با مدل سازي فازي - هوش مصنوعی


خلاصه و فهرست کلی:


چکيده

پردازش و شناسايي گفتار انسان، يکي از شاخه هاي هوش مصنوعي است که به دليل کابردهاي فراوان در توليد واسط هاي کاربر هوشمند توجه پژوهشگران بسياري را به خود جلب نموده است. اما عليرغم وجود روشهاي بسياري براي انجام اين کار، به دليل حساسيت زياد بسياري از روش ها ..

 

مقدمه

هنگامي که از هوش مصنوعي سخن مي گوييم، شايد به تجريد موجودي ساخته دست بشر مي پردازيم که توانايي هاي او را به ارث مي برد و خود را همرده خالق خود مي انگارد. هرچند که شايد هرگز نتوان به چنين موجودي مفهوم خودآگاهي را فهماند ..

 

1-1) مساله شناسايي الگو

شناسايي الگو شاخه اي از هوش مصنوعي است که به طبقه بندي يا توصيف مشاهدات مربوط مي شود. هدف شناسايي الگو، طبقه بندي داده ها (الگوها) بر اساس يک دانش قبلي يا اطلاعات آماري استخراج شده از الگوهاست. الگوهايي که مورد طبقه بندي قرار مي گيرند ..

 

1-1) مساله شناسايي گفتار

حال که ديدي کلي بر مساله مورد بحث يافتيم، در اين بخش نشان مي دهيم که چگونه اين مساله را به يک کاربرد عملي تبديل مي کنيم. سپس در فصول بعدي روش شناسايي را تشريح مي کنيم. با اين همه بايد توجه کرد که اين کار ضربه اي به عموميت مساله وارد نمي کند ..

 

فهرست مطالب

 چکيده

تشکر و قدرداني

فهرست مطالب

فهرست اشکال

فهرست جداول

مقدمه

1) فصل اول: تعريف مساله

1-1) ديد عمومي

1-2) مساله شناسايي الگو

1-3) مساله شناسايي گفتار

1-3-1) شناسايي گفتار

1-3-2) تاريخچه تحقيق در شناسايي گفتار

1-3-3) شناسايي آوا با مدل سازي فازي

1-3-4) شناسايي کلمات

1-4) پياده سازي

1-4-1) معرفي نرم افزار

1-4-2) مجموعه داده ها

1-5) نتيجه گيري

2) فصل دوم: دريافت، ذخيره سازي و پيش پردازش

2-1) دريافت و ذخيره سازي

2-1-1) سيگنالهاي صوتي

2-1-2) سيستم شنيداري انسان

2-1-3) اسپکتروگرام

2-1-4) پياده سازي

2-2) پيش پردازش

2-2-1) طراحي اسپکتروگرام

2-2-2) نحوه توزيع مقادير در اسپکتروگرام

2-2-3) الگوريتم نرماليزه کردن اسپکتروگرام

2-2-4) کوانتيزه کردن اسپکتروگرام

2-2-5) پياده سازي

2-3) نتيجه گيري

3) فصل سوم: روش پيشنهادي شناسايي گفتار

3-1) ايده اوليه

3-1-1)       ميانگين گيري و مزاياي آن

3-1-2)      معيار فازي

3-1-3)      فرضيات مساله شناسايي

3-2) الگوريتم پيشنهادي

3-2-1)      هدف و رويکرد الگوريتم

3-2-2)      الگوريتم ميانگين گيري چند لايه اي

3-2-3)     شرح الگوريتم

3-2-4)     پياده سازي

3-3) نتيجه گيري

4) فصل چهارم: بررسي و نتايج آزمايش سيستم

4-1) پيچيدگي الگوريتم

4-1-1)       پيچيدگي محاسباتي مرحله آموزش

4-1-2)      پيچيدگي محاسباتي مرحله شناسايي

4-1-3)      پيچيدگي حافظه اي

4-2) نتايج عملي

4-2-1)      نويز سفيد

4-2-2)      نويز همهمه

4-2-3)     نتايج

4-3) جمع بندي و نتيجه گيري

فهرست منابع

پيوست

Abstract

فهرست اشکال

شکل ‏1‑1: اسپکتروگرام يک جمله

شکل ‏1‑2: اسپکتروگرام بعد از کوانتيزه کردن

شکل ‏1‑3: رنگهاي فازي. محور افقي شدت و محور عمودي درجه اعتقاد را بيان مي کند

شکل ‏1‑4: پيدا کردن درجه تعلق يک فريم به يک آوا

شکل ‏1‑5: محاسبه نهايي مقدار تطابق

شکل ‏1‑6: تصويري از نرم افزار طراحي شده

شکل ‏1‑7: منوي File نرم افزار

شکل ‏1‑8: پنجره ايجاد مجموعه داده اي

شکل ‏1‑9: پنجره باز کردن يک مجموعه داده اي

شکل ‏2‑1: شکل موج سيگنال صوتي قسمتي از کلمه Compute

شکل ‏2‑2: شکل موج 4 ميلي ثانيه از کلمه Compute با جزييات – نمايانگر ذات گسسته سيگنال

شکل ‏2‑3: تکرار شکل 2-1

شکل ‏2‑4: مدل فيزيولوژيکي گوش انسان

شکل ‏2‑5: گوش انسان و نحوه ارسال فرکانسها به مغز

شکل ‏2‑6: نمايش شکل موجي و اسپکتروم يک سيگنال گفتاري

شکل ‏2‑7: منوي Voice Base نرم افزار

شکل ‏2‑8: پنجره پيش پردازشي براي اضافه کردن نمونه صوتي

شکل ‏2‑9: منوي Configuration نرم افزار

شکل ‏2‑10: پنجره تنظيم پارامترهاي دريافت فايل

شکل ‏2‑11: پنجره تنظيم پارامترهاي خروجي صوتي

شکل ‏2‑12: هيستوگرام مقادير فرکانسي

شکل ‏2‑13: توابع نگاشت سطح خاکستري

شکل ‏2‑14: مقايسه هيستوگرام فراواني يک سيگنال دلخواه با ضرائب خطي مختلف

شکل ‏2‑15: هيستوگرام فراواني نسبي شکل 2-12

شکل ‏2‑16: تابع تبديل ساخته شده براي هيستوگرامهاي شکل 2-14

شکل ‏2‑17: اسپکتروگرام کلمه "شمشير" بعد از نرمال شدن با ضريب نرمال سازي 1

شکل ‏2‑18: اسپکتروگرام کلمه "شمشير" بعد از نرمال شدن با ضريب نرمال سازي 5

شکل ‏2‑19: تقسيم فرکانسي اسپکتروگرام کلمه "مسابقه"

شکل ‏2‑20: پنجره پيش پردازشي براي ويرايش

شکل ‏2‑21: پنجره پيش پردازشي به همراه نوارهاي فرکانسي و زماني

شکل ‏2‑22: پنجره تنظيمات پيش پردازشي کلي سيستم

شکل ‏3‑1: فيلتر ميانگين گيري تصويري

شکل ‏3‑2: تصوير يک مدار الکترونيکي

شکل ‏3‑3: تصوير مدار الکترونيکي شکل 3-2 همراه با نويز

شکل ‏3‑4: مدار شکل 3-2 بعد از اعمال ميانگين گيري

شکل ‏3‑5: مدار شکل 3-3 بعد از اعمال ميانگين گيري

شکل ‏3‑6: يک مثال براي نشان دادن خاصيت ميانگين گيري در حذف نمونه هاي غير مشابه

شکل ‏3‑7: نمونه هاي آموزشي مثال شکل 3-6 بعد از ميانگين گيري

شکل ‏3‑8: ميانگين نمونه آزمايشي

شکل ‏3‑9: مقايسه نمونه ها در مرحله اول

شکل ‏3‑10: مقايسه نمونه ها در مرحله دوم

شکل ‏3‑11: تعريف عدد فازي به صورت توابع مثلثي، ذوزنقه اي و زنگوله اي

شکل ‏3‑12: مثال الگوريتم روش اول براي سه نمونه تطابقي با معيار نزديکي تفاضلي

شکل ‏3‑13: تعريف تابع عضويت عدد فازي A با شکل ذوزنقه اي

شکل ‏3‑14: پنجره Settings از منوي Configuration.

شکل ‏3‑15: پنجره Settings با تابع عضويت زنگوله اي

شکل ‏3‑16: منوي Recognition نرم افزار

شکل ‏3‑17: صحفه اصلي نرم افزار بعد از شناسايي نمونه صوتي آزمايشي کلمه "ثروتمند"

شکل ‏3‑18: پنجره About

شکل ‏4‑1: اسپکتروگرام نويز سفيد

شکل ‏4‑2: اسپکتروگرام نويز همهمه

شکل ‏4‑3: تاثير نويز همهمه در باندهاي مختلف فرکانسي

دسته بندی: کالاهای دیجیتال » رشته کامپیوتر و IT (آموزش_و_پژوهش)

تعداد مشاهده: 6405 مشاهده

فرمت فایل دانلودی:

فرمت فایل اصلی: docx

تعداد صفحات: 120

حجم فایل:2,833 کیلوبایت

 قیمت: 140,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل