بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی

نویسندگان

1 عضو هیئت علمی دانشگاه تبریز

2 دانشجوی دکترا

3 فارغ التحصیل کارشناسی ارشد

چکیده

چکیده: در این مقاله، سیستم­های جدیدی به­منظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام MESSL ارائه می­شود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم EM، مدل­های گوسی پارامترهای اختلاف فاز درون­گوشی (IPD) و اختلاف شدت درون­گوشی (ILD) به ­دست می­آیند. سپس، با استفاده از مدل به­دست­آمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمان­کوتاه (STFT) سیگنال مخلوط، سیگنال هدف جدا می‌شود. به­علت عملکرد ناقص سیستم در امر جداسازی، دو سیستم پس­پردازش به­منظور حذف سیگنال‌های ناخواسته از سیگنال هدف، پیشنهاد می­شود. روش پیشنهادی اول حذف وفقی نویز با استفاده از بهینه­سازی ازدحام ذرات بر مبنای یادگیری (LPSO) است. سیستم پس­پردازش پیشنهادی دوم شامل دو مرحله است. در مرحله اول این سیستم، از روش حذف نویز تبدیل موجک  به­منظور حذف بخش اعظم سیگنال تداخل استفاده می­شود. در مرحـله دوم، روش حداقل میانگین مربعات خطا (MMSE) جهت ارتقاء هرچه بیش­تر کیفیـت سیگنال هدف جدا­شده به کار می­رود. ارزیابی و مقایسه سیستم­های پیشنهادی برای دادگان فارسی نشان ­می­دهد که سیستم پیشنهادی دوم در بهبود کیفیت سیگنال هدف جداشده خوب عمل می­کند و از نظر محاسباتی نیز کارآمد است.

کلیدواژه‌ها