@article { author = {Hadjahmadi, A. and Homayounpour, M. M.}, title = {A Two Phase Speech Enhancement Based on Deep Denoising Autoencoder}, journal = {TABRIZ JOURNAL OF ELECTRICAL ENGINEERING}, volume = {50}, number = {4}, pages = {1533-1540}, year = {2021}, publisher = {Faculty of Electrical & Computer Engineering}, issn = {2008-7799}, eissn = {2538-3051}, doi = {}, abstract = {The short-and the long-term information in speech signal are useful for speech enhancement, especially if the speech signal is corrupted by both stationary and non-stationary noises. This paper proposes a new approach to provide long-term speech input for a deep denoising autoencoder by reducing the number of frequency sub-bands of the input data. This paper also proposes a two phase speech enhancement approach. The first phase performs short-term speech enhancement by using a deep denoising autoencoder. In the second phase, long-term speech enhancement denoising autoencoder is applied on the output of short-term enhanced speech data. The proposed models were evaluated on the Aurora-2 Speech recognition corpus and our results show significant improvements of 0.3 in PESQ score at lower SNR values. The proposed models were evaluated on the recognition task where the proposed method results in 4% reduction in word error rate for the multi-condition training when compared to the baseline MFCC front-end.}, keywords = {speech enhancement,denoising autoencoder,deep autoencoder,noise removal}, title_fa = {بهسازی گفتار دو مرحله‏ای توسط خودرمزگذار عمیق کاهنده نویز}, abstract_fa = {برای حذف نویز از سیگنال گفتار، هم اطلاعات زمان‏کوتاه و هم اطلاعات زمان‏بلند سیگنال می‏توانند مفید باشند. خصوصا اگر نویز دارای ویژگی‏های غیرایستان باشد. لذا در این مقاله سعی شده است تا با استفاده از کاهش تعداد زیرباندهای فرکانسی در فواصل زمانی بلند امکان اعمال ورودی‏های زمان‏بلند را برای شبکه عصبی خودرمزگذار عمیق کاهنده نویز فراهم سازد. همچنین یک روش دو مرحله‏ای بهسازی گفتار ارائه می‏شود که در مرحله نخست بهسازی زمان‏کوتاه و در مرحله دوم بهسازی زمان‏بلند را انجام دهد. آزمایش‏های این مقاله بر روی مجموعه دادگان  Aurora-2 انجام شده است. نتایج نشان داده است که روش پیشنهادی می‌تواند از نظر بهسازی گفتار و معیار PESQ نسبت به فیلتر وینر در شرایط آغشتگی به نویز بالا به‏ میزان  0.3 بهبود ایجاد کند. همچنین روش پیشنهادی می‌تواند از نظر دقت بازشناسی خودکار گفتار نسبت به ویژگی‏های مبنا یعنی MFCC  حدود 4% بهبود ایجاد کند}, keywords_fa = {بهسازی گفتار,خودرمزگذار عمیق کاهنده نویز,رمزگذار عمیق,کاهش نویز}, url = {https://tjee.tabrizu.ac.ir/article_12564.html}, eprint = {https://tjee.tabrizu.ac.ir/article_12564_ae53f59f15d655e385006ae5c7630f87.pdf} }