<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ArticleSet PUBLIC "-//NLM//DTD PubMed 2.7//EN" "https://dtd.nlm.nih.gov/ncbi/pubmed/in/PubMed.dtd">
<ArticleSet>
<Article>
<Journal>
				<PublisherName>رئیس دانشکده مهندسی برق و کامپیوتر</PublisherName>
				<JournalTitle>مجله مهندسی برق دانشگاه تبریز</JournalTitle>
				<Issn>2008-7799</Issn>
				<Volume>49</Volume>
				<Issue>3</Issue>
				<PubDate PubStatus="epublish">
					<Year>2019</Year>
					<Month>12</Month>
					<Day>01</Day>
				</PubDate>
			</Journal>
<ArticleTitle>Robust sub-band speech feature extraction using multiresolution convolutional neural networks</ArticleTitle>
<VernacularTitle>استخراج ویژگی‌های مقاوم گفتاری زیر باندی با استفاده از شبکه‌های درهم‌پیچش چند دقتی</VernacularTitle>
			<FirstPage>1393</FirstPage>
			<LastPage>1404</LastPage>
			<ELocationID EIdType="pii">9661</ELocationID>
			
			
			<Language>FA</Language>
<AuthorList>
<Author>
					<FirstName>نوید</FirstName>
					<LastName>نادری</LastName>
<Affiliation>دانشکده مهندسی کامپیوتر - دانشگاه صنعتی خواجه‌نصیرالدین طوسی</Affiliation>

</Author>
<Author>
					<FirstName>بابک</FirstName>
					<LastName>ناصر شریف</LastName>
<Affiliation>دانشکده مهندسی کامپیوتر - دانشگاه صنعتی خواجه‌نصیرالدین طوسی</Affiliation>

</Author>
</AuthorList>
				<PublicationType>Journal Article</PublicationType>
			<History>
				<PubDate PubStatus="received">
					<Year>2017</Year>
					<Month>05</Month>
					<Day>31</Day>
				</PubDate>
			</History>
		<Abstract>Convolutional neural networks (CNNs), as a kind of deep neural networks, have been recently used for acoustic modeling and feature extraction along with acoustic modeling in speech recognition systems. In this paper, we propose to use CNN for robust feature extraction from the noisy speech spectrum. In the proposed manner, CNN inputs are noisy speech spectrum and its targets are denoised logarithm of Mel filter bank energies (LMFBs). Consequently, CNN extracts robust features from speech spectrum. The drawback of CNN in the proposed method is its fixed frequency resolution. Thus, we propose to use multiple CNNs with different convolution filter sizes to provide different frequency resolutions for feature extraction from the speech spectrum. We named this method as Multiresolution CNN (MRCNN). Recognition accuracy on Aurora 2 database, shows that CNNs outperform deep belief networks such that, CNN recognition accuracy has 20% relative improvement on average over DBN. However, results show that MRCNN recognition accuracy has 1% relative improvement on average over CNN.</Abstract>
			<OtherAbstract Language="FA">شبکه‌های عصبی درهم‌پیچش (CNN) به‌عنوان گروهی از شبکه‌های عصبی عمیق، در سال‌های اخیر کاربرد فراوانی در مدل‌سازی آکوستیک و همچنین استخراج ویژگی و مدل‌سازی توأم در بازشناسی گفتار یافته‌اند. در مقاله حاضر، پیشنهاد می‌شود تا از CNN برای استخراج ویژگی مقاوم به نویز استفاده شود، درحالی‌که ورودی CNN طیف سیگنال گفتار نویزی و خروجی هدف آن خروجی‌های متناظر تمیز از بانک فیلتر مل است. به‌این‌ترتیب CNN ویژگی‌های مقاوم به نویز را از طیف سیگنال گفتار استخراج می‌نماید. نقطه‌ضعف CNN در این روش آن است که تنها یک وضوح فرکانسی ثابت را به کار می‌گیرد. ازاین‌جهت، در این مقاله استفاده از چند شبکه عصبی درهم‌پیچش با اندازه‌های فیلتر درهم‌پیچش متفاوت، جهت مدل‌سازی تفاوت وضوح فرکانسی برای استخراج ویژگی از طیف سیگنال گفتار پیشنهاد می‌شود. روش پیشنهادی را شبکه عصبی درهم‌پیچش چند دقتی (MRCNN) نام‌گذاری کرده‌ایم. آزمایش‌ها روی دادگان Aurora2 نشان می‌دهند که CNN نسبت به شبکه باور عمیق در استخراج ویژگی مقاوم به نویز میانگین دقت بازشناسی را 20 درصد بهبود می‌دهد. همچنین نتایج نشان می‌دهند که MRCNN میانگین دقت بازشناسی را نسبت به شبکه عصبی درهم‌پیچش استاندارد (تک دقتی) 1 درصد بهبود می‌دهد.</OtherAbstract>
		<ObjectList>
			<Object Type="keyword">
			<Param Name="value">شبکه عصبی درهم پیچش</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">بازشناسی مقاوم گفتار</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">تک دقتی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">چند دقتی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">بانک فیلتر مل</Param>
			</Object>
		</ObjectList>
<ArchiveCopySource DocType="pdf">https://tjee.tabrizu.ac.ir/article_9661_92f39258c4734f2931dc248bdc985911.pdf</ArchiveCopySource>
</Article>
</ArticleSet>
