تشخیص هجاهای شنیداری از طریق تحلیل پاسخ‌های مغزی نوزادان نارس و کامل با ترکیب BiLSTM و CNN

نوع مقاله : علمی-پژوهشی

نویسندگان

1 دانشجوی دکترا-مهندسی پزشکی (دانشکده مهندسی)-دانشگاه فردوسی مشهد

2 دانشیار گروه مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران

3 استادیار-دانشکده برق و کامپیوتر- دانشگاه تربیت مدرس- تهران- ایران

چکیده

پس از هفته 28 بارداری، نوزادان نارس به محرک‌های شنیداری واکنش نشان می‌دهند. بررسی پاسخ‌های مغزی نوزادان به محرک‌های شنیداری بینش‌های جدیدی در مورد توانایی‌های یادگیری آن‌ها ارائه می‌کند. پاسخ الکتروواسفالوگرام (EEG) 15 نوزاد سالم و کامل‌ (۷ پسر و ۸ دختر) با میانگین سن بارداری ۳۹.۸ هفته (±۱.۲) و 14 نوزاد نارس (۱۱ پسر و ۳ دختر) با میانگین سن بارداری ۳۰.۱ هفته (±۱.۲) که به محرک‌های شنیداری (هجا‌های تکراری و متناوب) گوش می‌دادند، مورد بررسی قرار گرفت. برای پاسخ به این سوال که آیا نوزادان نارس و کامل قادر به تفکیک هجاها (ba یا (ga هستند، از یادگیری عمیق از جمله شبکه عصبی درهم‌پیچش (CNN) و شبکه حافظه بلند مدت کوتاه مدت دوطرفه (BiLSTM) برای دو پروتکل تکراری و متناوب استفاده شد. نتایج نشان می‌دهد که نوزادان نارس و کامل هر دو قادر به تفکیک هجا در محرک شنیداری تکراری و متناوب هستند و شبکه CNN به دقت بالاتری نسبت به BiLSTM در هر دو گروه سنی دست یافت. در روش پیشنهادی (ترکیب BiLSTM و CNN)، پاسخ EEG نوزادان نارس و کامل به محرک‌ شنیداری تکراری به ترتیب به صحت 0.855 و 0.892 و به محرک شنیداری متناوب به ترتیب به صحت 0.826 و 0.859رسیدند. روش‌های یادگیری عمیق بدون نیاز به استخراج ویژگی و با مجموعه داده محدود قادر به تفکیک هجاها بودند و پیچیدگی پروتکل متناوب نسبت به تکراری در پاسخ تفاوتی ایجاد نکرد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Detection of Auditory Syllables Through the Analysis of Brain Responses in Preterm and Full-term Infants using a Fusion of BiLSTM and CNN

نویسندگان [English]

  • Mandana Sadat Ghafourian 1
  • javad safaie 2
  • Amin Ramezani 3
1 PhD Student, Biomedical Engineering ,Faculty of Engineering, Ferdowsi University of Mashhad
2 Electrical Engineering Department, Faculty of Engineering, Ferdowsi University of Mashhad, Mashhad, Iran
3 Control Eng. Department, School of Electrical and Computer Engineering, Tarbiat Modares University (TMU), Tehran
چکیده [English]

After the 28th week of pregnancy, preterm infants respond to auditory stimuli. Examining the brain responses of infants to auditory stimuli provides new insights into their learning abilities. The electroencephalogram (EEG) responses of 15 healthy full-term infants (7 boys and 8 girls) with an average gestational age of 39.8 weeks (±1.2) and 14 preterm infants (11 boys and 3 girls) with an average gestational age of 30.1 weeks (±1.2) who listened to auditory stimuli (repetitive and alternating syllables) were analyzed. To determine whether preterm and full-term infants can differentiate between syllables (ba or ga), deep learning techniques, including Convolutional Neural Networks (CNN) and Bidirectional Long Short-Term Memory (BiLSTM) networks, were employed for both the repetitive and alternating protocols. The results indicate that both preterm and full-term infants are capable of distinguishing syllables in both repetitive and alternating auditory stimuli, with the CNN achieving higher accuracy than BiLSTM in both age groups. In the proposed method (combination of BiLSTM and CNN), the EEG responses of preterm and full-term infants to repetitive auditory stimuli reached accuracies of 0.855 and 0.892, respectively, while for alternating auditory stimuli, the accuracies were 0.826 and 0.859, respectively. deep learning methods demonstrated the ability to differentiate syllables without the need for feature extraction, even with a limited dataset, and the complexity of the alternating protocol did not significantly affect the responses compared to the repetitive protocol.

کلیدواژه‌ها [English]

  • Neonate
  • convolutional neural networks (CNN)
  • electroencephalogram (EEG)
  • bidirectional long short-term memory (BiLSTM)
  • auditory stimuli
  • syllable