طبقه‌بندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن

نویسندگان

دانشگاه بیرجند - دانشکده مهندسی برق و کامپیوتر

چکیده

این مقاله مسئله طبقه‌بندی شورایی را برای تصدیق گوینده مستقل از متن بررسی می‌کند. ازآنجاکه ممکن است یک طبقه‌بند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقه‌بند برای تصدیق گوینده ممکن است منجر به تصمیم قابل‌اعتمادی نشود. بنابراین بهترین سامانه‌های تصدیق گوینده از مجموعه‌ای از طبقه‌بندهای مکمل برای رسیدن به تصمیمات قابل‌اعتماد استفاده می‌کنند. در اکثر مطالعات اخیر که روی ترکیب طبقه‌بندها برای تصدیق گوینده انجام شده است، ترکیب خطی وزن‌داری از امتیاز طبقه‌بندهای خبره پایه برای رسیدن به امتیاز نهایی تصدیق استفاده می‌شود که وزن‌های این ترکیب با استفاده از روشی مانند رگرسیون لجستیک و در زمان آموزش به دست می‌آیند. در این تحقیقات مسائلی از قبیل همبستگی بین طبقه‌بندها و برتری برخی طبقه‌بندها برای برخی داده آزمون به‌خوبی در نظر گرفته نشده است. در این مقاله با استفاده از فرایند طراحی شورا و قاعده ترکیب بر اساس داده آزمون برای هر دو مسئله راه‌حلی ارائه می‌شود. بررسی‌های انجام‌شده ما روی دادگان ارزیابی تصدیق گوینده NIST 2004 نشان می‌دهد روش پیشنهادی در مقایسه با روش مبنای ترکیب تنک طبقه‌بندها کارایی مناسبی را دارد.

کلیدواژه‌ها


عنوان مقاله [English]

Adaptive Ensemble Classification for Speaker Verification

نویسندگان [English]

  • M. Hasheminejad
  • H. Farsi
  • N. Mehrshad
Faculty of Electrical and Computer Engineering, University of Birjand, Khorasan Jonoobi, Iran
چکیده [English]

This paper considers the ensemble classification for the text independent speaker verification issue. Using one classifier for the speaker verification may not result in dependable decision, because it may not exploit different characteristics of speech signal. Therefore, state-of-the-art speaker verification systems use an ensemble of classifiers for the verification. Most of the ensemble speaker verification systems use a weighted summation of the score of the individual expert classifiers to calculate the final score of the verification. The weights of this score fusion is obtained using a method, e.g. logistic regression, in the training phase. These works do not efficiently take into account issues such as correlation of classifiers and instance specific behavior of the base classifiers into account. In this paper a new solution is proposed for these two issues by using the process of ensemble design and combination rule based on training data. The obtained results on NIST 2004 speaker evaluation corpus show the effectiveness of the proposed methods in comparison to the sparse classifier fusion, as a baseline method.

کلیدواژه‌ها [English]

  • Speaker recognition
  • speaker verification
  • ensemble classification
  • adaptive ensemble classification
  • Logistic Regression