تأثیر ترکیب روش‌های انتخاب ویژگی فیلتر و بسته‌بندی در بهبود پیش‌بینی اشکال نرم‌افزار

نویسندگان

دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر

چکیده

حفظ کیفیت محصول نرم‌افزاری با آزمون‌های دوره‌ای قبل از نصب، یکی از پرهزینه‌ترین فعالیت‌ها در پروژه‌های فناوری اطلاعات است. با توجه به منابع محدود برای آزمون ماژول‌ها در پروژه‌های نرم‌افزاری، بهتر است ابتدا ماژول‌های مستعد اشکال شناسایی شوند و منابع آزمون در جهت شناسایی اشکال در این ماژول‌ها متمرکز گردند. پیش‌بینی‌کننده‌های اشکال مبتنی بر الگوریتم‌های یادگیری ماشین، ابزارهای مقرون‌به‌صرفه‌ای برای شناسایی ماژول‌های مستعد اشکال هستند. پژوهش‌های گسترده‌ای در این حوزه برای یافتن ارتباط بین ویژگی‌های ماژول‌های نرم‌افزاری و مستعد اشکال بودن آن‌ها صورت پذیرفته است. برخی از این ویژگی‌ها در الگوریتم‌های پیش‌بینی‌کننده به‌گونه‌ای هستند که نه‌تنها سبب بهبود دقت در فرآیند یادگیری نمی‌شوند بلکه کاهش دقت را نیز در پی خواهند داشت. در این پژوهش با توجه به عملکرد خوب روش انتخاب ویژگی روبه‌جلو در انتخاب ویژگی‌های مؤثر، زیرمجموعه اولیه در این روش با استفاده از تلفیق ویژگی‌های با رتبه بالا در روش‌های مختلف فیلتر انتخاب می‌شود. روش پیشنهادی علاوه‌بر بهبود دقت سبب افزایش سرعت همگرایی در انتخاب ویژگی می‌شود. نتایج حاصل از پیاده‌سازی و ارزیابی نتایج تجربی به‌دست‌آمده در دادگان ناسا با معیار AUC، بیانگر مؤثر بودن روش پیشنهادی در بهبود دقت و سرعت پیش‌بینی ماژول‌های نرم‌افزاری مستعد اشکال است.

کلیدواژه‌ها


عنوان مقاله [English]

The Effectiveness of the Combination of Filter and Wrapper Feature Selection Methods to Improve Software Fault Prediction

نویسندگان [English]

  • F. Alighardashi
  • M. A. Zare Chahooki
Faculty of Electrical and Computer Engineering, University of Yazd, Yazd, Iran
چکیده [English]

Improving the software product quality before releasing by periodic tests is one of the most expensive activities in software projects. Due to limited resources to test modules in software projects, it is important to identify fault-prone modules and use the test sources for fault prediction in these modules. Software fault predictors based on machine learning algorithms, are effective tools for identifying fault-prone modules. Extensive studies are being done in this field to find the connection between features of software modules, and fault-prone have been done. Some of these features in predictive algorithms are like that not only did not improve the accuracy of the learning process, but also will be reduced the accuracy. In this study, due to the excellent performance of Forward Feature Selection (FS) method for effective selection of features, the initial subset of this method has been selected by using of combination of high ranking features in different Filter methods. The proposed method causes increment the speed of the convergence of feature selection as well as the accuracy improvement. The obtained results on NASA dataset with AUC criteria, indicates the effectiveness of this method in the improvement of the accuracy and the speed of software fault prediction.

کلیدواژه‌ها [English]

  • Software fault prediction
  • machine learning
  • feature selection
  • Filter
  • wrapper