%0 Journal Article %T ارائه روشی برای استخراج خودکار عبارات کلیدی از اخبار وب پارسی %J مجله مهندسی برق دانشگاه تبریز %I رئیس دانشکده مهندسی برق و کامپیوتر %Z 2008-7799 %A باسره, مریم %A درهمی, ولی %A ظریف‌زاده, سجاد %D 2017 %\ 11/22/2017 %V 47 %N 3 %P 857-866 %! ارائه روشی برای استخراج خودکار عبارات کلیدی از اخبار وب پارسی %K عبارات کلیدی %K استخراج عبارات کلیدی %K اسناد خبری %K شیوه‌های آماری %K یادگیری با ناظر %K متن‌کاوی %K بازیابی اطلاعات %R %X دادگان متنی و از آن جمله متون خبری از حوزه‌های مهم بازیابی اطلاعات به شمار می‌رود و استخراج اطلاعات از آن‌ها ضروری است. این امر با استخراج عبارات کلیدی اسناد که دربردارنده محتوای اصلی متن است، صورت می‌گیرد. در این پژوهش، راهکاری سه مرحله‌ای جهت استخراج عبارات کلیدی از صفحات خبری وب پارسی، با ترکیب شیوه‌های زبان‌شناختی، یادگیری با ناظر، ابتکاری و تعداد نسبتاً جامعی از شیوه‌های آماری ارائه می‌شود. همچنین، یک مجموعه داده خبری و لیستی از عبارات توقفی خبری ایجاد می‌گردد. در پژوهش حاضر، با توجه به ویژگی‌های دادگان، از دسته‌بند جنگل تصادفی استفاده و عملکرد خوب آن به کمک نتایج آزمایش‌ها ثابت می‌شود. به علاوه، استفاده از امتیاز تعلق‌گرفته به عبارات توسط دسته‌بند، جهت ایجاد لیستی مرتب از عبارات برای دسته‌بندی، به جای استفاده ازخروجی دسته‌بند، پیشنهاد می‌شود. نتایج، نشان‌دهنده دقت قابل‌قبول سیستم ارائه‌شده است. %U https://tjee.tabrizu.ac.ir/article_6219_4f33a58972c07a79ba33e22812c65f5f.pdf