بهبود تشخیص تصاویر اندوسکوپی کپسولی با استفاده از شبکه عصبی YOLO

نوع مقاله : علمی-پژوهشی

نویسندگان

1 دانشکده مهندسی کامپیوتر دانشگاه سجاد- مشهد-ایران

2 دانشکده مهندسی کامپیوتر، دانشگاه سجاد- مشهد- ایران

3 عضو هیات علمی / دانشگاه سجاد

چکیده

فناوری اندوسکوپی کپسولی (CE) توسعه سریعی را تجربه می کند. این پیشرفت وابسته به سهولت استفاده، طول عمر بالای باتری، و کیفیت خوب تصاویر است. اگرچه وضوح دنباله‌های تصاویر این تکنیک درحال رشد است، شناسایی محتوای مورد علاقه در آن نیازمند صرف زمان و تلاش زیادی است. برای این مورد، روشی جدید در این مقاله ارایه شده است که مبتنی بر معماری شبکه عصبی متداول (YOLO v5) بوده و توسط آن مکان و برچسب توده‌ها برروی دو پایگاه دادگان قابل دسترس عموم مورد آزمایش قرار گرفته است. شبکه عصبی دیگری به نام (GPD) که براساس معماری (ALexNet) می باشد به عنوان رقیب انتخاب شده است. هدف اصلی از این تحقیق کاهش زمان تشخیص با حفظ دقت موجود توسط (Yolo) بوده است. خوشبختانه نتایج 6% هم، در صحت تشخیص نسبت به رقیب رشد داشته. بعلاوه، (Yolo ) 58% کارایی بهتر در متوسط زمان پیشبینی از خود نمایش می‌هد و هر فریم در 5.39 میلی ثانیه مورد تحلیل قرارمی‌گیرد. همچنین، مقیاس پذیری (Yolo) مورد بررسی قرارگرفته است، که نتایج اشاره به تنزل مطبوع کیفیت، به اندازه 6.95 مرتبه برروی دادگان (Kvasir) دارد، که اثبات بر کاربردی بودن (Yolo) در این حوزه است. افزایش کیفیت ورودی منجر به نتایج بهتر در (Yolo) شده است. تمامی پیاده سازی‌ها ومطالب پیرامونی برروی سایت (GitHub) قابل دسترس است.

کلیدواژه‌ها


عنوان مقاله [English]

Improving Detection of Capsule Endoscopy Using YOLO

نویسندگان [English]

  • Shokoufeh Hatami 1
  • Sina Behnam 2
  • Reza Shamsaee 3
1 Faculty of Computer Engineering and Information Technology, Sadjad University, Mashhad, Iran
2 Faculty of Computer Engineering and Information Technology, Sadjad University, Mashhad, Iran
3 Sadjad University /member of computer faculty
چکیده [English]

Capsule endoscopy (CE) technology is rapidly advancing due to its easy usability, long battery life, and exceptional image quality. However, the increasing clarity of image sequences captured by CE requires more time and effort to detect desired content. To address this issue, a new approach is presented in this paper using the popular YOLO v5 neural network architecture to detect the location and label of lesions in two public CE contents. A GPD neural network based on AlexNet is used as a rival classifier. The primary goal of this research is to reduce diagnostic time while maintaining accuracy using YOLO, and the results show a 6% increase in detection accuracy over the rival. Additionally, YOLO is 58% more time-efficient with an average prediction time of 5.39 milliseconds per frame. The scalability of YOLO is also analyzed, and results indicate a 6.95 times graceful degradation over Kvasir, proving YOLO's real-time applicability. Higher resolution inputs lead to better results with YOLO. Implementations and supplementary data are available on GitHub.

کلیدواژه‌ها [English]

  • Gastroenterology
  • Capsule endoscopy
  • YOLO
  • GPD