لوکوویت: یک مدل کارآمد مبتنی بر ترانسفورمر بینایی برای طبقه‌بندی خودکار لکوسیت‌ها

نوع مقاله : علمی-پژوهشی

نویسندگان

گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی سهند، تبریز، ایران

چکیده

شناسایی و ارزیابی لکوسیت‌ها برای ارزیابی کیفیت سیستم ایمنی انسان مهم است. با این حال، تجزیه و تحلیل اسمیر خون به تخصص پاتولوژیست بستگی دارد. روش دستی برای تجزیه و تحلیل و طبقه بندی گلوبولهای سفید ها پرهزینه و زمان‌بر است و می تواند منجر به خطا در تشخیص شود. اکثر روش‌های یادگیری عمیق از مدل های مبتنی بر CNN برای طبقه بندی گلبول‌های سفید استفاده می‌کنند. این مقاله استفاده از یک شبکه مبتنی بر ViT را برای طبقه‌بندی لکوسیت‌ها در نمونه خون مورد بحث قرار می‌دهد. مجموعه داده مورد استفاده در این مقاله شامل 352 تصویر با اندازه 320 در 240 است که از طریق روش‌هایی برای ایجاد یک مجموعه داده متعادل از 12444 تصویر داده‌افزایی شده است. سپس داده‌های افزایش‌یافته برای آموزش معماری مبتنی بر ViT برای طبقه‌بندی انواع مختلف گلبول‌های سفید مورد استفاده قرار گرفته است. دراولین مرحله‌از روش پیشنهادی، یک توکنایزر کانولوشن برای استخراج پچ تصاویر اعمال شده است. این پچ‌ها فلت شده و به عنوان ورودی برای ساختار مبتنی بر ViT برای شناسایی زیر کلاس‌ها در مرحله دوم استفاده شده‌اند. نتایج به‌دست‌آمده با استفاده از لوکوویت نشان می‌دهد صحت شبکه پیشنهادی 99.04 درصد است که نسبت به شبکه‌های پیشرفته برتری دارد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Leukovit: An efficient vision transformer-based model for automatic classification of leukocytes

نویسندگان [English]

  • Zahra Asgharzadeh bonab
  • Sina Shamekhi
Bioelectric Department, Faculty of Biomedical Engineering, Sahand University of Technology, Tabriz, Iran
چکیده [English]

The identification and evaluation of leukocytes are important to assess the quality of the human immune system; however, the analysis of blood smears depends on the pathologist’s expertise. The manual method for analyzing and classifying WBCs is costly and time-consuming and can result in errors in detection. Most deep learning methods use CNN-based models for white blood cell classification. This paper discusses the use of a ViT-based network, for the classification of leukocytes (WBCs) in a blood sample. The Dataset used in this paper consists of 352 images with a size of 320x240, which was augmented through techniques to create a balanced dataset of 12444 images. The augmented data was then used to train a ViT-based architecture to classify the different types of WBCs. As the first step of the proposed algorithm, a convolutional tokenizer has been applied for patch extraction of images. These patches have been flattened and have been used as input for a ViT-based structure to recognize the subclasses in the second step. The results obtained using Leukovit show that the accuracy of the proposed network is 99.04% which is outperforming the state-of-the-art networks.

کلیدواژه‌ها [English]

  • White blood cells
  • Image classification
  • Deep learning
  • Convolutional neural network
  • Vision Transformer