رهگیری بصری طولانی مدت اهداف دلخواه بر اساس راه‌گزین بین دو روش رهگیری سنتی و فن یادگیری ژرف

نوع مقاله : علمی-پژوهشی

نویسندگان

1 دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

2 عضور هیئت علمی دانشگاه تبریز

چکیده

رهگیری بصری شی دلخواه یک موضوع اساسی و چالش برانگیز در حوزه بینایی ماشین است که به‌طور سنتی توسط در نظر گرفتن یک مدل برای هدف و با استفاده از داده‌های آموزشی همان ویدیو انجام شده است. اکثر رهگیرها به‌سختی می‌توانند با در نظر گرفتن ویژگی‌های برخط و بی‌درنگ در صدر مقایسه نتایج مشهورترین روش‌ها قرار گیرند. در این مقاله یک چارچوب رهگیری بر اساس شبکه سیامی ارائه شده که یادگیری رهگیر به‌صورت برخط و فرآیند رهگیری بی‌درنگ بوده و نام آن STD-Siam است. از آن‌جا که شبکه سیامی دارای محدودیت آموزش برخط است و مدت طولانی نمی‌تواند چالش‌های موجود در رهگیری را مدیریت کند، هدف STD-Siam از راه‌گزین بین رهگیر سنتی و رهگیر بر مبنای یادگیری ژرف، تعلیم هر دو رهگیر با هدف رفع ابهام بین هدف و پس‌زمینه در هر فرنامه دلخواه است. ابتدا از طریق رهگیر سنتی داده‌های آموزشی تولید شده، سپس این داده‌ها با فن برافزایی گسترش داده‌ می‌شوند تا شبکه ژرف به خوبی آموزش بیند. این روش می‌تواند با سرعت 66 فریم‌درثانیه اجرا شود و نسبت به الگوریتم‌های مشابه فعلی با وجود سادگی آن نتایج خوبی را به‌دست آورد و به‌صورت طولانی مدت هدف را رهگیری کند. این سرعت رهگیری فراتر از بی‌درنگ ( بیش از 30 فریم در ثانیه) به‌واسطه آشکارساز برجستگی در حوزه فرکانس است که نامزدهای انتخابی هدف به‌طور دقیق محاسبه شده و از روبش کل تصویر به‌صورت کورکورانه جلوگیری می‌شود تا بار محاسباتی کاهش یابد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Long-term Visual Object Tracking of Arbitrary Objects Based on Switching Between Traditional Method and Deep Learning Technique

نویسندگان [English]

  • Mohammad Amin Bagherzadeh 1
  • Hadi Seyedarabi 2
  • Seyed Naser Razavi 1
1 Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran
2 Professor of Electrical Engineering
چکیده [English]

Visual tracking of the arbitrary object is a fundamental and challenging topic in the field of machine vision, which has traditionally been done by considering a model for the target and using the training data of the same video. Most trackers can hardly top the results of the most popular methods when considering real-time and online performance. In this article, a tracker framework based on the Siamese network is presented, which is an online tracker learning and a real-time tracking process, and its name is STD-Siam. Since the Siamese network has limited online training and cannot handle the challenges of tracking for the long term, STD-Siam aims to switch between traditional tracking and deep learning, training both trackers to eliminate the ambiguity between the target and the background in each scenario. First, the training data is generated through the traditional tracker, then these data are expanded with the augmentation technique so that the deep network can be trained well. This method can be executed at a speed of 66 FPS, and compared to the current similar algorithms, despite its simplicity, it can achieve good results and track the target for the long term. This tracking speed is beyond real-time due to the spike detector in the frequency domain, which accurately calculates the selected target candidates and avoids blindly scanning the entire image to reduce the computational burden.

کلیدواژه‌ها [English]

  • Long-term visual tracking
  • Siamese neural network
  • deep learning