رویکردی عصبی-تطبیقی در طراحی کنترل کننده نزدیک به بهینه برای کلاسی از سیستم های مقید

نوع مقاله : علمی-پژوهشی

نویسندگان

1 دانشجوی دکتری، دانشکده مهندسی برق، دانشگاه علم و صنعت ایران، تهران، ایران

2 استاد، دانشکده مهندسی برق، دانشگاه علم و صنعت ایران، تهران، ایران

چکیده

این مقاله به طراحی کنترل‌کننده‌ای می‌پردازد که ضمن دستیابی به عملکردی نزدیک به بهینه، قابلیت برآورده‌سازی قیدهای خروجی را دارا باشد. این روش برای سیستم‌های غیرخطی مربعی با دینامیک داخلی پایدار طراحی می‌شود. برای این منظور، با استفاده از شاخص عملکرد اولیه و تقریب تیلور، مساله به‌‌صورت برنامه‌ریزی مقید تقریب زده می‌شود که قیدهای آن، به‌کمک تابع مانع کنترل برای برآورده‌سازی محدودیت‌های خروجی نوشته می‌شوند. بدین ترتیب، عملکردی نزدیک به بهینه و مقید، بدون برخورد به معادلات پیچیده همیلتون-ژاکوبی-بلمن به‌دست می‌آید. به‌منظور مقابله با نامعینی‌های مدل که در مساله بهینه‌سازی ظاهر می‌شود، ساختاری تطبیقی طراحی می‌شود. حل به‌هنگام بهینه‌سازی مقید نیز به‌وسیله شبکه عصبی بازگشتی تصویر صورت می‌گیرد. این امر منجر به دستیابی به پاسخی بسته می‌شود که سادگی پیاده‌سازی بدون نیاز به استفاده از محاسبه‌گرها و جعبه‌ابزارهای اضافی را به همراه دارد. پایداری سیستم حلقه‌بسته و برآوردگی قیدها به‌طور دقیق تحلیل شده-اند. در انتها نیز کارایی روش ارائه‌شده در تحقق اهداف یادشده با بررسی نتایج حاصل از شبیه‌سازی کنترل مسیر کشتی و تحلیلی مقایسه‌ای از پایدارسازی مقید آونگ نشان داده شده است. مثال شبیه‌سازی اول، کارایی روش را در ردیابی مقید نشان می‌دهد و مثال شبیه‌سازی دوم، موید عملکرد مناسب کنترل‌کننده در کاربردهای پایدارسازی و تنظیم است.

کلیدواژه‌ها


عنوان مقاله [English]

A neuro-adaptive approach to near-optimal controller design for a class of constrained systems

نویسندگان [English]

  • S. RadMoghadam 1
  • M. Farrokhi 2
1 School of Electrical Engineering, Iran University of Science and Technology, Tehran, Iran.
2 School of Electrical Engineering, Iran University of Science and Technology, Tehran, Iran.
چکیده [English]

This paper proposes a controller capable of satisfying the output constraints while providing a near-optimal performance. The method is designed for square nonlinear systems with stable internal dynamics. To this end, using a primary performance index and Taylor approximation, the problem is approximated by a constrained programming, whose constraints are written with the aid of Control Barrier Function (CBF) to ensure the output restrictions. As a result, a constrained near-optimal performance without encountering difficulties in Hamilton-Jacobi-Bellman (HJB) equations is obtained. In order to overcome the model uncertainties, which appear in the optimization problem, an adaptive structure is formulated. The online solution of the constrained optimization is obtained using a Projection Recurrent Neural Network (PRNN). As a result, a closed-form solution is provided that can be simply implemented without requiring additional solvers or toolboxes. Stability of the proposed method and constraints satisfaction are addressed thoroughly. Finally, effectiveness of the proposed method in realizing the aforementioned aims are illustrated through simulations on trajectory control of a surface vessel system and a comparative study on the constrained stabilization of a pendulum. The first simulation example shows the effectiveness of the method in constrained tracking, while the second example confirms the proper performance of the controller in stabilization and regulation applications.

کلیدواژه‌ها [English]

  • Near-optimal control
  • constrained control
  • control barrier function
  • adaptive model
  • recurrent neural network
[1]  H. G. Zhang, X. Zhang, L. Yan-Hong, and Y. Jun, "An overview of research on adaptive dynamic programming", Acta Automatica Sinica, vol. 39, no. 4, pp. 303-311, 2013.
[2]  J. Zhao, J. Na, G. Gao, "Robust tracking control of uncertain nonlinear systems with adaptive dynamic programming", Neurocomputing, vol. 471, pp. 21-30, 2022.
[3]  Y. Yang, W. Gao, H. Modares, C. Z. Xu, "Robust actor-critic learning for continuous-time nonlinear systems with unmodeled dynamics", IEEE Transactions on Fuzzy Systems, vol. 30, no. 6, pp. 2101-2112, 2022.
[4]  T. Wang, S. Sui, S. H. Tong, "Data-based adaptive neural network optimal output feedback control for nonlinear systems with actuator saturation", Neurocomputing, vol. 247, no. 19, pp. 192-201, 2017.
[5]  P. Liu, H. Zhang, H. Ren, C. Liu, "Online event-triggered adaptive critic design for multi-player zero-sum games of partially unknown nonlinear systems with input constraints", Neurocomputing, vol. 462. pp. 309-319, 2021.
[6]  Z. Marvi, B. Kiumarsi, "Safe reinforcement learning: a control barrier function optimization approach", International Journal of Robust and Nonlinear Control, vol. 31, no. 6, pp. 1923-1940, 2021.
[7]  Y. Yang, D. W.  Ding, H. Xiong, Y. Yin, D. C. Wunsch, “Online barrier-actor-critic learning for H∞ control with full-state constraints and input saturation”, Journal of the Franklin Institute, vol. 357, no. 6, pp. 3316-3344, 2020.
[8] Y. Zhang, S. Li, L. Liao, "Near-optimal control of nonlinear dynamical systems: a brief survey", Annual Reviews in Control, vol. 47, pp. 71-80, 2019.
[9]  فاطمه پیروزمند، نعمت‌اله قهرمانی، محمدرضا عاروان، «طراحی کنترل­کننده پیش­بین مقاوم با استفاده از نامساوی خطی ماتریسی برای سیستم کنترل وضعیت ماهواره»، مجله مهندسی برق دانشگاه تبریز، جلد 44، شماره 4، صفحات 9-21، 1393.
[10] S. Yu, C. Maier, H. Chen, F. Allgower, "Tube MPC scheme based on robust control invariant set with application to Lipschitz nonlinear systems", Systems & Control Letters, vol. 62, no. 2, pp. 194-200, 2013.
[11] H. Li, Y. Shi, " Event-triggered robust model predictive control of continuous-time nonlinear systems", Automatica, vol. 50, no. 5, pp. 1507-1513, 2014.
[12] فرهاد بیات، صالح مبین، «ردیابی مقید مبتنی بر کنترل­کننده پیش­بین با هزینه محاسباتی کم: رویکرد برنامه­ریزی پارامتری»، مجله مهندسی برق دانشگاه تبریز، جلد 46، شماره 4، صفحات 39-47، 1395.
[13] W. Chen, D. Balance, P. Gawthrop, "Optimal control of nonlinear systems: a predictive control approach", Automatica., vol. 39, no. 4, pp. 633-641, 2003.
[14] W. Chen, "Closed-form nonlinear MPC for multivariable nonlinear systems with different relative degree", American Control Conference, , 2003.
[15] J. Yang, W. X. Zheng, S. Li, B. Wu, M. Cheng, "Design of a prediction-accuracy-enhanced continuous-time MPC for disturbed systems via a disturbance observer", IEEE Transactions on Industrial Electronics, vol. 62, no. 9, pp. 5807-5816, 2015.
[16] H. Gouta, N. Barhoumi, S. H. Saïd, F. M’Sahli, "Generalized predictive control for a coupled four tank MIMO system using a continuous-discrete time observer", ISA Transactions, vol. 67, pp. 280-292, 2017.
[17] C. Liu, W. H. Chen, J. Andrews, "Tracking control of small-scale helicopters using explicit nonlinear MPC augmented with disturbance observers", Control Engineering Practice., vol. 20, no. 3, pp. 258–268, 2012.
[18] Y. Zhang, S. Li, X. Liu, "Adaptive near-optimal control of uncertain systems with application to underactuated surface vessels", IEEE Transactions on Control Systems Technology, vol. 26, no. 4, pp. 1204-1218, 2018.
[19] Y. Zhang, S. Li, X. Jiang, "Near-optimal control without solving HJB equations and its applications", IEEE Transactions on Industrial Electronics, vol. 65, no. 9, pp. 7173-7184, 2018.
[20] Y. Zhang, S. Li, X. Liu, "Neural network-based model-free adaptive near-optimal tracking control for a class of nonlinear systems", IEEE Transactions on Neural Networks and Learning Systems, vol. 29, no. 12, pp. 6227-6241, 2018.
[21] S. Li, Y. Yan, J. Yang, Z. Sun, H. Yu, "Nonlinear-disturbance-observer-enhanced MPC for motion control systems with multiple disturbances", IET Control Theory & Applications, vol. 14, no. 1, pp. 63-72, 2020.
[22] Y. Zhang, S. Li, "Time-scale expansion-based approximated optimal control for underactuated systems using projection neural networks", IEEE Transactions on Systems Man and Cybernetics Part-A: Systems, vol. 48, no. 11, pp. 1957-1967, 2018.
[23] S. Rad-Moghadam, M. Farrokhi, "Optimal output feedback control of a class of uncertain systems with input constraints using parallel feedforward compensator" Journal of the Franklin Institute, vol. 357, no. 18, pp. 13449-13476, 2020.
[24] S. Liu, J. Wang, "A simplified dual neural network for quadratic programming with its KWTA application", IEEE Transactions on Neural Networks and Learning Systems, vol. 17, no. 6, pp. 1500–1510, 2006.
[25] H. Zhang, Z. Wang, D. Liu, "A comprehensive review of stability analysis of continuous-time recurrent neural networks", IEEE Transactions on Neural Networks and Learning Systems, vol. 25, no. 7, pp. 1229-1262, 2014.
[26] L. Jin, S. Li, B. Hu, M. Liu, "A survey on projection neural networks and their applications", Applies Soft Computing Journal, vol. 76, pp. 533-544, 2019.
[27] Z. Yan, X. Le, J. Wang, "Tube-based robust model predictive control of nonlinear systems via collective neurodynamic optimization", IEEE Transactions on Industrial Electronics, vol. 63, no. 7, pp. 4377-4386, 2016. 
[28] Z. Peng, J. Wang, Q. L. Han, "Path-following control of autonomous underwater vehicles subject to velocity and input constraints via neurodynamic optimization", IEEE Transactions on Industrial Electronics, vol. 66, no. 11, pp. 8724-8732, 2018.
[29] J. J. E. Slotine, W. Li, Applied Nonlinear Control, 1st Edition, Prentice Hall, New Jercy, 1991.
[30] A. Isidori, Nonlinear Control Systems: An Introduction, 3rd Edition, Springer-Verlag, Heidelberg, 1995.
[31] X. Xu, "Constrained control of input-output linearizable systems using control sharing barrier functions", Automatica, vol. 87, pp. 195-201, 2018.
[32] Q. Nguyen, K. Sreenath, "Exponential control barrier functions for enforcing high relative-degree safety-critical constraints", American Control Conference, Boston, USA, 2016.
[33] S. Boyd, L. Vandenberghe, Convex Optimization, 1st Edition, Cambridge University Press, Cambridge, 2004.
[34] J. J. Hopfield, D. W. Tank, "Neural computation of decisions in optimization problems", Biological Cybernetics, vol. 52, no. 3, pp. 141-152, 1985.
[35] K. D. Do, Z. P. Jiang, J. Pan, "Underactuated ship global tracking under relaxed conditions", IEEE Transactions on Automatic Control, vol. 47, no. 9, pp. 1529–1536, 2002.
[36] Q. Y. Fan, G. H. Yang, "Adaptive nearly optimal control for a class of continuous-time nonaffine nonlinear systems with inequality constraints", ISA Transactions, vol. 66, pp. 122-133, 2017.