کاشی‌بندی حلقه‌های تودرتو با در نظر گرفتن محلیت داده‌ها به‌منظور اجرای موازی بر روی پردازنده‌های چندهسته‌ای

پارسا, سعید; حمزه‌ئی, محمد

کاشی‌بندی حلقه‌های تودرتو با در نظر گرفتن محلیت داده‌ها به‌منظور اجرای موازی بر روی پردازنده‌های چندهسته‌ای

نویسندگان

¹ دانشیار دانشکده مهندسی کامپیوتر - دانشگاه علم و صنعت ایران

² دانشجوی دکترای دانشکده مهندسی کامپیوتر - دانشگاه علم و صنعت ایران

چکیده

چکیده: در سالهای اخیر صنعت ریزپردازنده به سمت طراحی و ساخت پردازندههای چندهستهای حرکت کرده است. این بستر محاسباتی با کارایی بالا دارای دو جنبه اصلی است: تعدادی هسته محاسباتی و سلسله مراتب حافظه نهان بهمنظور استفاده از این بستر در جهت افزایش کارایی برنامه‌ها نیاز به تکنیکهای کامپایلری مناسب با در نظر گرفتن این دو جنبه در کنار هم است. کاشیبندی حلقههای تکرار یکی از اصلیترین تبدیلات حلقهای است که هم بهمنظور موازیسازی دانهدرشت در جهت استفاده از چندپردازندهها و هم بهمنظور بهبود محلیت دادهها در جهت استفاده از سلسله مراتب حافظه نهان بهکار رفته است. مشکل، کاربرد همزمان موازیسازی حلقهها و بهبود محلیت دادهها در حلقههای تکرار است. در این مقاله، روشی نوین برایزمانبندی کاشیها در جهت اجرای موازی کاشیها بر اساس میزان استفاده مجدد دادهها بین آنها ارائه شده است. در این روش بهبود محلیت دادهها با درظر گرفتن سلسله مراتب حافظه نهان همگام با موازیسازیدانهدرشت حاصل میشود.

کلیدواژه‌ها

مراجع

[1]G. Ottoni, Global Instruction Scheduling for Multi-Threaded Architectures, PhD Thesis, Princeton University, 2008.

[2]O. Ozturk, “Data locality and parallelism optimization using a constraint-based approach,” Journal of Parallel and Distributed Computing, vol. 71, no. 2 , pp. 280-287, 2011.

[3]U. Bondhugula, A. Hartono, J. Ramanujam and P. Sadayappan, “A practical automatic polyhedral parallelizer and locality optimizer,” ACM SIGPLAN Notices, vol. 43, no. 6, pp. 101-113, 2008.

[4]S. Lotfi and S. Parsa, “Parallel loop generation and scheduling,” The Journal of Supercomputing, vol. 50, no. 3, pp. 289-306, 2009.

[5]M. E. Wolf and M. S. Lam, “A loop transformation theory and an algorithm to maximize parallelism,” IEEE Transactions on Parallel and Distributed Systems, vol. 2, no. 4, pp. 452-471, 1991.

[6]J. Xue and C-H. Huang, “Reuse-driven tiling for improving data locality,” International Journal of Parallel Programming, vol. 26, no. 6, pp. 671-696, 1998.

[7] Y. Song and Z. Li, “New tiling techniques to improve cache temporal locality,” ACM SIGPLAN Notices, vol. 34, no. 5, pp. 215-228, 1999.

[8]M. E. Wolf and M. S. Lam, “A data locality optimizing algorithm”, ACM SIGPLAN Notices, vol. 26, no. 6, pp. 30-44, 1991.

[9]S. Parsa and M. Hamzei, “Locality conscious nested-loops parallelization,” ETRI Journal, vol. 36, no. 1, pp. 124-133, 2014.

[10]J. Liu, Y. Zhang, W. Ding and M. Kandemir, “On-chip cache hierarchy-aware tile scheduling for multicore machines,” In 9th Annual IEEE/ACM International Symposium on Code Generation and Optimization (CGO), pp. 161-170. 2011.

[11]L. Pouchet, Iterative Optimization in the Polyhedral Model, PhD Thesis, France University of Paris-Sud XI, 2010.

[12]A. Cohen, S. Girbal and O. Temam, “A polyhedral approach to ease the composition of program transformations,” In Euro-Par 2004 Parallel Processing, pp. 292-303, 2004.

[13]L. Pouchet, C. Bastoul, A. Cohen and J. Cavazos, “Iterative optimization in the polyhedral model: part II, multidimensional time”, ACM SIGPLAN Notices, vol. 43, no. 6, pp. 90-100, 2008.

[14]P. Feautrier, “Some efficient solutions to the affine scheduling problem. part II. multidimensional time,” International Journal of Parallel Programming, vol. 21, no. 6, pp. 389-420, 1992.

[15]J. Ramanujam and P. Sadayappan, “Tiling multidimensional iteration spaces for multicomputers,” Journal of Parallel and Distributed Computing, vol. 16, no. 2, pp. 108-120, 1992.

[16]C. Bastoul, “Efficient code generation for automatic parallelization and optimization,” In ISPDC’2 IEEE International Symposium on Parallel and Distributed Computing, pp. 23-30, 2003.

[17]C. Bastoul, “Extracting polyhedral representation from high level languages,” Technical Report at Paris-Sud University, 2008.

دوره 45، شماره 3 - شماره پیاپی 73
آذر 1394
صفحه 17-26

تعداد مشاهده مقاله: 2,300
تعداد دریافت فایل اصل مقاله: 1,729

کاشی‌بندی حلقه‌های تودرتو با در نظر گرفتن محلیت داده‌ها به‌منظور اجرای موازی بر روی پردازنده‌های چندهسته‌ای

مراجع

دوره 45، شماره 3 - شماره پیاپی 73
آذر 1394
صفحه 17-26

فایل ها

هم رسانی

ارجاع به این مقاله

آمار

کاشی‌بندی حلقه‌های تودرتو با در نظر گرفتن محلیت داده‌ها به‌منظور اجرای موازی بر روی پردازنده‌های چندهسته‌ای

مراجع

دوره 45، شماره 3 - شماره پیاپی 73آذر 1394صفحه 17-26

فایل ها

هم رسانی

ارجاع به این مقاله

آمار

دوره 45، شماره 3 - شماره پیاپی 73
آذر 1394
صفحه 17-26