دانلود و نمایش مقالات مرتبط با Heterogeneous system::صفحه 1
بلافاصله پس از پرداخت دانلود کنید

با سلام خدمت کاربران در صورتی که با خطای سیستم پرداخت بانکی مواجه شدید از طریق کارت به کارت (6037997535328901 بانک ملی ناصر خنجری ) مقاله خود را دریافت کنید (تا مشکل رفع گردد). 

نتیجه جستجو - Heterogeneous system

تعداد مقالات یافته شده: 6
ردیف عنوان نوع
1 Troodon: A machine-learning based load-balancing application scheduler for CPU–GPU system
Troodon: یک برنامه زمانبندی برنامه تعادل بار بر مبنای یادگیری ماشین برای سیستم CPU-GPU-2019
Heterogeneous computing machines consisting of a CPU and one or more GPUs are increasingly being used today because of their higher performance-cost ratio and lower energy consumption. To program such heterogeneous systems, OpenCL has become an industry standard due to the portability across various computing architectures. To exploit the computing capabilities of heterogeneous systems, application developers are porting their cluster and Cloud applications using OpenCL. With the increasing number of such applications, the use of shared accelerating computing devices (such as CPUs and GPUs) should be managed using an efficient load-balancing scheduling heuristic capable of reducing execution time, increasing throughput with high device utilization. Mostly, the OpenCL applications are suited (execute faster) on a specific computing device (CPU or GPU) and with varying data-sizes the speedup obtained by an application on the suitable device varies too. Applications’ mapping to computing devices without considering device suitability and obtainable speedup on a suitable device leads to sub-optimal execution time, lower throughput and load imbalance. Therefore, an application scheduler should consider both the device-suitability and speedup variation for scheduling decisions leading to a reduction in execution time and an increase in throughput. In this paper, we present a novel load-balancing scheduling heuristic named as Troodon that considers machinelearning based device-suitability model that classify OpenCL applications into either CPU suitable or GPU suitable. Moreover, a speedup predictor that predicts the amount of speedup that jobs will obtain when executed on a suitable device is also part of the Troodon. Troodon incorporates the E-OSched scheduling mechanism to map jobs on CPU and GPUs in a load balanced way. This results in reduced applications execution time, increased system throughput, and improved device utilization. We evaluate the proposed scheduler using a large number of data-parallel applications and compared with several other state-of-the-art scheduling heuristics. The experimental evaluation has demonstrated that the proposed scheduler outperformed the existing heuristics and reduced the application execution time up to 38% with increased system throughput and device utilization.
Keywords: Heterogeneous system | Scheduling | Device suitability | Load-balancing | Machine learning
مقاله انگلیسی
2 راهکار آگاه از سود و Multi-QoS محدود برای جریان های کاری همزمان در سیستم های ناهمگون
سال انتشار: 2017 - تعداد صفحات فایل pdf انگلیسی: 11 - تعداد صفحات فایل doc فارسی: 32
اجرای یک اپلیکیشن می تواند باعث عدم تعادل جریان کاری یا workload در بین پردازنده های متناظر شود. که در نهایت منجر به هدردهی منابع و هزینه ی بیشتر می شود. در این مقاله یک سیستم مدیریت منابع پویا ارائه می دهیم که در آن پردازنده ها نه برای کار ها بلکه برای زیرمجموعه ای از آنها به نام task استفاده می شود که نرخ استفاده ی منابع را افزایش می دهد. این مقاله الگوریتم زمان بندی ارائه می دهد که جریان های کاری همزمان را مدیریت می کند. منابع بطور همزمان استفاده می شوند و هر کاری دارای ددلاین و بودجه ی مخصوص خود است . تحقیقات اخیر در تلاش برای استراتژی های پویا برای این جریان های کاری بود ولی فقط تعادل در تخصیص منابع و کاهش زمان اجرا را در نظر گرفته بود . الگوریتم زمان بندی آگاه از سود MQ-PAS که در اینجا ارائه شده است سود نهایی با در نظر گرفتن میزان بودجه را افزایش می دهد . ما قابلیت های الگوریتم را نشان می دهیم و با ساختار ها و جریان های کاری مختلف آنرا بررسی می کنیم. نتایج آزمایش ها نشان می دهد که استراتژی ما سوددهی ارائه دهنده را بطور چشمگیری افزیش می دهد و در مقایسه با کار های مشابه نرخ موفقیت بالاتری دارد.
مقاله ترجمه شده
3 Marcher: A Heterogeneous System Supporting Energy-Aware High Performance Computing and Big Data Analytics
راه پیما: یک سیستم ناهمگن حمایتی انرژی آگاه محاسبات با کارایی بالا و تحلیل داده های بزرگ-2017
Excessive energy consumption is a major constraint in designing and deploying the next generation of supercomputers. Minimizing energy consumption of high performance computing and big data applications requires novel energy-conscious technologies (both hardware and software) at multiple layers from architecture, system support, and applications. In the past decade, we have witnessed the significant progress toward developing more energy-efficient hardware and facility infrastructure. However, the energy efficiency of software has not been improved much. One obstacle that hinders the exploration of green software technologies is the lack of tools and systems that can provide accurate, fine-grained, and real-time power and energy measurement for technology evaluation and verification. Marcher, a heterogeneous high performance computing infrastructure, is built to fill the gap by providing support to research in energy-aware high performance computing and big data analytics. The Marcher system is equipped with Intel Xeon CPUs, Intel Many Integrated Cores (Xeon Phi), Nvidia GPUs, power aware memory systems and hybrid storage with Hard Disk Drives (HDDs) and Solid State Disks (SSDs). It provides easy-to-use tools and interfaces for researchers to obtain decomposed and fine-grained power consumption data of these primary computing components. This paper presents the design of the Marcher system and demonstrates the usage of Marcher power measurement tools to obtain detailed power consumption data in various research projects.
Keywords:Energy efficient high performance|computing|Energy-aware big data analytics|Power-measurable systems|Power profiling
مقاله انگلیسی
4 An MPI–CUDA library for image processing on HPC architectures
کتابخانه MPI-CUDA برای پردازش تصویر در معماری HPC-2015
Scientific image processing is a topic of interest for a broad scientific community since it is a mean of gaining understanding and insight into the data for a growing number of applications. Furthermore, the technological evolution permits large data acquisition, with sophisticated instruments, and their elaboration through complex multidisciplinary applications, resulting in datasets that are growing at an extremely rapid pace. This results in the need of huge computational power for the processing. It is necessary to move towards High Performance Computing (HPC) and to develop proper parallel implementations of image processing algorithms/operations. Modern HPC resources are typically highly heterogeneous systems, composed of multiple CPUs and accelerators such as Graphics Processing Units (GPUs) and Field-Programmable Gate Arrays (FPGAs). The actual barrier posed by heterogeneous HPC resources is the development and/or the performance efficient porting of software on such complex architectures. In this context, the aim of this work is to enable image processing on cluster of GPUs, through the use of PIMA(GE) 2 Lib, the Parallel IMAGE processing GEnoa Library. The library is able to exploit traditional clusters through MPI, GPU device through CUDA and a first experimentation is aimed to explore the use of GPU-clusters. Library operations are provided to the users through a sequential interface defined to hide the parallelism of the computation. The parallel computation, at each level, is managed employing specific policies designed to suitably coordinate the parallel processes/threads involved in the elaboration and their use is tightly coupled with the PIMA(GE) 2 Lib interface. In this paper, we present the incremental approach adopted in the development of the library and the performance gains in each implementations: quite linear speedup is achieved on cluster architecture, about a 30% improvement in the execution time on a single GPU and the first results on cluster of GPUs are promising. Keywords: Image processing | Parallel computing | GPU
مقاله انگلیسی
5 پشتیبانی از سیستم عامل برای زمانبندی بارگذاری روی سیستم¬های ناهمگن مبتنی بر شتاب ده
سال انتشار: 2015 - تعداد صفحات فایل pdf انگلیسی: 15 - تعداد صفحات فایل doc فارسی: 30
استفاده از شتاب¬ده ها در حوزه وظایف پردازشی، اجرایی و محاسباتی ناهمگن، از طریق دامنه وسیعی از کاربردها، روز به روز در حال گسترش است. با ظهور معماری¬های محاسباتی متنوعی که در حال حاضر موجود هستند، نیاز به محیط چندکاره سیستم-واید در حال افزایش است.بنابراین، ما در اینجا یک زمانبند مبتنی بر Open CL ارائه می کنیم که از آن به عنوان یک محیط محاسباتی چند کاربره استفاده می¬شود تا ضمن اینکه به صورت یک دیمون(شبح) اجرا می¬شود، از پتانسیل کامل منابع موجود به صورت بهینه استفاده شود. وظایف چندگانه را می¬توان با استفاده از یک c++API که به یک پوشش OpenCL c++ بستگی دارد، صادر کرد. در این مرحله، دیمون بلافاصله کنترل را در دست گرفته وزمانبندی بارگذاری را اجرا می¬کند. به دلیل نحوه پیاده¬سازی رویکرد ما، می¬توان آن را به سهولت به یک سیستم عامل معمولی اعمال کرد. ما روش خود رااز طریق آزمایشات گسترده ¬ای که با اعمال مجموعه¬ای از کاربردها انجام می¬شود، تایید می¬کنیم که نشان می¬دهد هزینه¬های پایین زمانبندی، در دامنه وسیعی از اندازه ورودی، مجموعا به صورت ثابت باقی می-ماند. به علاوه، در این آزمایشها از CPU های مختلف، انواع GPU های مدرن و معماری¬های شتاب ده¬ دیگر استفاده می¬شود.
مقاله ترجمه شده
6 تحقیقی در زمینه معماری سیستم عامل ناهمگون چند هسته ای
سال انتشار: 2014 - تعداد صفحات فایل pdf انگلیسی: 4 - تعداد صفحات فایل doc فارسی: 11
با توجه به تحقیقات در زمینه چارچوب نرم افزار پردازنده چند هسته ای ، بر اساس چارچوب نرم افزار سلسله مراتبی که شامل سطح داده، سطح کنترل و سطح مدیریت میباشد ، در این مقاله یک معماری نرم افزاری برای سیستم عامل هتروژن پیشنهاد داده شده است. این سیستم عامل پیشنهادی، ملاحظاتی از مشکلات توسعه‌ای موجود در سطح مدیریت، کلیت (عمومیت) سطح کنترل و بازدهی پردازش در سطح داده ای را در نظر میگیرد. ما معماری هتروژن چند هسته ای را به ترتیب از جنبه های سطح داده، مدل برنامه ریزی، تعامل سیگنال سیستم عامل هتروژن و تعامل داده ها ؛توضیح میدهیم. ازمایشها نشان میدهند که این معماری سیستم عامل هتروژن چند هسته ای، میتواند نسبت به معماری عمومی، عملکرد پردازش پروتکل شبکه را به صورت بهتری ارائه دهد.
کلمات کلیدی: معماری نرم افزار | پردازنده چند هسته ای | سیستم عامل | سیستم ناهمگن
مقاله ترجمه شده
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi
بازدید امروز: 798 :::::::: بازدید دیروز: 0 :::::::: بازدید کل: 798 :::::::: افراد آنلاین: 63