دانلود و نمایش مقالات مرتبط با parallel computing::صفحه 1
تبریک 97
آرشیو مقالات
ورود اعضا
توجه توجه توجه !!!!
تمامی مقالات ترجمه شده ، انگلیسی و کتاب های این سایت با دقت تمام انتخاب شده اند. در انتخاب مقالات و کتاب ها پارامترهای جدید بودن، پر جستجو بودن، درخواست کاربران ، تعداد صفحات و ... لحاظ گردیده است. سعی بر این بوده بهترین مقالات در هر زمینه انتخاب و در اختیار شما کاربران عزیز قرار گیرد. ضمانت ما، کیفیت ماست.
نرم افزار winrar

از نرم افزار winrar برای باز کردن فایل های فشرده استفاده می شود. برای دانلود آن بر روی لینک زیر کلیک کنید
دانلود

پیوندهای کاربردی
پیوندهای مرتبط
نتیجه جستجو - parallel computing

تعداد مقالات یافته شده: 15
ردیف عنوان نوع
1 Accelerating big data analytics on HPC clusters using two-level storage
سرعت بخشیدن به تجزیه و تحلیل داده های بزرگ در خوشه HPC با استفاده از ذخیره سازی دو سطح-2017
Data-intensive applications that are inherently I/O bound have become a major work load on traditional high-performance computing (HPC) clusters. Simply employing data intensive computing storage such as HDFS or using parallel file systems available on HPC clusters to serve such applications incurs performance and scalability issues. In this paper, we present a novel two-level storage system that integrates an upper-level in-memory file system with a lower-level parallel file system. The former renders memory-speed high I/O performance and the latter renders consistent storage with large capacity. We build a two level storage system prototype with Tachyon and OrangeFS, and analyze the resulting I/O throughput for typical MapReduce operations. Theoretical modeling and experiments show that the proposed two-level storage delivers higher aggregate I/O throughput than HDFS and OrangeFS and achieves scalable performance for both read and write. We expect this two-level storage approach to provide insights on system design for big data analytics on HPC clusters.
Keywords:Two-level storage|In-memory file system|Parallel file system|Data-intensive computing
مقاله انگلیسی
2 GPU-based parallel optimization of immune convolutional neural network and embedded system
بهینه سازی موازی بر اساس GPU از شبکه عصبی کانولوشن ایمنی و سیستم جاسازی شده-2017
Up to now, the image recognition system has been utilized more and more widely in the security monitoring, the industrial intelligent monitoring, the unmanned vehicle, and even the space exploration. In designing the image recognition system, the traditional convolutional neural network has some de- fects such as long training time, easy over-fitting and high misclassification rate. In order to overcome these defects, we firstly used the immune mechanism to improve the convolutional neural network and put forward a novel immune convolutional neural network algorithm, after we analyzed the network structure and parameters of the convolutional neural network. Our algorithm not only integrated the location data of the network nodes and the adjustable parameters, but also dynamically adjusted the smoothing factor of the basis function. In addition, we utilized the NVIDIA GPU (Graphics Processing Unit) to accelerate the new immune convolutional neural network (ICNN) in parallel computing and built a real-time embedded image recognition system for this ICNN. The immune convolutional neural net- work algorithm was improved with CUDA programming and was tested with the sample data in the GPU-based environment. The GPU-based implementation of the novel immune convolutional neural network algorithm was made with the cuDNN, which was designed by NVIDIA for GPU-based accel- erating of DNNs in machine learning. Experimental results show that our new immune convolutional neural network has higher recognition rate, more stable performance and faster computing speed than the traditional convolutional neural network.& 2016 Elsevier Ltd. All rights reserved.
Keywords:Immune algorithm | Convolutionalneuralnetwork | Image recognition | Parallelcomputing | Embedded system | Security monitoring
مقاله انگلیسی
3 Parallel map projection of vector-based big spatial data: Coupling cloud computing with graphics processing units
ترسیم نقشه موازی داده های مکانی بزرگ مبتنی بر بردار: اتصال محاسبات ابری با واحدهای پردازش گرافیکی-2017
The objective of this article is to present a framework that couples cloud and high-performance computing for the parallel map projection of vector-based big spatial data. The past few years have witnessed a tremendous growth of a variety of high-volume spatial data—i.e., big spatial data. Map projection is often needed, for example, when we apply these big spatial data into large-scale spatial analysis and modeling approaches that require a common coordinate system. However, due to the size of these data and algorithmic complexity of map projections, the transformation of big spatial data between alternative projections represents a pressing computational challenge. Recent advancement in cloud computing and high-performance computing offers a potential means of address ing this computational challenge. The parallel map projection framework presented in this study is based on a layered architecture that couples capabilities of cloud computing and high-performance computing accelerated by Graphics Processing Units. We use large LiDAR data as an example of vector-based big spatial data to investi gate the utility of the parallel map projection framework. As experimental results reveal, the framework provides considerable acceleration for re-projecting vector-based big spatial data. Coupling high-performance and cloud computing, which complement to each other, is a suggested solution for the efficient processing and analysis of big spatial data.
Keywords:Map projection|Big spatial data|Cloud computing|Graphics processing units|Parallel computing
مقاله انگلیسی
4 طراحی و استفاده از الگوریتم تطبیق استریو موازی بر اساس CUDA
سال انتشار: 2016 - تعداد صفحات فایل pdf انگلیسی: 9 - تعداد صفحات فایل doc فارسی: 30
برای ساخت دقیق اطلاعات توپوگرافی به صورت بلادرنگ از یک ربات متحرک شش پا؛ این مطالعه یک الگوریتم تطبیق استریو را پیشنهاد داده است که می‌تواند تفاوت‌های کلی پیکسل‌ها را با استفاده از مدل احتمال پسین بیز بر اساس پردازش موازی تسریع شده با GPU انجام دهند. الگوریتم پیشنهادی، پشتیبانی از نقاط فضای اختلاف را برای کسب شدت احتمال توزیع پسین از پیکسل ایجاد می‌کند و سپس آن را در یک مدل احتمال پسین بیز برای ایجاد تابع انرژی اختلاف مکانی جایگزین می‌کند. مقدار اختلاف مکانی پیسکل ناشناخته می‌تواند با حداقل سازی تابع انرژی حاصل شود. با اجرای یک بررسی سازگار بر تصویر سمت چپ و راست، عدم تطبیق پیکسل می‌تواند حذف شود. برطبق مقدار اختلاف مکانی نقطه پشتیبان، پرکردن اختلاف مکانی ناحیه نامتناسب می‌تواند با استفاده از روش وزن تطبیقی بر مبنای گسترش متقابل برای کسب چگالی دقیقی از نگاشت اختلاف مکانی بدست آید. محاسبات موازی در هر مرحله از الگوریتم پیشنهادی با استفاده از معماری یکپارچه دستگاه‌ها برای کاهش زمان اجرا، استفاده می‌شود. نتایج آزمایشی نشان می‌دهند که الگوریتم پیشنهادی مقاومت خوبی نسبت به نورپردازی‌های متفاوت و بازسازی سطح منحنی بافت دارد. الگوریتم می‌تواند برای تطبیق سریع تصاویر در اندازه‌های مختلف و بازسازی نگاشت اختلاف مکانی صحنه‌ها به صورت بلادرتگ تحت نسبت رزلوشن 640*480 استفاده شود. مجموعه تست بینایی با بزرگ نمایی برای ایجاد نگاشت اختلاف مکانی صحنه‌های بزرگ و اعتبارسنجی اثرات کاربردی عملی الگوریتم استفاده شدند. نتایج خوبی از این آزمایش حاصل شد.
کلمات کلیدی : CUDA | پردازش موازی | تطبیق استریو | دید دو چشمی | بیز | وزن تطبیقی
مقاله ترجمه شده
5 Design and Development of FPGA-based High-Performance Radar Data Stream Mining System
طراحی و توسعه سیستم کاوش جریان داده های رادار با عملکرد بالا و مبتنی بر FPGA-2015
Radar signal sorting is a key technique in electronic reconnaissance systems and is currently an important research direction in radar signal processing. Clustering, one of data mining techniques, has been adopted to solve radar sorting problem. However, none of the existing clustering-based methods is able to perform real- time analysis on high speed radar stream. Therefore, in this paper, we propose, design and implement a high performance FPGA-based data stream mining system to perform real-time radar signal sorting on continuous data stream. Firstly, a density-based clustering algorithm is proposed for radar signal sorting; secondly, FPGA- based program of the clustering algorithm is designed and implemented; thirdly, the FPGA board is designed and implemented. Experiments are performed on the board we designed. The results show that the proposed system can achieve real-time radar signal sorting on FPGA, and the resource consumption on FPGA is very low. The clustering algorithm is efficient in terms of accuracy.© 2015 The Authors. Published by Elsevier B.V.Selection and/or peer-review under responsibility of the organizers of ITQM 2015© 2015 Published by Elsevier B.V. This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).Peer-review under responsibility of the Organizing Committee of ITQM 2015
data mining | clustering | signal processing | FPGA | parallel computing
مقاله انگلیسی
6 مقدمه ای بر محاسبات ابری
سال انتشار: 2015 - تعداد صفحات فایل pdf انگلیسی: 15 - تعداد صفحات فایل doc فارسی: 26
 پیش زمینه محاسبات ابری  نیروهای محرک محاسبات ابری  وضعیت و گرایش های محاسبات ابری  طبقه بندی کاربردهای محاسبات ابری  ویژگی های اصلی و چالش های محاسبات ابری پیش زمینه محاسبات ابری جهان به عصر محاسبات ابری وارد می شود. محاسبات ابری مدل کسب و کار و مدل ارائه خدمات جدید است که مفهوم اصلی آن این است که محاسبات ابری برای انجام محاسبات به کامپیوترهای محلی موضعی متکی نیست؛ جز در منابع محاسباتی که توسط بخش های ثالث که منابع محاسبات، ذخیره، و شبکه ای را فراهم می سازند. مفهوم محاسبات ابری به سال1961 در سخنرانی سده MIT برمی گردد یعنی زمانی که John McCarthy پیشگام در صنایع کامپیوتر بیان کرد که: "محاسبات ممکن است روزی به عادی بودن منابع تلفن باشد (کاربرد عمومی)،... منابع کامپیوتر به یک پایه صنعتی جدید و مهم تبدیل خواهد شد". در 1966، D. F. Parkhill، در کتاب کلاسیک خود عنوان کرد: " چالش استفاده از کامپیوتر"، پیش بینی می کند که روزی قدرت کامپیوتر به روش مشابه با آب و الکتریسیته، در دسترس عمومی قرار خواهد گرفت. امروزه، صنایع اظهار می کنند که محاسبات ابری پنجمین منبع عمومی (پنجمین کاربرد) پس از آب، الکتریسیته، گاز و نفت است.
مقاله ترجمه شده
7 طراحی و توسعه سیستم کاوش جریان داده های رادار با عملکرد بالا و مبتنی بر FPGA
سال انتشار: 2015 - تعداد صفحات فایل pdf انگلیسی: 10 - تعداد صفحات فایل doc فارسی: 19
مرتب سازی سیگنال رادار تکنیکی اصلی در سیستم های شناسایی الکتریکی است و در حال حاضر بعنوان بخش تحقیقاتی قابل توجه در پردازش سیگنال رادار مطرح است. روش دسته بندی (یکی از تکنیک های داده کاوی) برای حل مسئله مرتب سازی رادار، پذیرفته و اتخاذ شده است. با اینحال، هیچ یک از روش های مبتنی بر دسته بندی موجود قادر به انجام انالیز فوری در جریان سرعت بالای رادار نیستند. بنابراین، در این مقاله، طراحی و اجرای سیستم کاوش جریان داده های مبتنی بر FPGA و با عملکرد بالا برای اجرا و اقدام به مرتب سازی بی وقفه سیگنال رادار بر روی جریان داده های پیوسته، پیشنهاد می شود. در ابتدا، الگوریتم دسته بندی مبتنی بر تراکم (چگالی، غلظت) برای مرتب سازی سیگنال رادار پیشنهاد می شود؛ دوم، برنامه مبتنی بر FPGA از برنامه دسته بندی طراحی و اجرا می شود؛ سوم، برد FPGA طراحی و پیاده سازی و اجرا می شود. ازمایش ها بر روی بردی انجام می شوند که ما طراحی نمودیم. نتایج نشان می دهد که سیستم پیشنهادی می تواند به مرتب سازی بلا درنگ سیگنال رادار در روی FPGA دست یابد، و مصرف منبع در FPGA بسیار کم است. همچنین دقت الگوریتم دسته بندی قابل توجه و کارامد است.
کلمات کلیدی: داده کاوی | دسته بندی | پردازش سیگنال | FPGA | محاسبات موازی
مقاله ترجمه شده
8 A variant of k-nearest neighbors search with cyclically permuted query points for rotation-invariant image processing
یک نوع دیگر از جستجوی K-نزدیکترین همسایگان با نقاط پرس و جو چرخه permuted برای چرخش ثابت پردازش تصویر-2015
The well-known k-nearest neighbors problem (kNN) involves building a data structure that reports the k closest training points to each of a given set of query points, with all points being in a given metric space S. The problem discussed here is an important operation in rotation-invariant image processing. It consists of a nontrivial variant of kNN: given a set of training points X and a set of query points Y find, for each query point y ∈ Y , the k nearest training points to y, where the notion of distance is given by a pseudometric of S defined over cyclic permutations of y and the elements of X . The multiplicity of the query point permutations makes serial brute force search too costly for instances of practical size. We present a transformation that enables any instance of the variant to be solved as a kNN problem. Although this enables the application of any kNN algorithm, the transformation is too time costly to be practical for instances of practical dimensions. For this reason, we present a condensation algorithm for the efficient elimination of unfavorable training points (that cannot be among the k closest neighbors of y) and an effective parallel programming approach based on the discrete Fourier transform. The significant speedup gained over brute force search on practical datasets is reported. We also provide the mathematical basis of a conjecture that, if true, would enable the speedup to be significantly improved. The application of the approach to classification by support vector machines and k-means clustering is also discussed. Keywords: k-nearest neighbors | Circulant matrix | Fast Fourier transform | Parallel computing | Image processing | Rotation-invariance
مقاله انگلیسی
9 An MPI–CUDA library for image processing on HPC architectures
کتابخانه MPI-CUDA برای پردازش تصویر در معماری HPC-2015
Scientific image processing is a topic of interest for a broad scientific community since it is a mean of gaining understanding and insight into the data for a growing number of applications. Furthermore, the technological evolution permits large data acquisition, with sophisticated instruments, and their elaboration through complex multidisciplinary applications, resulting in datasets that are growing at an extremely rapid pace. This results in the need of huge computational power for the processing. It is necessary to move towards High Performance Computing (HPC) and to develop proper parallel implementations of image processing algorithms/operations. Modern HPC resources are typically highly heterogeneous systems, composed of multiple CPUs and accelerators such as Graphics Processing Units (GPUs) and Field-Programmable Gate Arrays (FPGAs). The actual barrier posed by heterogeneous HPC resources is the development and/or the performance efficient porting of software on such complex architectures. In this context, the aim of this work is to enable image processing on cluster of GPUs, through the use of PIMA(GE) 2 Lib, the Parallel IMAGE processing GEnoa Library. The library is able to exploit traditional clusters through MPI, GPU device through CUDA and a first experimentation is aimed to explore the use of GPU-clusters. Library operations are provided to the users through a sequential interface defined to hide the parallelism of the computation. The parallel computation, at each level, is managed employing specific policies designed to suitably coordinate the parallel processes/threads involved in the elaboration and their use is tightly coupled with the PIMA(GE) 2 Lib interface. In this paper, we present the incremental approach adopted in the development of the library and the performance gains in each implementations: quite linear speedup is achieved on cluster architecture, about a 30% improvement in the execution time on a single GPU and the first results on cluster of GPUs are promising. Keywords: Image processing | Parallel computing | GPU
مقاله انگلیسی
10 یک بررسی بر تکنیک‌های گوناگون توازن بار و چالش‌های رایانش ابری
سال انتشار: 2014 - تعداد صفحات فایل pdf انگلیسی: 4 - تعداد صفحات فایل doc فارسی: 12
رایانش ابری یک تکنولوژی در حال ظهور است که یک استاندارد جدید از پردازش موازی و توزیع شده مقیاس بزرگ ارائه می‌دهد. رایانش ابری منابع مشترک، اطلاعات، پکیج‌های نرم افزاری و دیگر منابع مشترک را به ازای هر نیاز کلاینت در زمان خاص ایجاد می‌کند. با رشد سریع رایانش ابری و جذب کاربران بیشتر به استفاده از این رایانش همگانی، سرویس‌های بهتر و سریعتری ارائه شده است. برای مدیریت بهتر، به تکنیک‌های توازن بار خوب موجود نیاز است. لذا توازن بار در ابر به یک عرصه پژوهشی مورد توجه تبدیل شده است. و با توازن بهتر بار در ابر، عملکرد افزایش می‌یابد و کاربران سرویس‌های بهتری را اتخاذ می‌کنند. در اینجا این مقاله بر بسیاری از تکنیک‌های توازن بار استفاده شده برای حل مسائل محیط رایانش ابری بحث می‌کند.
کلمات کلیدی: رایانش ابری | مدل سرویس ابر | توازن بار | بهینه سازی | اولویت | زمان بندی وظایف | رایانش همگانی
مقاله ترجمه شده
موضوعات
footer