دانلود و نمایش مقالات مرتبط با Central Processing Unit::صفحه 1
بلافاصله پس از پرداخت دانلود کنید
نتیجه جستجو - Central Processing Unit

تعداد مقالات یافته شده: 4
ردیف عنوان نوع
1 تخصیص پایلوت و تحلیل نرخ برآیند در سیستم های MIMO عظیم فاقد سلول
سال انتشار: 2018 - تعداد صفحات فایل pdf انگلیسی: 6 - تعداد صفحات فایل doc فارسی: 22
این مقاله به مسأله ی چالش برانگیز سرریز غیرمقرون به صرفه ی آموزش کانال در سیستم چند ورودی چند خروجی (MIMO) عظیم متراکم فاقد سلول در زمان خدمت رسانی همزمان به تعداد زیادی کاربر می پردازد. با استفاده از روش خوشه ی کاربرمحور، طرح استفاده ی مجدد پویا از پایلوت ها (DPR) برای فراهم آوردن امکان اشتراک گذاری یک زنجیره پایلوت واحد توسط دو کاربر پیشنهاد شد. بطور ویژه، طرح استفاده ی مجدد پیشنهادی با هدف به حداکثر رسانیدن نرخ برآیند قابل دستیابی uplink مشروط به الزامات "نسبت سیگنال به تداخل به اضافه ی نویز" (SINR) و محدودیت های منابع پایلوت حاصل شد. بر این اساس، نمایش SINR برای تمامی کاربرانی که پایلوت خود را با کاربر دیگر شریک می شوند، با استفاده از هر دو روش تشخیص خطای حداقل ریشه ی میانگین مربعات (MMSE) و برآورد کانال استخراج شد. یک الگوریتم استفاده ی مجدد از کانال با پیچیدگی کم براساس تفکیک فاصله ی بین کاربران، ارائه شد. روش جستجوی شبکه ای تکرارشونده (IGS) برای یافتن آستانه ای که بتوان در الگوریتم پیشنهادی برای به حداکثر رسانیدن نرخ برآیند مورد استفاده قرار داد به کار گرفته شد. نهایتاً نتایج شبیه سازی برای نمایش اثربخشی طرح DPR با آستانه ی بهینه به لحاظ نرخ برآیند قابل دستیابی uplink ارائه شد.
کلمات کلیدی: ارتباطات MIMO | آنتن | Uplink | برآورد کانال | تداخل | نسبت سیگنال به نویز | واحد پردازش مرکزی
مقاله ترجمه شده
2 سازگاری یا مناسب بودن شتاب‌ دهنده‌های سخت‌افزاری اخیر (‏DSP ها، FPGA ها و GPU ها)‏ برای بینایی ماشین و الگوریتم های پردازش تصویر
سال انتشار: 2018 - تعداد صفحات فایل pdf انگلیسی: 19 - تعداد صفحات فایل doc فارسی: 73
الگوریتم های بینایی کامپیوتری و پردازش تصویر، اجزای ضروری بسیاری از کاربردهای صنعتی، پزشکی، تجاری و تحقیقاتی را تشکیل می‌دهند. سیستم‌های تصویربرداری مدرن تصاویر با وضوح بالا را در نرخ‌های فریم بالا فراهم می‌کنند و اغلب برای انجام محاسبات پیچیده برای پردازش داده‌های تصویر مورد نیاز هستند. با این حال، در بسیاری از کاربردها پردازش سریع مورد نیاز است، یا به حداقل رساندن تاخیر برای نتایج تجزیه و تحلیل امری حائز اهمیت است. در این کاربردها، واحدهای پردازش مرکزی (‏CPU ها) ‏ناکافی هستند، زیرا نمی‌توانند محاسبات را با سرعت کافی انجام دهند. برای کاهش زمان محاسبه، الگوریتم‌ها می‌توانند در شتاب‌دهنده‌های سخت‌افزاری مانند پردازشگرهای سیگنال دیجیتال (‏DSPs)، آرایه های دریچه‌ای برنامه‌پذیر میدانی (‏FPGA) ‏و واحدهای پردازش گرافیکی (‏GPU ها)‏ پیاده‌سازی شوند. با این حال، انتخاب یک شتاب‌دهنده سخت‌افزاری مناسب برای یک کاربرد خاص همواره چالش برانگیز بوده است. خانواده‌ها یا دسته های متعددی از DSP ها، FPGA ها و GPU ها در دسترس هستند و تفاوت‌های فنی بین شتاب‌دهنده‌های سخت‌افزاری مختلف مقایسه را دشوار می‌سازد. همچنین مهم است که بدانیم چه سرعتی را می توان با استفاده از یک شتاب ‌دهنده سخت‌افزاری خاص برای یک الگوریتم خاص به دست آورد، زیرا انتخاب شتاب‌ دهنده سخت‌افزاری ممکن است هم به الگوریتم و هم به برنامه بستگی داشته باشد. جزییات فنی شتاب‌دهنده‌های سخت‌افزاری و عملکرد آن‌ها در نشریات قبلی مورد بحث قرار گرفته ‌است. با این حال، در بسیاری از این ارائه‌ها محدودیت‌هایی وجود دارد، که، جزئیات فنی ناکافی برای فعال کردن انتخاب یک شتاب ‌دهنده سخت‌افزاری مناسب؛ مقایسه شتاب ‌دهنده‌های سخت‌افزاری در دو سطح فن‌آوری مختلف؛ و بحث در مورد تکنولوژی‌های قدیمی از جمله این موارد هستند.
برای پرداختن به این مسائل، ما ملاحظات مهم را در زمان انتخاب شتاب‌ دهنده‌های سخت‌افزاری مناسب برای بینایی کامپیوتر و وظایف پردازش تصویر معرفی و بحث می‌کنیم و یک بررسی جامع از شتاب‌ دهنده‌های سخت‌افزاری ارائه می‌دهیم. ما در مورد جزئیات عملی ساختارهای تراشه، ابزارها و امکانات موجود، زمان توسعه و مزایا و معایب استفاده از DSPs، FPGA ها و GPU ها بحث خواهیم کرد. ما اطلاعات عملی در مورد جدیدترین DSP ها، FPGA ها و GPU ها و همچنین مثال‌هایی از مقالات ارائه می‌دهیم. هدف ما این است که توسعه دهندگان را قادر سازیم تا مقایسه‌ای جامع بین شتاب ‌دهنده‌های سخت‌افزاری مختلف انجام دهند و یک شتاب ‌دهنده‌های سخت‌افزاری را انتخاب کنند که برای کاربرد خاص آن‌ها بسیار مناسب باشد.
کلمات کلیدی: مرور یا بازنگری | بینایی ماشین | پردازش تصویر | پردازشگر سیگنال دیجیتال (‏DSP)‏ | آرایه دریچه ای برنامه پذیر میدانی (‏FPGA)‏ | واحد پردازش گرافیکی (‏GPU)
مقاله ترجمه شده
3 A massively parallel Grammatical Evolution technique with OpenCL
تکنیک تکاملی گرامری موازی انبوه با OpenCL-2017
Grammatical Evolution (GE) is a bio-inspired metaheuristic capable of evolving programs in an arbitrary language using a formal grammar. Among the major applications of the technique, the automatic inference of models from data can be highlighted. As with other genetic programming techniques, GE has a high computational cost. However, the algorithm has steps that can be computed independently, enabling the use of parallel computing to reduce the execution time and, consequently, making it possible its application to larger and more complex problems. Here, models of massively parallel computation for GE are studied and proposed using OpenCL, a framework for the creation of parallel algorithms in heterogeneous computing environments. Computational experiments were conducted to analyze the performance of an implementation using GPUs (Graphics Processing Units), when compared to a sequential implementation in CPUs (Central Processing Units). Finally, speedups of up to 528× were achieved, when all steps are performed in parallel in a GPU.
Keywords: Grammatical evolution | Genetic programming | Parallel computing | OpenCL
مقاله انگلیسی
4 Massive parallelization of approximate nearest neighbor search on KD-tree for high-dimensional image descriptor matching
موازی سازی عظیم جستجوی نزدیکترین همسایه تقریبی در KD-tree برای تطبیق توصیفگر تصویر با ابعاد بزرگ-2017
To overcome the high computing cost associated with high-dimensional digital image descriptor match ing, this paper presents a massively parallel approximate nearest neighbor search (ANNS) on K-dimensional tree (KD-tree) on the modern massively parallel architectures (MPA). The proposed algo rithm is of comparable quality to traditional sequential counterpart on central processing unit (CPU). However, it achieves a high speedup factor of 121 when applied to high-dimensional real-world image descriptor datasets. The algorithm is also studied for factors that impact its performance to obtain the optimal runtime configurations for various datasets. The performance of the proposed parallel ANNS algorithm is also verified on typical 3D image matching scenarios. With the classical local image descrip tor signature of histograms of orientations (SHOT), the parallel image descriptor matching can achieve speedup of up to 128. Our implementation will potentially benefit realtime image descriptor matching in high dimensions.
Keywords: KD-tree | Approximate nearest neighbor search | Parallel algorithm | GPU | CUDA | Image descriptor matching
مقاله انگلیسی
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi