دسته بندی:
شبکه - Network
سال انتشار:
2019
ترجمه فارسی عنوان مقاله:
شبکه های هشینگ عمیق محدود شده دودویی برای بازیابی تصاویر بدون حاشیه نویسی
عنوان انگلیسی مقاله:
Binary Constrained Deep Hashing Network for Image Retrieval without Manual Annotation
منبع:
2019 IEEE Winter Conference on Applications of Computer Vision (WACV)
نویسنده:
Thanh-Toan Doy Tuan Hoangz Dang-Khoa Le Tanz Trung Pham? Huu Le? Ngai-Man Cheungz Ian Reid
چکیده انگلیسی:
Learning compact binary codes for image retrieval task
using deep neural networks has attracted increasing attention recently. However, training deep hashing networks for
the task is challenging due to the binary constraints on the
hash codes, the similarity preserving property, and the requirement for a vast amount of labelled images. To the best
of our knowledge, none of the existing methods has tackled
all of these challenges completely in a unified framework.
In this work, we propose a novel end-to-end deep learning approach for the task, in which the network is trained to
produce binary codes directly from image pixels without the
need of manual annotation. In particular, to deal with the
non-smoothness of binary constraints, we propose a novel
pairwise constrained loss function, which simultaneously
encodes the distances between pairs of hash codes, and the
binary quantization error. In order to train the network with
the proposed loss function, we propose an efficient parameter learning algorithm. In addition, to provide similar /
dissimilar training images to train the network, we exploit
3D models reconstructed from unlabelled images for automatic generation of enormous training image pairs. The extensive experiments on image retrieval benchmark datasets
demonstrate the improvements of the proposed method over
the state-of-the-art compact representation methods on the
image retrieval problem.
Keywords: Image retrieval | Binary codes | Training | Three-dimensional displays | Task analysis | Training data | Feature extraction
چکیده فارسی:
یادگیری کد های دودویی فشرده برای وظیفه بازیابی تصاویر با استفاده از شبکه های عصبی عمیق ، باعث شد است که تحقیقات توجهشان به این زمینه جلب شود. اما، تمرین شبکه های هشینگ عمقی برای این وظیفه چالش بر انگیز می باشد زیرا محدودیت های باینری بر روی این کد ها وجود دارد، این شبکه ها ویژگی حفظ شباهت را دارند و نیاز به حجم گسترده ای از تصاویر نام گذاری شده وجود دارد. بر اساس دانش ما، هیچ کدام از روش های تحقیقاتی تمام این چالش ها را به صورت کامل در یک قالب کاری یکنواخت بررسی نکرده است. در این کار، ما یک روش یادگیری نقطه به نقطه جدید را ارائه می کنیم که برای این وظیفه مورد استفاده قرار می گیرد. که در این روش، شبکه به صورتی تمرین داده می شود که بتواند کد های باینری را به صورت مستقیم از پیکسل های تصاویر به دست بیاورد بدون این که نیاز به تفسیر دستی تصاویر وجود داشته باشد. به صورت خاص، باری کار با محدودیت های باینری غیر روان، ما یک تابع هدررفت محدود جفتی را ارائه می کنیم که به صورت همزمان فاصله بین جفت های کد های ترکیبی را اندازه گیری کرده و خطای کمی سازی باینری را هم محاسبه می کند. برای تمرین دادن شبکه ها با تابع ضرر پیشنهاد شده، ما یک برنامه موثر را به عنوان الگوریتم یادگیری ارائه می کنیم. به علاوه، برای ایجاد کردن تصاویر تمرین مشابه یا غیر مشابه برای تمرین دادن شبکه، ما از مدل های سه بعدی بازسازی شده از تصاویر بدون نام برای تولید خودکار جفت تصاویر تمرینی به صورت گسترده، استفاده می کنیم. آزمایش های گسترده بر روی مجموعه داده های معیار بازیابی تصاویر، نشان داده است که این روش نسبت به جدید ترین روش های ارائه فشرده تصاویر در رابطه با مسئله بازیابی تصاویر، بهبود یافته است.
واژههای کلیدی: بازیابی تصویر | کدهای دودویی | آموزش | نمایشگرهای سه بعدی | تجزیه و تحلیل وظیفه | داده های آموزش | استخراج ویژگی
حجم فایل: 380 کیلوبایت
قیمت: 40950 تومان
توضیحات اضافی:
تعداد نظرات : 0