دسته بندی:
یادگیری عمیق - deep learning
سال انتشار:
2017
ترجمه فارسی عنوان مقاله:
تشخیص و بازیابی تصویر 3 بعدی مبتنی بر یادگیری عمیق چندمنظوره
عنوان انگلیسی مقاله:
3D Shape Recognition and Retrieval based on Multi-modality Deep Learning
منبع:
Sciencedirect - Elsevier - Neurocomputing Volume 259, 11 October 2017, Pages 183-193
نویسنده:
Shuhui Bua, Lei Wanga, Pengcheng Hana, Zhenbao Liua,∗, Ke Lib
چکیده انگلیسی:
For 3D shape analysis, an effective and efficient feature is the key to popularize its applications in 3D domain where the
major challenge lies in designing an effective high-level feature. The three-dimensional shape contains various useful
information including visual information, geometric relationships, and other type properties. Thus the strategy of
exploring these characteristics is the core of extracting effective 3D shape features. In this paper, we propose a novel
3D feature learning framework which combines different modality data effectively to promote the discriminability
of uni-modal feature by using deep learning. The geometric information and visual information are extracted by
Convolutional Neural Networks (CNNs) and Convolutional Deep Belief Networks (CDBNs), respectively, and then
two independent Deep Belief Networks (DBNs) are employed to learn high-level features from geometric and visual
features. Finally, a Restricted Boltzmann Machine (RBM) is trained for mining the deep correlations between different
modalities. Extensive experiments demonstrate that the proposed framework achieves better performance.
Keywords: 3D Shape | Recognition | Retrieval | Deep Learning | Multi Modality
چکیده فارسی:
ویژگی مؤثر و کارآمد تجزیهوتحلیل تصویر 3 بعدی، کلید تعمیم کاربردهای آن در حوزه 3 بعدی است که در آن چالش اصلی مربوط به طراحی یک ویژگی مؤثر سطح بالا است. شکل سهبعدی حاوی اطلاعات مفید مختلفی ازجمله اطلاعات بصری، روابط هندسی و سایر ویژگیهای مربوط به نوع است. بنابراین استراتژی کشف این خصوصیات، هسته غیرقابل استخراج ویژگیهای مؤثر شکل 3 بعدی است. در این مقاله، ما یک چارچوب جدید از یادگیری ویژگی سهبعدی ارائه میدهیم که با استفاده از یادگیری عمیق، اطلاعات حالات مختلف را بهطور مؤثر برای ترویج ویژگیهای تفکیککنندگی تک مدی ارائه میدهد. اطلاعات هندسی و اطلاعات بصری به ترتیب توسط شبکههای عصبی کانولوشنی (CNNs) و شبکههای باور عمیق کانولوشنی (CDBNs) استخراج میشوند و سپس دو شبکه باور عمیق (DBNs) مستقل برای یادگیری ویژگیهای سطح بالا از ویژگیهای هندسی و بصری استفاده میشوند. درنهایت، یک ماشین بولتزمن محصور (RBM) برای استخراج همبستگی عمیق بین حالتهای مختلف استفاده میشود. آزمایشهای گسترده نشان میدهد که چارچوب پیشنهادی عملکرد بهتری را به دست میدهد.
کلیدواژهها: شکل سهبعدی | تشخيص | بازيابي | آموزش عميق | چندمنظورهای
حجم فایل: 527 کیلوبایت
قیمت: 62400 تومان
توضیحات اضافی:
تعداد نظرات : 0