دسته بندی:
شبکه های عصبی - Neural Networks
سال انتشار:
2021
ترجمه فارسی عنوان مقاله:
یک رویکرد فیلترینگ درون حلقه ای پیشرونده شبکههای عصبی پیچشی یا همگشتی (CNN) برای کدگذاری بین فریم (Frame inter)
عنوان انگلیسی مقاله:
A progressive CNN in-loop filtering approach for inter frame coding
منبع:
ScienceDirect- Elsevier -Signal Processing: Image Communication 94 (2021) 116201
نویسنده:
Dandan Ding a, Lingyi Kong a, Wenyu Wang a, Fengqing Zhu b,∗
چکیده انگلیسی:
Convolutional Neural Network (CNN) structures have been designed for in-loop filtering to improve video
coding performance. These CNN models are usually trained through learning the correlations between the
reconstructed and the original frames, which are then applied to every single reconstructed frame to improve
the overall video quality. This direct model training and deployment strategy is effective for intra coding since
a locally optimal model is sufficient. However, when applied to inter coding, it causes over-filtering because the
intertwined reference dependencies across inter frames are not taken into consideration. To address this issue,
existing methods usually resort to the Rate–Distortion Optimization (RDO) to selectively apply the CNN model,
but fail to address the limitation of using a local CNN model. In this paper, we propose a progressive approach
to train and incorporate the CNN-based in-loop filters to work seamlessly with video encoders. First, we develop
a progressive training method to obtain the inter model. Using transfer learning, reconstructed frames using the
CNN model are progressively involved back into the training of the CNN model itself, to simulate the reference
dependencies in inter coding. Next, we design a frame-level model selection strategy for the high-bitrate coding
where the over-filtering effect is diluted. Experimental results show that the proposed method outperforms the
RDO method that utilizes only local model. Proposed approach also achieves comparable coding performance
but with less computational complexity when integrating our progressive model into the RDO scheme.
Keywords: CNN | In-loop filtering | Model training | Inter coding
چکیده فارسی:
ساختارهای شبکههای عصبی پیچشی (CNN) برای فیلترینگ درون حلقهای طراحی شدهاند تا عملکرد کدگذاری ویدئو را بهبود بخشند. این مدلهای CNN معمولا از طریق یادگیری همبستگی بین فریمهای بازسازی شده و اصلی آموزش داده میشوند، که سپس برای هر فریم بازسازی شده اعمال میشوند تا کیفیت کلی ویدئو بهبود یابد. این استراتژی توسعه و آموزش مستقیم مدل برای درون کد گذاری موثر است زیرا یک مدل بهینه محلی کافی است. با این حال، هنگامی که برای رمزگذاری داخلی اعمال میشود، باعث فیلترینگ بیش از حد میشود، زیرا وابستگیهای مرجع درهمتنیده در میان فریمها در نظر گرفته نمیشوند. برای پرداختن به این موضوع، روشهای موجود معمولا به بهینهسازی نرخ تحریف یا اعواج (RDO) متوسل میشوند تا به صورت دلخواه از مدل CNN استفاده کنند، اما در رفع محدودیت استفاده از مدل CNN محلی موفق نیستند. در این مقاله، ما یک روش پیشرفته برای آموزش و ترکیب فیلترهای داخلی مبتنی بر CNN برای کار یکپارچه با کدکنندههای ویدئویی ارائه میکنیم. ابتدا، ما یک روش آموزش پیشرفته را برای به دست آوردن مدل داخلی توسعه میدهیم. با استفاده از یادگیری انتقالی، فریم های بازسازی شده با استفاده از مدل CNN به تدریج وارد آموزش خود مدل CNN میشوند تا وابستگیهای مرجع در کدگذاری داخلی را شبیهسازی کنند. سپس، یک استراتژی انتخاب مدل سطح چارچوب برای کدگذاری نرخ بیت بالا طراحی میکنیم که در آن اثر فیلترینگ بیش از حد رقیق میشود. نتایج تجربی نشان میدهند که روش پیشنهادی از روش RDO که تنها از مدل محلی استفاده میکند، بهتر عمل میکند. رویکرد پیشنهادی همچنین به عملکرد رمزگذاری قابل مقایسه دست مییابد اما پیچیدگی محاسباتی کمتری هنگام یکپارچه سازی مدل مترقی ما در طرح RDO دارد.
کلمات کلیدی: شبکههای عصبی پیچشی یا همگشتی (CNN) | فیلترینگ درون حلقهای | آموزش مدل | کدگذاری داخلی
حجم فایل: 1359 کیلوبایت
قیمت: 56160 تومان
توضیحات اضافی:
تعداد نظرات : 0