Abstract:Designing a videocodec involves a four-way tradeoff among computational complexity, data rate, picture quality, and latency. Rapid advancement in very large-scale integration technology has provided CPUs with enough power to accommodate a software-only videocodec. Accordingly, computational complexity has resurfaced as a major element in this tradeoff. With a view toward significantly reducing computational complexity relative to standards-based videocodecs, we introduce a pixelwise conditional differential replenishment scheme to compress video via perception-sensitive decomposition of difference frames into a facsimile map and an intensity vector. Our schemes, which apply techniques from facsimile, are transform free. Some of them also involve no motion compensation and hence are completely free of block-based artifacts and particularly computationally economical. The fusion of our facsimile-based video-coding schemes and spatio-temporal perceptual-coding techniques facilitates powerful software-only video conferencing on today's medium- and highend personal computers. Indeed, assuming that a frame-capture driver has been provided, our motion-compensation-free approach has yielded a software-only, full-duplex, full-color videoconferencing system that conveys high-quality, CIF/Q-NTSC-sized video at 30 frames per second on 200-MHz Pentium PCs sending less than 300 Kbps in each direction. We also present new spatio-temporal compression techniques for perceptual coding of video. These techniques, motivated by the classical psychological experiments that led to formulation of the Weber-Fechner law, allow videocodec systems to capitalize on properties of the human visual system. Some of our spatiotemporal perceptual techniques not only apply to our proprietary pixelwise conditional differential replenishment schemes that we describe for video conferencing but also can readily be incorporated into today's popular video standards.

Robust Ultralow Bitrate Video Conferencing with Second Order Motion Coherency

Video Conference System for Enhancing Quality of Target Region under Low Bit Rate

Ultra-low bitrate video conferencing using deep image animation

Towards Ultra-Low-Bitrate Video Conferencing Using Facial Landmarks

A Hybrid Deep Animation Codec for Low-bitrate Video Conferencing

Semantic Neural Rendering-based Video Coding: Towards Ultra-Low Bitrate Video Conferencing

Resolution-Agnostic Neural Compression for High-Fidelity Portrait Video Conferencing via Implicit Radiance Fields

A Scalable Video Conferencing System Using Cached Facial Expressions.

Enhancing Bandwidth Efficiency for Video Motion Transfer Applications using Deep Learning Based Keypoint Prediction

Extreme Generative Human-Oriented Video Coding Via Motion Representation Compression.

A software-only videocodec using pixelwise conditional differential replenishment and perceptual enhancements

Low-Complexity 3D-Vision Conferencing System Based on Accelerated RIFE Model

Predictive Coding For Animation-Based Video Compression

Quality Harmonization for Virtual Composition in Online Video Communications

Low Bit-Rate Video Coding Via Mode-Dependent Adaptive Regression for Wireless Visual Communications.

Decomposition, Compression, and Synthesis (DCS)-based Video Coding: A Neural Exploration via Resolution-Adaptive Learning

One-Click Upgrade from 2D to 3D: Sandwiched RGB-D Video Compression for Stereoscopic Teleconferencing

Content-aware Facial Image Compression with Deep Learning Method

Low-bitrate Volumetric Video Streaming with Depth Image

Spatial Decomposition and Temporal Fusion based Inter Prediction for Learned Video Compression

Encoder-Decoder Joint Enhancement for Video Chat