很多人以為:視頻壓縮,就是把文件變小。
但真正的視頻編碼,本質(zhì)上更像:在欺騙人類的大腦。
因為一秒視頻,其實是:24、30、60 甚至上百張圖片連續(xù)播放。
一部兩小時的4K電影,可能包含幾十萬到上千萬幀畫面。
如果每一幀都完整保存,體積會大到離譜。
所以問題來了:有沒有必要,每一幀都完如何把幾千萬幀畫面,壓縮到極小體積,還盡量不損失質(zhì)量整存儲?
答案是:沒必要。
![]()
因為現(xiàn)實世界的大部分畫面,其實并沒有變化。
比如一個采訪視頻:真正變化的,可能只有嘴巴和眼睛。
背景、墻壁、衣服,幾乎不動。
于是現(xiàn)代視頻編碼干了一件極其聰明的事:它不記錄整張圖。
而是:只記錄變化的部分。
比如:
第一幀完整保存。
第二幀這個區(qū)域往右移動了2像素。
第三幀這個嘴巴顏色變了一點。
第四幀背景沒變化,不用重復(fù)存。
這就是視頻壓縮最核心的邏輯:時間冗余壓縮
它本質(zhì)上是在說:別重復(fù)記錄已經(jīng)知道的信息。
但這還只是第一層。
真正恐怖的是:現(xiàn)代編碼器甚至開始研究,人眼到底“看不見”什么。
因為人的視覺系統(tǒng)并不完美。
比如:
- 人眼對亮度更敏感;
- 對顏色變化沒那么敏感;
- 對高速運動細節(jié)不敏感;
- 對邊緣特別敏感;
- 對噪點容忍度高。
于是編碼器開始有選擇地丟棄信息。
比如:
- 偷偷降低顏色精度;
- 減少人眼不敏感區(qū)域的細節(jié);
- 在高速運動時模糊部分紋理;
- 只保留你最容易注意到的部分。
這叫:有損壓縮
聽起來很可怕。
但現(xiàn)代互聯(lián)網(wǎng)幾乎所有視頻,都在使用它。
因為:真正重要的不是數(shù)據(jù)完整。
而是:你感覺它完整。
于是你會發(fā)現(xiàn):視頻編碼其實非常哲學。
它不是在保存現(xiàn)實。
而是在保存:人類以為自己看見的現(xiàn)實。
這也是為什么:現(xiàn)代編碼器越來越像AI。
它們不再只是機械壓縮文件。
而是在預(yù)測:
- 哪些信息人類在意;
- 哪些細節(jié)可以欺騙過去;
- 如何用最少的數(shù)據(jù),維持真實感。
所以今天一個幾GB的電影,才能被壓縮到幾百MB,
還能讓你覺得:畫質(zhì)沒什么區(qū)別。
本質(zhì)上,這是人類工程史上最成功的一次:對感知系統(tǒng)的逆向工程。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.