視頻會議的采集卡在采集攝像機輸出的VGA信號等模擬信號轉錄到計算機內部讓計算機處理視頻信息時首先有一個視頻信號的數模轉換過。
視頻采集卡是從動態視頻中實時或非實時捕獲圖像并存儲。它可以將攝像機、錄像機和其它視頻信號源的模擬視頻信號轉錄到計算機內部,也可以用攝像機將現場的圖像實時輸入計算機。視頻采集卡能在捕捉視頻信息的同時獲得伴音,使音頻部分和視頻部分在數字化時同步保存、同步播放
視頻的數字化過程AD轉換
要讓計算機處理視頻信息,首先要解決的是視頻數字化的問題。視頻數字化是將模擬視頻信號經模數轉換和彩色空間變換轉為計算機可處理的數字信號,與音頻信號數字化類似,計算機也要對輸入的模擬視頻信息進行采樣與量化,并經編碼使其變成數字化圖像。
視頻會議把模擬音頻轉成數字音頻的過程稱作采樣,簡單地說就是通過波形采樣的方法記錄1秒鐘長度的聲音,需要多少個數據。
在模擬視頻中,采樣率定義為幀頻和場頻,而不是概念上的像素時鐘。
采樣率和采樣大小(位/bit)
頻率對應于時間軸線,振幅對應于電平軸線。波是無限光滑的,弦線可以看成由無數點組成,由于存儲空間是相對有限的,數字編碼過程中,必須對弦線的點進行采樣。
采樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,為了復原波形,一次振動中,必須有2個點的采樣,人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。采樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級。
采樣率(也稱為采樣速度或者采樣頻率)定義了每秒從連續信號中提取并組成離散信號的采樣個數,單位用赫茲(Hz)來表示。采樣頻率的倒數是采樣周期(也稱為采樣時間),它表示采樣之間的時間間隔。
采樣定理表明采樣頻率必須大于被采樣信號帶寬的2倍,另外一種等同的說法是奈奎斯特頻率必須大于被采樣信號的帶寬。
舉個例子,假定信號的帶寬是100Hz,那么為了避免出現混疊現象,采樣頻率必須大于200Hz。換句話說,采樣頻率必須至少是信號中最大頻率分量頻率的2倍,否則就不能從信號采樣中恢復原始信號。
根據奈魁斯特(NYQUIST)采樣定理,用2倍于一個正弦波的頻率進行采樣就能完全真實地還原該波形,因此一個數碼錄音波的采樣頻率的取值直接關系到它的最高還原頻率指標。
例如用44.1KHZ的采樣頻率(采樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級)進行采樣,則可還原為最高22.05KHZ的頻率-----這個數值略高于人耳的聽覺極限44.1KHZ的還原頻率足已記示和真實再現世界上所有人再能辯的聲音,音頻信號的頻率一般達到20Hz,因此其采樣頻率一般需要40Hz。而人耳收聽的范圍只能到23Khz以下,所以CD的采樣率才是44.1Khz。22Khz×2=44Khz,考慮到一定的余量采用44.1Khz.
所以CD音頻的采樣規格定義為16bit。常見的 CD,采樣率為44.1kHz,
當然,即使在最理想的環境下用現實生活中幾乎不可能制造的高精密電子元器件真實地實現了16bit的錄音,仍然還是會受到濾波和聲特定位等問題帶來的干擾。人們從中還是能察覺出一些微小的失真,正因如此,很多專業數碼音頻系統目前已經開始使用18bit甚至24bit的采樣規格進行錄音和回放了。
在模擬視頻中,采樣率定義為幀頻和場頻,而不是概念上的像素時鐘。圖像采樣頻率是傳感器積分周期的循環速度。由于積分周期遠遠小于重復所需時間,采樣頻率可能與采樣時間的倒數不同。
* 50 Hz - PAL 視頻
* 60 / 1.001 Hz - NTSC 視頻
當模擬視頻轉換為數字視頻的時候,出現另外一種不同的采樣過程,這次是使用像素頻率.
采樣率和采樣大小的值越大,記錄的波形更接近原始信號。
比特率是指將數字聲音由模擬格式轉化成數字格式的采樣率,采樣率越高,還原后的音質就越好。比特率是指每秒傳送的比特(bit)數。單位為 bps(Bit Per Second),比特率越高,傳送的數據越大。也就是說越高文件越大,但是越加的清晰
采樣率值×采樣大小值×聲道數bps
音頻采樣率、采樣精度與每分鐘記錄波形文件大小的關系
采樣率 16bit 24bit
11kHz單聲道 1.3MB/min 1.9MB/min
11kHz立體聲 2.5MB/min 3.8MB/min
22kHz單聲道 2.8MB/min 3.8MB/min
22kHz立體聲 5.0MB/min 7.6MB/min
44kHz單聲道 5.0MB/min 7.6MB/min
44kHz立體聲 10.1MB/min 15.1MB/min
48kHz單聲道 5.5MB/min 7.6MB/min
48kHz立體聲 11.0MB/min 16.5MB/min
96kHz單聲道 11.2MB/min 16.5MB/min
96kHz立體聲 22.0MB/min 33.0MB/min
192kHz單聲道 22.0MB/min 33.0MB/min
192kHz立體聲 44MB/min 66.0MB/min
一個采樣率為44.1KHz,采樣大小為16bit,雙聲道的 PCM編碼的WAV文件,它的數據速率則為 44.1K×16×2 =1411.2 Kbps。我們常說128K的MP3,對應的WAV的參數,就是這個1411.2 Kbps,這個參數也被稱為數據帶寬,它和ADSL中的帶寬是一個概念。
位速是指在一個數據流中每秒鐘能通過的信息量;Kbps表示“每秒千字節數”,因此數值越大表示數據越多,位速越高,信息量越大!
將碼率除以8,就可以得到這個WAV的數據速率,即176.4KB/s。這表示存儲一秒鐘采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的音頻信號,需要176.4KB的空間,1分鐘則約為10.34M. 標簽:視頻會議技術文章 視頻會議行業動態