視音頻技術(shù)是信息與通信學(xué)科的前沿和熱點(diǎn)研究方向。

什么是視音頻

視音頻信息的標引主要包括兩個(gè)方面的內容,一個(gè)方面是關(guān)于磁帶、錄像帶等載體的形式特征信息或者是數字化視音頻信息的數據格式信息(如,磁帶或錄像帶類(lèi)型、視音頻碼率、文件格式等),另一個(gè)方面就是視音頻本身反映的內容信息(如,題名信息、主題詞信息、分類(lèi)信息等等)。

音頻是什么

正常人耳能聽(tīng)到的,相應于正弦聲波的任何頻率。正常人耳的音頻范圍一般約為16Hz~16kHz。通信科技(一級學(xué)科);通信原理與基本技術(shù)(二級學(xué)科)要在計算機內播放或是處理音頻文件,也就是要對聲音文件進(jìn)行數、模轉換,這個(gè)過(guò)程同樣由采樣和量化構成,人耳所能聽(tīng)到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽(tīng)不到的,因此音頻的最大帶寬是20KHZ,故而采樣速率需要介于40~50KHZ之間,而且對每個(gè)樣本需要更多的量化比特數。音頻數字化的標準是每個(gè)樣本16位(16bit,即96dB)的信噪比,采用線(xiàn)性脈沖編碼調制PCM,每一量化步長(cháng)都具有相等的長(cháng)度。在音頻文件的制作中,正是采用這一標準。