用聽(tīng)眾的語(yǔ)音質(zhì)量意見(jiàn)取平均值并評分
MOS | 質(zhì)量 | 雜音 |
5 | 非常好 | 感知不到失真 |
4 | 好 | 能感知到失真但不反感 |
3 | 一般 | 能感知到失真但稍微反感 |
2 | 不好 | 能感知到失真且反感 |
1 | 差 | 能感知到失真且非常反感 |
多年來(lái),國際電信聯(lián)盟和其他種族攜手擬制方法和建議,利用設備測試從感知上評估通信通道的語(yǔ)音質(zhì)量,從而提供可比較人類(lèi)聽(tīng)眾報告結果的MOS語(yǔ)音評估以及其他結果以供其他原因分析。
POLQA與PESQ均無(wú)需大量聽(tīng)眾即可生成MOS語(yǔ)音評估結果,將預錄的語(yǔ)音樣本通過(guò)被測設備(DUT ), 并與原語(yǔ)音樣本比較。算法評估參考音頻和劣化音頻之間的差異并生成結果。

ANST采用兩大建議書(shū)POLQA和PESQ,提供適用于8192D電聲綜合測試儀的語(yǔ)音感知音頻評估測量法。2001 年P(guān)ESQ獲批成為ITU-T(國際電信聯(lián)盟電信標準化部門(mén))推薦方法,至今仍在使用中。POLQA于2011年獲國際電信聯(lián)盟電信標準化部門(mén)批準并于2014年修訂,較PESQ有很多改進(jìn)。
通過(guò)特殊藍牙"“配置、電話(huà)網(wǎng)絡(luò )、( VolP )連接和其他依靠有損語(yǔ)音的編的通道的語(yǔ)音非常適用于感知音頻評估,正如包括聲學(xué)傳感器和聲空間的信號通路。
POLQA和PESQ如何選擇
本技術(shù)說(shuō)明主要介紹POLQA,這是目前推薦使用的一種感知音頻測量模型。為兼容傳統設備、法規要求,部分用戶(hù)可能需要使用PESQ。
以下簡(jiǎn)單對比了POLQA與PESQ:
POLQA彌補了PESQ模型的缺點(diǎn),可以處理頻帶更寬的音頻信號。其他改進(jìn)還可以處理時(shí)間呼叫信號和含延遲變化的信號。
PESQ支持涵蓋公用通話(huà)頻帶的窄頻帶測量(8kS/s采樣率,300- 3400 Hz)和涵蓋更廣范圍的寬頻帶測量(16kS/s采樣率,100- -7000Hz )。
POLQA增加了超寬頻帶模式( 48 kS/s采樣率,50--14000Hz),以調節的高清語(yǔ)音編和網(wǎng)絡(luò )。國際電信聯(lián)盟電信標準化部門(mén)的一項評估表明POLQA在窄頻帶和寬頻帶模式下表現均超越PESQ。
POLQA能更精確地評測電平差(與主觀(guān)聽(tīng)感相比)。
POLQA根據人類(lèi)感知衡量線(xiàn)性頻率失真,而PESQ往往對此類(lèi)失算不敏感。
PESQ對轉換器之間的鐘差比較敏感,而POLQA可以補償鐘差和其他時(shí)間效應。
POLQA全面支持聲學(xué)測量,包括在模擬頭部和軀干、模擬人嘴和模擬人耳上使用聽(tīng)筒和換能器進(jìn)行測試。