OpenCV中庫函數的作用:歸一化。

中文名

歸一化

拼音

guī yī huà

基本介紹

定義與作用

歸一化就是要把需要處理的數據經(jīng)過(guò)處理后(通過(guò)某種算法)限制在你需要的一定范圍內。首先歸一化是為了后面數據處理的方便,其次是保證程序運行時(shí)收斂加快。歸一化的具體作用是歸納統一樣本的統計分布性。歸一化在0-1之間是統計的概率分布,歸一化在某個(gè)區間上是統計的坐標分布。歸一化有同一、統一和合一的意思。

目的

簡(jiǎn)而言之,是使得沒(méi)有可比性的數據變得具有可比性,同時(shí)又保持相比較的兩個(gè)數據之間的相對關(guān)系,如大小關(guān)系;或是為了作圖,原來(lái)很難在一張圖上作出來(lái),歸一化后就可以很方便地給出圖上的相對位置等。

在使用機器學(xué)習算法的數據預處理階段,歸一化也是非常重要的一個(gè)步驟。例如在應用SVM之前,縮放是非常重要的。Sarle的神經(jīng)網(wǎng)絡(luò )FAQ的第二部分(1997)闡述了縮放的重要性,大多數注意事項也適用于SVM??s放的最主要優(yōu)點(diǎn)是能夠避免大數值區間的屬性過(guò)分支配了小數值區間的屬性。另一個(gè)優(yōu)點(diǎn)是能避免計算過(guò)程中的數值復雜度。因為關(guān)鍵值通常依賴(lài)特征向量的內積(inner products),例如,線(xiàn)性核和多項式核,屬性的大數值可能會(huì )導致數值問(wèn)題。推薦將每個(gè)屬性線(xiàn)性縮放到區間[-1,+1]或者[0, 1]。

當然,必須使用同樣的方法縮放訓練數據和測試數據。例如,假設把訓練數據的第一個(gè)屬性從[-10,+10]縮放到[-1, +1],那么如果測試數據的第一個(gè)屬性屬于區間[-11, +8],必須將測試數據轉變成[-1.1, +0.8]。