當前位置:學問君>學習教育>畢業論文>

淺談面向公共資訊傳播的音頻水印算法

學問君 人氣:6.17K

摘要:提出了一種基於小波分解和倒譜技術的音頻數字水印算法,該算法透過對原始音頻進行小波多級分解,從中選取低頻係數進行倒譜變換。透過統計均值的計算和調整方法設計,完成了水印的嵌入。實驗結果表明該算法能夠有效地抵抗A/D和D/A攻擊,誤碼率爲O,隱藏容量較大。同時,本算法還能夠抵抗一定的AMR攻擊,爲手機音頻的安全傳播和管理提供了新的前景。

淺談面向公共資訊傳播的音頻水印算法

關鍵詞:音頻水印;小波變換;倒譜;模/數轉換;AMR格式

0、引言

在電視廣播、交通臺和音樂會等公共資訊傳播領域,音頻的版權管理和安全傳輸都非常重要。如果採用數字水印技術,則需要水印算法能夠抵抗A/D和D/A轉換。目前,具有這種變換的類型可以劃分爲三種。第種是基於電纜傳輸方式,以電話線傳播和直通電纜連接爲典型,所受干擾小。電話線方式是公用信道,能夠傳播很遠,傳輸祕密水印的載體可以是話音或音樂等類型;而直通電纜方式一般在一個辦公實驗的局部環境中。第二種是基於廣播方式,透過廣播媒體或專用頻道進行傳播。第三種是基於空氣直接傳播方式,會遭遇各種干擾,通常只能近距離設計。由於音頻水印的遠程傳輸和提取具有廣泛的應用價值,這些音頻傳播水印技術在國外已經受到了極大重視並有所成果。在空氣傳播水印資訊方面,德國的steinebach等人…開展了最早的研究,透過設定5—4oocm的多個不同間距,同時使用了4種不同的麥克風,研究了5種音頻類型的水印技術,在5~180cm的間距普遍獲得了良好的提取效果。隨後,日本的achibana等人口研究將水印實時地隱藏到公共環境如音樂演奏會的音樂之中,能夠成功地在一個30s音樂片段內隱藏64b的消息,測試的空氣傳播距離爲3m。在電話網絡傳播方面,加拿大的chen等人開展了模擬電話通道的隱藏,在誤碼率小於0.001時,其數據帶寬達到了265bps。日本的Modegi等人設計了一套非接觸水印提取方案,透過手機來廣播或轉存水印音頻,然後,透過計算機將祕密從轉存的音頻檔案提取出來。隱藏帶寬達到61.5bps,提取率高於90%。但是,這幾種研究結果並沒有對算法做詳細描述。在直通電纜傳播方面,項世軍等人採用了三段能量比值方法,嵌人的是一串32b資訊,雖然提取效果比較好,但由於實驗容量太小,實用性不夠,且對同步技術有較高的要求;王讓定等人採用改進的量化方法、馬冀平等人”採用了DCT方法,嵌入的.都是小圖片,但提取效果一般,僅可辨認。雷贄等人在短波廣播含水印音頻算法方面取得了可喜的進展,透過多種同步方案和算法設計,使水印提取的模擬和實測過程都達到了較好的效果,但實驗容量很小。此外,由守傑等人設計了一種相似度計算方法,由於是非盲提取,不適於廣播通信領域。作者利用小分段的直方圖特性,開展了抗A/D轉換的音頻水印初步研究,在每段開頭總能獲得正確提取,但在每段的後續隱藏效果不佳,還需要做許多改進。

可見,在面向公共音頻傳播方面,如何既能提高隱藏效果又能增大容量,仍然是音頻水印算法要解決的一個難題。本文透過數據特性分析,採用倒譜技術和小波分解方法,成功地解決了問題,且能夠抵抗一定的手機彩鈴AMR攻擊,爲實用化提供了重要基礎。

1、數據特性描述

音頻信號經過具有A/D和D/A轉換的傳輸過程時,必然要涉及到以下問題:

1)音頻信號要經歷傳輸過程中的外加干擾,包括50Hz的工頻電信號,因此,需要選擇大於50Hz的音頻頻率信號;

2)因聲卡特性不同,音頻轉換過程不一定具有線性模型;

3)傳輸中錄製的音量往往與播放的音量不一致,這要求水印算法能夠抵抗音量的大範圍變化;

4)傳輸中錄製開始時刻可能早於也可能晚於播放時刻而且結束時刻也不一定一致,所以水印隱藏的起始位置需要沒置標誌;

5)轉換過程具有一定的濾波特點,可濾除較高頻率信號。

1.1音頻頻率範圍選擇

對照音頻頻率響應特性圖可以發現,在低頻部分的閾值比2kHz~4kHz的要高得多,不容易察覺;尤其是1kHz以下部分,其不可感知性要好得多。文獻的實驗也表明,音頻數據透過A/D和D/A轉換後,其低頻範圍700Hz以下的損失非常小。可見,選擇在頻率爲(50,700)範圍內的音頻數據,用於資訊隱藏非常有利。

1.2倒譜系數的選取方法

倒譜變換在音頻水印中已經具有了較強的健壯性,能夠抵抗噪聲、重採樣、低通濾波、重量化和音頻格式轉換等常見攻擊。倒譜變換後的數據特徵表現爲:倒譜系數在中間部分的差異很小,而在兩端的變化很大。

圖1是對音頻進行7級小波分解後,選取5~7級高頻數據部分進行倒譜變換情形。在進行統計處理時,如果讓全部數據參與,則計算結果在隱藏前後有明顯變化;如果不考慮兩側若干個大數據,僅以中間大部分數據參與運算,則計算結果容易保持在一個穩定範圍內。

進一步,如果將計算的均值移除,即相當於此時的均值爲0。然後,在0的上下兩邊產生一個偏差,如2,以分別隱藏比特資訊“1”和“0”。則在提取時,只需要判斷所求均值是否大於0,就可以求得水印比特。這種方法,稱之爲“數據分離調整”技術。

2、算法分析與設計

2.1隱藏算法流程設計

將原始音頻分段時,段數至少是水印比特數。然後,對每段數據進行小波分解,取其低頻係數進行倒譜變換,採用前述的數據分離調整技術,以實現水印比特嵌入。之後,先後重組倒譜系數和小波係數,獲得含有水印資訊的音頻段,從而構造爲新的音頻。該算法流程如圖2所示。

爲了增強可靠性,對水印資訊先做糾錯處理,採用BCH編碼方法。算法的主要工作是尋找合理的參數優化配置,使隱藏效果達到最優。參數主要有:小波分解級數、分段的數據幀長度、數據幀的間距、上下分離的閾值將數據幀的間距設定爲數據幀長度的倍數,最大爲1,最小爲0。期間選擇多個係數,結果發現都可以成功實現隱藏。

2.2水印嵌入算法設計

1)水印資訊處理。

音頻載體分段數至少應該大於,才能滿足隱藏要求。

假設每段長爲,該段經過小波變換的級分解後,各級小波係數長度分別爲:

取低頻係數部分,使之頻率範圍位於(50,l000)內,則需要構造一個組合的低頻小波係數集合。以8kHz音頻爲例,實施7級小波分解後,所選擇的低頻係數部分爲:

P的長度非常重要。如果太小了,對隱藏不利;反之,就需要更長的音頻載體。所以,音頻分段與小波分解具有密切的關係。

3)倒譜變換。

復倒譜變換對於信號序列的均值大於或等於0時,其逆變換可逆;否則不可逆。爲此,需要計算指定段信號的均值,若均值小於0則取反。然後對所有指定段進行復倒譜變換。

4)倒譜系數的選取。

去掉首尾波動很大的部分,而選擇中間平穩的部分嵌入水印。假設兩端各去掉L0個數據,則實際用於隱藏水印的倒譜系數長度爲:

5)去均值化處理。

計算剩餘部分的均值,然後用每一個倒譜系數減去該均值,得到倒譜系數的相對值。

6)嵌入水印。

給定一個閾值T,採用整體上下拉開的思路,對以上的相對倒譜系數進行修改,得到最終的倒譜系數,從而實現水印的嵌入。

7)重構音頻信號。

對嵌入水印的段重構後,實施復倒譜反變換。然後進行小波重構,從而得到含有水印比特的音頻段。將所有這些段重構,就獲得了含全部水印資訊的音頻。

2.3水印提取

水印提取過程的前半部分與嵌入過程是一樣。在提取出比特序列後,再經過BCH解碼處理,從而得到隱藏的水印比特序列。水印提取的流程如圖3所示。

對獲得的倒譜系數去兩側數據,計算剩下的倒譜系數平均值。按照以下規則進行隱藏資訊的提取:

在資訊傳播方面.針對A/D和D/A傳播採用『_直通電纜的傳輸方式,在單機上用電纜將音頻輸入輸出口相連。傳輸線爲音頻線1.8m和延長線1.8m,共3.6m。此外,針對手機彩鈴傳播採用了AMR方式。隱藏水印設計了三種方案,如圖4所示。

小容量的便於AMR處理,大容量的便於實用化。

仿真工具爲Matlab7.2.使用windowsMediaPldrver播放器播放音頻載體,使用CoolEdit Pro工具進行錄音、編輯和攻擊處理。

基本參數選擇爲:選用Harr小波進行7級小波分解後,按照式(4)選取低頻係數區域,所得頻段在77.5~5o0Hz範圍。式(7)中的爲L0,式(9)中T值的合適範圍在0.005~0.025中實驗選取。式(3)中的取值爲3200非常合適,此時,實際參與計算均值的數據爲155。

3.2音頻載體的影響

音頻載體選擇了三種,如表1所示,

其採樣頻率8kHz,樣本精度爲16b,單聲道,段的長度爲3200。音頻轉換爲8kHz的目的是爲了今後在電話網上的隱蔽傳輸,並可以轉化爲AMR檔案,傳輸到手機中,成爲手機彩鈴的版權管理目的。

經過A/D和D/A傳播後,4×4水印提取的誤碼情況如表1所示。可見,載體的選用非常重要;同時,從音頻質量上考慮,選用較小的T值更有利於保證信噪比。所以,以下的實驗採用的是“奧運主題歌”。

3.3閾值參數的合理計算

選擇了水印“北”進行比較測試,如圖5所示。結果表明,在T值爲0.016時,誤碼率爲0,效果最佳。爲此,後續實驗也採用該值。

3.4大容量A/D和D/A傳輸

採用圖像水印“北京”進行大容量測試,音頻載體選用“奧運主題歌”。圖6爲經過A/D和D/A轉換前後的數據均值計算對比情況.共有BcH編碼的555個數據。按照式(10)

提取後,能夠完全正確提取,且誤碼率爲0。進一步,將本文算法的實驗效果與已有屬於盲提取的研究結果相比較,如表2所示。

可見,本文算法雖然帶寬小,但水印能夠正確提取,而且嵌入容量較大。由於實驗中使用了8kHz的音頻載體,能夠廣泛應用於語音傳輸和手機彩鈴等場合,所以在電話網絡廣播方面的實用性強。

3.5抗AMR轉換

隨着手機彩鈴的普遍使用,彩鈴的安全傳播和管理將成爲新的問題。本算法在這方面也開展了新的嘗試,將水印隱藏在彩鈴中,可以起到版權保護或祕密資訊傳播的作用。

目前手機錄音放音格式多數是AMR格式,要求算法能夠抵抗AMR轉換攻擊。在上述的音頻載體中成功完成水印嵌入後,需要將採樣精度l6b、採樣頻率爲8000的波形音頻轉換爲AMR格式,就可以存入手機中使用或發送給他人。提取時,先將AMR檔案轉換爲wAV格式,然後再提取水印資訊。

AMR轉換工具爲MIKS0FTMobiIeAMR convener,可以進行WAVE與AMR兩種格式的相互轉換。實驗中使用的水印資訊爲圖4(a)水印,採用BcH(31,16,3),閩值設定爲0.0195時,B脒達到0,取得了滿意的效果。

4、結語

鑑於音頻信號的低頻特徵,並綜合應用倒譜技術和小波多級分解方法,成功地實現了抗A/D和D/A轉換的音頻水印算法,誤碼率爲0,不需要同步碼;而且,隱藏資訊具有較大的容量,具備了一定的實用性;同時,算法還能夠抵抗一定的AMR攻擊,既能實現手機彩鈴的安全傳播和管理,又能在線錄製手機通信中的含水印音頻,具有較好的應用前景。今後,需要在AMR檔案中隱藏大容量水印資訊,使之更具有實用性。