高级搜索

一种基于基音预测过程的语音信息隐藏方法

吴志军 李常亮 李荣

引用本文: 吴志军, 李常亮, 李荣. 一种基于基音预测过程的语音信息隐藏方法[J]. 电子与信息学报, doi: 10.11999/JEIT181163 shu
Citation:  Zhijun WU, Changliang LI, Rong LI. A Speech Information Hiding Method Based on Pitch Prediction Process[J]. Journal of Electronics and Information Technology, doi: 10.11999/JEIT181163 shu

一种基于基音预测过程的语音信息隐藏方法

    作者简介: 吴志军: 男,1965年生,教授,博士生导师,研究方向为网络和信息安全;
    李常亮: 男,1993年生,硕士生,研究方向为信息安全;
    李荣: 女,1995年生,硕士生,研究方向为信息安全
    通讯作者: 吴志军,zjwu@cauc.edu.cn
  • 基金项目: 天津市自然科学基金重点项目(17JCZDJC30900),国家自然科学青年基金(61601467),2018年中央高校基本科研业务费项目(3122018D007)

摘要: 针对低速率语音编码问题,该文提出基于G.723.1编码标准的信息隐藏算法。在基音预测编码过程中,通过控制闭环基音周期(自适应码本)的搜索范围,该文结合随机位置选择方法(RPS)和矩阵编码方法(MES),实现秘密信息的嵌入,在语音编码过程中实现了信息的隐藏。RPS方法的采用降低了载体码字之间的关联性,MES方法的采用降低了载体的改变率。实验结果证明,该文算法下PESQ恶化率平均值最大为1.63%,隐蔽性良好。

English

    1. [1]

      PETITCOLAS F A P, ANDERSON R J, and KUHN M G. Information hiding - a survey[J]. Proceedings of the IEEE, 1999, 87(7): 1062–1078. doi: 10.1109/5.771065

    2. [2]

      丁琦, 平西建. 基于脉冲位置参数统计特征的压缩域语音隐写分析[J]. 计算机科学, 2011, 38(1): 217–220, 224. doi: 10.3969/j.issn.1002-137X.2011.01.051
      DING Qi and PING Xijian. Steganalysis of compressed speech based on statistics of pulse position parameters[J]. Computer Science, 2011, 38(1): 217–220, 224. doi: 10.3969/j.issn.1002-137X.2011.01.051

    3. [3]

      DITTMANN J, HESSE D, and HILLERT R. Steganography and steganalysis in voice-over IP scenarios: Operational aspects and first experiences with a new steganalysis tool set[C]. Proceedings of SPIE 5681, Security, Steganography, and Watermarking of Multimedia Contents VⅡ, San Jose, USA, 2005: 607–618.

    4. [4]

      TIAN Hui, SUN Jun, CHANG C C, et al. Detecting bitrate modulation-based covert voice-over-IP communication[J]. IEEE Communications Letters, 2018, 22(6): 1196–1199. doi: 10.1109/LCOMM.2018.2822804

    5. [5]

      TIAN Hui, SUN Jun, CHANG C C, et al. Hiding information into voice-over-IP streams using adaptive bitrate modulation[J]. IEEE Communications Letters, 2017, 21(4): 749–752. doi: 10.1109/LCOMM.2017.2659718

    6. [6]

      XIAO Bo, HUANG Yongfeng, and TANG Shanyu. An approach to information hiding in low bit-rate speech stream[C]. Proceedings of 2008 IEEE Global Telecommunications Conference, New Orleans, USA, 2008: 1–5.

    7. [7]

      TIAN Hui, LIU Jin, and LI Songbin. Improving security of quantization-index-modulation steganography in low bit-rate speech streams[J]. Multimedia Systems, 2014, 20(2): 143–154. doi: 10.1007/s00530-013-0302-8

    8. [8]

      CHIANG Y K, TSAI P, and HUANG Fenglong. Codebook partition based steganography without member restriction[J]. Fundamenta Informaticae, 2008, 82(1/2): 15–27.

    9. [9]

      LI Songbin, JIA Yizhen, and KUO C C J. Steganalysis of QIM steganography in low-bit-rate speech signals[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2017, 25(5): 1011–1022. doi: 10.1109/TASLP.2017.2676356

    10. [10]

      HUANG Yongfeng, LIU Chenghao, TANG Shanyu, et al. Steganography integration into a low-bit rate speech codec[J]. IEEE Transactions on Information Forensics and Security, 2012, 7(6): 1865–1875. doi: 10.1109/TIFS.2012.2218599

    11. [11]

      LIU C, BAI S, and HUANG Y. An information hiding algorithm in G. 729a based on pith prediction[C]. Proceedings of the 10th National Academic Conference on Information Hiding and Multimedia Information Security, Beijing, China, 2012: 15–18. (请核对作者信息)

    12. [12]

      LIN Zinan, HUANG Yongfeng, and WANG Jilong. RNN-SM: Fast steganalysis of VoIP streams using recurrent neural network[J]. IEEE Transactions on Information Forensics and Security, 2018, 13(7): 1854–1868. doi: 10.1109/TIFS.2018.2806741

    13. [13]

      YANG Wanxia, TANG Shanyu, LI Miaoqi, et al. Steganalysis of low embedding rates LSB speech based on histogram moments in frequency domain[J]. Chinese Journal of Electronics, 2107, 26(6): 1254–1260. doi: 10.1049/cje.2017.09.026

    14. [14]

      WU Zhijun, Gao Wei, and YANG Wei. LPC parameters substitution for speech information hiding[J]. The Journal of China Universities of Posts and Telecommunications, 2009, 16(6): 103–112. doi: 10.1016/S1005-8885(08)60295-2

    15. [15]

      HUANG Yongfeng, TANG Shanyu, and YUAN Jian. Steganography in inactive frames of VoIP streams encoded by source codec[J]. IEEE Transactions on Information Forensics and Security, 2011, 6(2): 296–307. doi: 10.1109/TIFS.2011.2108649

    16. [16]

      李松斌, 贾已真, 付江云, 等. 基于码书关联网络的基音调制信息隐藏检测[J]. 计算机学报, 2014, 37(10): 2107–2117. doi: 10.3724/SP.J.1016.2014.02107
      LI Songbin, JIA Yizhen, FU Jiangyun, et al. Detection of pitch modulation information hiding based on codebook correlation network[J]. Chinese Journal of Computers, 2014, 37(10): 2107–2117. doi: 10.3724/SP.J.1016.2014.02107

    17. [17]

      TIAN Hui, JIANG Hong, ZHOU Ke, et al. Transparency-orientated encoding strategies for voice-over-IP steganography[J]. The Computer Journal, 2012, 55(6): 702–716. doi: 10.1093/comjnl/bxr111

    18. [18]

      WESTFELD A. F5-A steganographic algorithm: High capacity despite better steganalysis[C]. Proceedings of the 4th International Workshop on Information Hiding, Pittsburgh, USA, 2001: 289–302.

    19. [19]

      ITU-T. ITU-T P.862 Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs[S]. Geneva, Switzerland: International Telecommunications Union, 2001. (请核对修改是否正确)(未找到出版信息, 请核对)

    1. [1]

      罗瑜, 张珍珍. 一种方向插值预测变长编码的帧存有损压缩算法. 电子与信息学报,

    2. [2]

      唐伦, 周钰, 杨友超, 赵国繁, 陈前斌. 5G网络切片场景中基于预测的虚拟网络功能动态部署算法. 电子与信息学报,

    3. [3]

      王莉, 曹一凡, 杜高明, 刘冠宇, 王晓蕾, 张多利. 一种低延迟的3维高效视频编码中深度建模模式编码器. 电子与信息学报,

    4. [4]

      王练, 张贺, 张昭, 张勋杨. 基于自适应随机线性网络编码的优先级调度方案. 电子与信息学报,

    5. [5]

      解培中, 孙锐, 李汀. 基于连续干扰消除的毫米波MIMO系统混合预编码算法. 电子与信息学报,

    6. [6]

      周洋, 吴佳忆, 陆宇, 殷海兵. 面向三维高效视频编码的深度图错误隐藏. 电子与信息学报,

    7. [7]

      张瑞, 占友, 钱权. 一种新的基于虚拟队列的无线多播网络编码调度策略. 电子与信息学报,

    8. [8]

      谢显中, 黎佳, 黄倩, 陈杰. 机器类通信中基于NOMA短编码块传输的高可靠低迟延无线资源分配优化方案. 电子与信息学报,

    9. [9]

      袁野, 贾克斌, 刘鹏宇. 基于深度卷积神经网络的多元医学信号多级上下文自编码器. 电子与信息学报,

    10. [10]

      寇广, 王硕, 张达. 基于深度堆栈编码器和反向传播算法的网络安全态势要素识别. 电子与信息学报,

    11. [11]

      张顺外, 魏琪. 多信源多中继编码协作系统准循环LDPC码的联合设计与性能分析. 电子与信息学报,

    12. [12]

      吴仁彪, 赵婷, 屈景怡. 基于深度SE-DenseNet的航班延误预测模型. 电子与信息学报,

    13. [13]

      刘涛, 许成谦, 李玉博. 基于差族构造高斯整数周期互补序列. 电子与信息学报,

    14. [14]

      王凯, 刘树新, 陈鸿昶, 李星. 一种基于节点间资源承载度的链路预测方法. 电子与信息学报,

    15. [15]

      桑海峰, 陈紫珍. 基于双向门控循环单元的3D人体运动预测. 电子与信息学报,

    16. [16]

      马友, 贾树泽, 赵现纲, 冯小虎, 范存群, 朱爱军. 基于张量分解的卫星遥测缺失数据预测算法. 电子与信息学报,

    17. [17]

      熊余, 杨娅娅, 张振振, 蒋婧. 软件定义时分波分复用无源光网络中基于带宽预测的资源分配策略. 电子与信息学报,

    18. [18]

      唐伦, 杨希希, 施颖洁, 陈前斌. 无线虚拟网络中基于自回归滑动平均预测的在线自适应虚拟资源分配算法. 电子与信息学报,

    19. [19]

      王凯, 李星, 兰巨龙, 卫红权, 刘树新. 一种基于资源传输路径拓扑有效性的链路预测方法. 电子与信息学报,

    20. [20]

      唐伦, 赵培培, 赵国繁, 陈前斌. 基于深度信念网络资源需求预测的虚拟网络功能动态迁移算法. 电子与信息学报,

  • 图 1  实验拓扑图

    图 2  隐藏算法实现框图

    图 3  载密语音与未载密语音对比图

    图 4  时长为3 s样本的PESQ值对比

    图 5  时长为10 s样本的PESQ值对比

    图 6  压缩语音码流在不同样本时长下的平均检测率

    图 7  压缩语音码流在不同嵌入率下的平均检测率

    表 1  发送方、接收方台式PC配置情况

    处理器内存声卡系统
    Intel(R) Core(TM) i5-4590 CPU @ 3.30 GHz 3.30 GHz4 GBRealtek High Definition AudioWindows 7专业版 Service Pack 1
    下载: 导出CSV

    表 2  本文隐藏算法的PESQ统计值

    载密语音样本未载密语音样本PESQ改变率(%)
    3 s语音样本
    CSMCSWESMESWCSMCSWESMESWCSMCSWESMESW
    平均值3.42373.34403.41653.47503.44293.39953.42593.5193–0.55–1.63–0.27–1.20
    最大值3.89993.78154.09954.10153.82623.74063.88633.94581.931.095.493.94
    最小值2.97562.96152.97562.90223.09303.17013.11603.1265–3.80–6.58–4.51–7.17
    10 s语音样本
    CSMCSWESMESWCSMCSWESMESWCSMCSWESMESW
    平均值3.40953.35283.39903.38223.42183.39003.41023.4362–0.37–1.09–0.33–1.50
    最大值3.79543.71023.76143.87143.74063.67833.74063.86321.470.872.120.21
    最小值2.99652.91133.10032.99653.05903.01803.11233.0590–2.00–3.53–1.20–2.00
    下载: 导出CSV

    表 3  隐藏算法的PESQ统计对比(%)

    隐藏算法3 s语音样本10 s语音样本
    CSMCSWESMESW均值CSMCSWESMESW均值
    文献[6]隐藏算法–0.49–1.05–0.93–1.37–0.96–0.62–1.44–0.29–1.22–0.89
    文献[10]隐藏算法–0.59–1.63–0.28–1.35–0.96–0.52–1.42–0.35–1.47–0.94
    本文隐藏算法–0.55–1.63–0.27–1.20–0.91–0.37–1.09–0.33–1.50–0.82
    下载: 导出CSV

    表 4  语音帧处理时间统计对比(ms)

    隐藏算法CSMCSWESMESW均值
    文献[6]隐藏算法7.438.488.248.948.27
    文献[10]隐藏算法 7.02 7.96 7.89 8.74 7.90
    本文隐藏算法6.677.647.558.327.56
    下载: 导出CSV

    表 5  在满嵌入率下两种隐藏算法检测率(%)

    隐藏方法语音种类样本时长(s)
    0.10.20.30.40.50.60.70.80.91.02.03.04.05.06.0
    文献[10]隐藏算法英文85.4088.0088.5089.2590.1091.4591.4092.4092.9593.7096.2096.9597.1597.6597.35
    中文86.8088.6590.2090.5091.2092.2593.1094.2594.7094.0596.8097.2098.1597.7597.95
    文献[11]隐藏算法英文87.6590.1190.8191.6592.8994.0094.1595.0195.2096.6497.2098.70100.00100.00100.00
    中文90.7092.9594.0094.5595.7996.8397.1698.2298.3098.8999.1699.99100.00100.00100.00
    本文隐藏算法英文43.2046.4346.9547.3348.3949.5149.4450.3651.6451.9354.6755.6855.9256.0455.94
    中文45.5146.9147.5647.4848.7249.7049.5352.1452.3752.8755.0655.8656.0956.3555.63
    下载: 导出CSV

    表 6  在不同嵌入率下3种隐藏算法检测率(%)

    隐藏方法语音种类嵌入率(%)
    102030405060708090100
    文献[10]隐藏算法英文(%)50.6157.6475.5380.2982.8185.6386.3590.5894.3297.35
    中文(%)51.9358.4975.2880.5682.4985.2787.9292.5695.6397.95
    文献[11]隐藏算法英文(%)53.9460.8978.6683.4985.9188.6989.3593.7497.25100.00
    中文(%)54.5361.6779.5584.8886.7789.5591.8395.6698.55100.00
    本文隐藏算法英文(%)16.3217.5230.8739.4841.1644.1545.6248.1252.6155.94
    中文(%)15.2217.3530.5639.5241.7444.1644.5949.3152.3855.63
    下载: 导出CSV
  • 加载中
图(7)表(6)
计量
  • PDF下载量:  3
  • 文章访问数:  128
  • HTML全文浏览量:  65
文章相关
  • 通讯作者:  吴志军, zjwu@cauc.edu.cn
  • 收稿日期:  2018-12-18
  • 网络出版日期:  2019-09-20
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

/

返回文章