高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种密码专用可编程逻辑阵列的分组密码能效模型及其映射算法

李伟 高嘉浩 杜怡然 陈韬

李伟, 高嘉浩, 杜怡然, 陈韬. 一种密码专用可编程逻辑阵列的分组密码能效模型及其映射算法[J]. 电子与信息学报. doi: 10.11999/JEIT200079
引用本文: 李伟, 高嘉浩, 杜怡然, 陈韬. 一种密码专用可编程逻辑阵列的分组密码能效模型及其映射算法[J]. 电子与信息学报. doi: 10.11999/JEIT200079
Wei LI, Jiahao GAO, Yiran DU, Tao CHEN. Energy Efficiency Model and Mapping Algorithm of Block Cipher for Cipher Specific Programmable Logic Array[J]. Journal of Electronics and Information Technology. doi: 10.11999/JEIT200079
Citation: Wei LI, Jiahao GAO, Yiran DU, Tao CHEN. Energy Efficiency Model and Mapping Algorithm of Block Cipher for Cipher Specific Programmable Logic Array[J]. Journal of Electronics and Information Technology. doi: 10.11999/JEIT200079

一种密码专用可编程逻辑阵列的分组密码能效模型及其映射算法

doi: 10.11999/JEIT200079
详细信息
    作者简介:

    李伟:男,1983年生,副教授,博士生导师,研究方向为密码处理器设计,ASIC专用芯片设计

    高嘉浩:男,1995年生,硕士生,研究方向为可编程逻辑电路设计

    杜怡然:男,1991年生,讲师,研究方向为SoC与可重构设计,安全专用芯片设计

    陈韬:男,1979年生,副教授,硕士生导师,研究方向为安全专用芯片设计

    通讯作者:

    李伟 try_1118@163.com

  • 中图分类号: TP918.2

Energy Efficiency Model and Mapping Algorithm of Block Cipher for Cipher Specific Programmable Logic Array

  • 摘要: 密码专用可编程逻辑阵列(CSPLA)是一种数据流驱动的密码处理结构,该文针对不同规模的阵列结构和密码算法映射实现能效关系的问题,首先以CSPLA的特定硬件结构为基础,以分组密码的高能效实现为切入点,建立基于该结构的分组密码算法映射能效模型并分析影响能效的相关因素,然后进一步根据阵列结构上算法映射的基本过程提出映射算法,最后选取几种典型的分组密码算法分别在不同规模的阵列进行映射实验。结果表明越大的规模并不一定能够带来越高的能效,为取得映射的最佳能效,阵列的规模参数应当与具体的硬件资源限制和密码算法运算需求相匹配,CSPLA规模约为4×4~4×6时映射取得最优能效,AES算法最优能效为33.68 Mbps/mW,对比其它密码处理结构,CSPLA具有较优的能效特性。
  • 图  1  CSPLA整体结构及RCPE结构示意图

    图  2  计算任务转移隐藏动态重构延时

    图  3  各项参数随阵列规模的变化示意图

    图  4  典型分组密码算法映射能效

    表  1  分组密码的自循环单分组并行映射算法

     输入:$A = \{ {\rm{FUN}},{\rm{CON}},{\rm{CTR}},{\rm{MEM}},{\rm{IO}}\} $, ${\rm{Block}} = \{ I,R,L\} $
     输出:${\rm{Map}} = \{ {\rm{Tex}}{{\rm{t}}_{{\rm{FUN}}}},{\rm{Tex}}{{\rm{t}}_{{\rm{CON}}}},{\rm{Tex}}{{\rm{t}}_{{\rm{CTR}}}},{\rm{Tex}}{{\rm{t}}_{{\rm{MEM}}}},{\rm{Tex}}{{\rm{t}}_{{\rm{IO}}}})\} $
     (1) ${\rm{Block}} = \{ C,M\} \leftarrow {\rm{Block}} = \{ I,R,L\} $
     (2) generate $C = (V,E)$ and $M = (V,E)$
     (3) initial $a = \left\lfloor {\dfrac{{m \times n}}{{{N_{\max }}}}} \right\rfloor $
     (4) while $E(a \cdot C) \not\subset {\rm{IO}}$ and $E(a \cdot C) \not\subset {\rm{con\_ex}}$ do
     (5) $a = a - 1$
     (6) end while
     (7) for each ${\rm{o}}{{\rm{p}}_i} \in {\rm{Block}}$ do
     (8) $Q = a$
     (9) $\{ {({\rm{AG}},{\rm{LG}},{\rm{NF}},{\rm{BP}})_{i,j}}|i = 1,2, ··· ,m;j = 1,2, ··· ,n\} \leftarrow {\rm{o}}{{\rm{p}}_k}$,
     (10) update ${\rm{FUN}}$ and ${\rm{MEM}}$
     (11) $\{ {({\rm{Con\_in}},{\rm{Con\_ex}})_{i,j}}|i = 1,2, ··· ,m;j = 1,2, ··· ,n\} \leftarrow $
        $< {\rm{o}}{{\rm{p}}_{i - 1}},{\rm{o}}{{\rm{p}}_i} > $
     (12) update ${\rm{IO}}$ and ${\rm{CON}}$
     (13) end for
     (14) ${\rm{FU}}{{\rm{N}}_C} \leftarrow {V_n}(C)$,${\rm{Con\_e}}{{\rm{x}}_C} \leftarrow {E_n}(C)$
     (15) ${\rm{FU}}{{\rm{N}}_M} \leftarrow V(M)$,${\rm{Con\_e}}{{\rm{x}}_M} \leftarrow E(M)$
     (16) generate ${\rm{CTR}}$
     (17) return ${\rm{Map}}$
    下载: 导出CSV

    表  2  典型分组密码算法映射参数

    参数映射分组数量运算周期时钟频率(MHz)功耗(mW)吞吐率(Mbps)
    规模4×24×44×64×84×24×44×64×84×24×44×64×84×24×44×64×84×24×44×64×8
    AES12342424242812012011011019385982640128017602011
    SM413577278869611011011010019365778207515819933
    DES12344642485413013013013018355678181396520616
    参数映射分组数量运算周期时钟频率(MHz)功耗(mW)吞吐率(Mbps)
    规模8×28×48×68×88×28×48×68×88×28×48×68×88×28×48×68×88×28×48×68×8
    AES24682830323612011011011040821211681097187726403129
    SM4261014768492102110100100100398012316637191413911756
    DES246860465458130130012012035791171552777248531059
    下载: 导出CSV

    表  3  AES算法相关参数对比

    处理结构工艺(nm)换算工艺(nm)性能(Mbps)功耗(mW)能效(Mbps/mW)等价能效(Mbps/mW)
    CryptoManiac[11]25055646060.110.50
    SophSEC[12]130556543252.014.76
    文献[13]1805511902854.1813.67
    Cryptoraptor[14]4555128000613020.8817.08
    REMUS_LPP[15]6555284010327.5732.59
    本文(4×4)555512803833.6833.68
    本文(4×8)555520118224.5224.52
    本文(8×8)5555312916819.8019.80
    下载: 导出CSV
  • [1] LIU Leibo, WANG Bo, and WEI Shaojun. Reconfigurable Computing Cryptographic Processors[M]. Beijing: Publishing House of Science, 2018: 5–8.
    [2] WANG Bo and LIU Leibo. Dynamically reconfigurable architecture for symmetric ciphers[J]. Science China Information Sciences, 2016, 59(4): 042403. doi:  10.1007/s11432-015-5381-z
    [3] ANSALONI G, TANIMURA K, POZZI L, et al. Integrated kernel partitioning and scheduling for coarse-grained reconfigurable arrays[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 2012, 31(12): 1803–1816. doi:  10.1109/TCAD.2012.2209886
    [4] 杨子煜, 严明, 王大伟, 等. 面向CGRA循环流水映射的数据并行优化[J]. 计算机学报, 2013, 36(6): 1280–1289. doi:  10.3724/SP.J.1016.2013.01280

    YANG Ziyu, YAN Ming, WANG Dawei, et al. Data parallelism optimization for the CGRA loop pipelining mapping[J]. Chinese Journal of Computers, 2013, 36(6): 1280–1289. doi:  10.3724/SP.J.1016.2013.01280
    [5] SHAO Shengjia, YIN Shouyi, LIU Leibo, et al. Map-reduce inspired loop parallelization on CGRA[C]. 2014 IEEE International Symposium on Circuits and Systems (ISCAS), Melbourne, Australia, 2014: 1231–1234. doi:  10.1109/ISCAS.2014.6865364.
    [6] 戴紫彬, 曲彤洲. 基于预配置和配置重用的粗粒度动态可重构系统任务调度技术[J]. 电子与信息学报, 2019, 41(6): 1458–1465. doi:  10.11999/JEIT180831

    DAI Zibin and QU Tongzhou. Task scheduling technology for coarse-grained dynamic reconfigurable system based on configuration prefetching and reuse[J]. Journal of Electronics &Information Technology, 2019, 41(6): 1458–1465. doi:  10.11999/JEIT180831
    [7] YIN Shouyi, LIU Dajiang, PENG Yu, et al. Improving nested loop pipelining on coarse-grained reconfigurable architectures[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems, 2016, 24(2): 507–520. doi:  10.1109/TVLSI.2015.2400219
    [8] 孙康. 可重构计算相关技术研究[D]. [博士论文], 浙江大学, 2007.

    SUN Kang, Research on reconfigurable computing technologies[D]. [Ph. D. dissertation], Zhejiang University, 2007.
    [9] WANG Yansheng, LIU Leibo, YIN Shouyi, et al. On-chip memory hierarchy in one coarse-grained reconfigurable architecture to compress memory space and to reduce reconfiguration time and data-reference time[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems, 2014, 22(5): 983–994. doi:  10.1109/TVLSI.2013.2263155
    [10] 高嘉浩, 李伟, 陈韬. 基于密码逻辑阵列的分组密码高能效映射方法[J]. 电子技术应用, 2019, 45(11): 21–26, 31.

    GAO Jiahao, LI Wei, and CHEN Tao. Block cipher energy efficient mapping method based on cipher logic array[J]. Application of Electronic Technique, 2019, 45(11): 21–26, 31.
    [11] WU L, WEAVER C, and AUSTIN T. CryptoManiac: A fast flexible architecture for secure communication[C]. Proceedings of the 28th Annual International Symposium on Computer Architecture, Goteborg, Sweden, 2001: 110–119. doi:  10.1109/ISCA.2001.937439.
    [12] HUANG Wei, HAN Jun, WANG Shuai, et al. A low-complexity heterogeneous multi-core platform for security soc[C]. 2010 IEEE Asian Solid-State Circuits Conference, Beijing, China, 2010: 1–4. doi:  10.1109/ASSCC.2010.5716621.
    [13] WEI Li, ZENG Xiaoyang, DAI Zibin, et al. A high energy-efficient reconfigurable VLIW symmetric cryptographic processor with loop buffer structure and chain processing mechanism[J]. Chinese Journal of Electronics, 2017, 26(6): 1161–1167. doi:  10.1049/cje.2017.06.010
    [14] SAYILAR G and CHIOU D. Cryptoraptor: High throughput reconfigurable cryptographic processor[C]. 2014 IEEE/ACM International Conference on Computer-Aided Design (ICCAD), San Jose, USA, 2014: 155–161. doi:  10.1109/ICCAD.2014.7001346.
    [15] LIU Leibo, WANG Dong, ZHU Min, et al. An energy-efficient coarse-grained reconfigurable processing unit for multiple-standard video decoding[J]. IEEE Transactions on Multimedia, 2015, 17(10): 1706–1720. doi:  10.1109/TMM.2015.2463735
    [16] LIU Bin and BAAS B M. Parallel AES encryption engines for many-core processor arrays[J]. IEEE Transactions on Computers, 2013, 62(3): 536–547. doi:  10.1109/TC.2011.251
  • [1] 张双, 康桂霞.  异构蜂窝网络中基于能效的非正交多址接入下行功率分配算法, 电子与信息学报. 2020, 42(0): 1-8. doi: 10.11999/JEIT190492
    [2] 王毅, 林艳, 李春国, 黄永明, 杨绿溪.  基于能效优化的大规模MIMO FDD下行系统导频和功率资源分配算法, 电子与信息学报. 2017, 39(1): 16-23. doi: 10.11999/JEIT160226
    [3] 王毅, 林艳, 黄永明, 李春国, 杨绿溪.  基于成对用户大规模MIMO两跳中继系统的最优能效设计, 电子与信息学报. 2017, 39(1): 1-8. doi: 10.11999/JEIT160245
    [4] 欧庆于, 罗芳, 叶伟伟, 周学广.  分组密码算法抗故障攻击能力度量方法研究, 电子与信息学报. 2017, 39(5): 1266-1270. doi: 10.11999/JEIT160548
    [5] 伊文坛, 鲁林真, 陈少真.  轻量级密码算法MIBS的零相关和积分分析, 电子与信息学报. 2016, 38(4): 819-826. doi: 10.11999/JEIT150498
    [6] 郭建胜, 崔竞一, 罗伟, 刘翼鹏.  MD-64算法的相关密钥-矩形攻击, 电子与信息学报. 2015, 37(12): 2845-2851. doi: 10.11999/JEIT150049
    [7] 江政泓, 林郁, 黄志洪, 杨立群, 杨海钢.  面向AIC结构的FPGA映射工具, 电子与信息学报. 2015, 37(7): 1769-1773. doi: 10.11999/JEIT141403
    [8] 郭锐, 刘春于, 张华, 包建荣, 姜斌.  分簇无线传感器网络中根校验全分集LDPC码设计与能效分析, 电子与信息学报. 2015, 37(7): 1580-1585. doi: 10.11999/JEIT141294
    [9] 胡莹, 黄永明, 俞菲, 杨绿溪.  多用户大规模MIMO系统能效资源分配算法, 电子与信息学报. 2015, 37(9): 2198-2203. doi: 10.11999/JEIT150088
    [10] 黄高勇, 方旭明, 陈煜.  基于速率约束的OFDM中继链路能效最优资源分配策略, 电子与信息学报. 2014, 36(9): 2104-2110. doi: 10.3724/SP.J.1146.2013.01661
    [11] 吴凡, 毛玉明, 黄晓燕, 冷甦鹏.  OFDMA系统中最优能效功率分配, 电子与信息学报. 2014, 36(7): 1673-1679. doi: 10.3724/SP.J.1146.2013.01291
    [12] 谢作敏, 陈少真, 鲁林真.  11轮3D密码的不可能差分攻击, 电子与信息学报. 2014, 36(5): 1215-1220. doi: 10.3724/SP.J.1146.2013.00948
    [13] 陈韬, 罗兴国, 李校南, 李伟.  一种基于流处理框架的可重构分簇式分组密码处理结构模型, 电子与信息学报. 2014, 36(12): 3027-3034. doi: 10.3724/SP.J.1146.2014.00023
    [14] 黄博, 方旭明, 陈煜.  OFDMA中继网络变时域节能资源分配策略, 电子与信息学报. 2013, 35(5): 1023-1030. doi: 10.3724/SP.J.1146.2012.01180
    [15] 陈煜, 方旭明, 赵越.  基于能效的解码转发中继OFDM链路自适应功率分配方案研究, 电子与信息学报. 2013, 35(2): 285-290. doi: 10.3724/SP.J.1146.2012.00813
    [16] 胡莹, 黄永明, 俞菲, 杨绿溪.  基于能效优化的用户调度与资源分配算法, 电子与信息学报. 2012, 34(8): 1950-1955. doi: 10.3724/SP.J.1146.2012.00011
    [17] 苏崇茂, 韦永壮, 马春波.  10轮3D分组密码算法的中间相遇攻击, 电子与信息学报. 2012, 34(3): 694-697. doi: 10.3724/SP.J.1146.2011.00888
    [18] 张剑贤, 周端, 杨银堂, 赖睿, 高翔.  处理器可靠性约束的电压频率岛NoC能耗优化, 电子与信息学报. 2011, 33(9): 2205-2211. doi: 10.3724/SP.J.1146.2010.01266
    [19] 夏银水, 储著飞, 王伦耀, HungWilliamNN, SongXiao-yu.  纳米CMOS电路逻辑等效变换, 电子与信息学报. 2011, 33(7): 1733-1737. doi: 10.3724/SP.J.1146.2010.01208
    [20] 唐学海, 李超, 王美一, 屈龙江.  3D密码的不可能差分攻击, 电子与信息学报. 2010, 32(10): 2516-2520. doi: 10.3724/SP.J.1146.2009.01375
  • 加载中
  • 图(4) / 表ll (3)
    计量
    • 文章访问数:  91
    • HTML全文浏览量:  62
    • PDF下载量:  5
    • 被引次数: 0
    出版历程
    • 收稿日期:  2020-01-19
    • 修回日期:  2020-06-15
    • 网络出版日期:  2020-07-24

    目录

      /

      返回文章
      返回

      官方微信,欢迎关注