首提跨模态代码匹配算法,腾讯安全科恩实验室论文入选国际AI顶会NeurIPS-2020

日志狂
• 阅读 2231

人工智能领域顶级学术会议NeurIPS 2020(Neural Information Processing Systems)将于12月7日-12日在线上举行。在近日NeurIPS正式发布的论文入选名单中,腾讯安全科恩实验室聚焦利用AI算法解决二进制安全问题的《CodeCMR: Cross-Modal Retrieval For Function-Level Binary Source Code Matching》,凭借首次提出基于AI的二进制代码/源代码端到端匹配算法的创新研究成功入选,揭示了“AI+安全”领域的又一突破探索。

作为国际机器学习和计算神经科学领域公认最具影响力的顶级会议之一,NeurIPS汇集了时下人工智能和自然神经信息处理等领域最前沿的科研成果,被中国计算机学会 (CCF)推荐为A类Top会议,每年都能吸引来自全世界AI领域的研究者参会和进行前沿成果分享。

新一代信息技术的“爆发式”普及应用,在造就更为广阔数字空间版图的基础上,也带来了更为瞬息万变的网络威胁态势。AI技术以其在数据分析、知识提取、智能决策等方面的独有优势,已成为近年来网络安全寻求创新突破的重要探索方向。据Gartner预测,到2020年,人工智能在网络安全领域应用比例将由10%上升为40%。

安全系统的部署、响应的效率及准确性直接关乎其防护的有效性,而从计算机系统的最基础层上看,程序员编写的源代码程序向计算机能识别的二进制语言的转化与执行,则是影响系统效率的关键。为更好地提升安全部署的效率和准确率,腾讯安全科恩实验室就在本次入选NeurIPS-2020的论文中,聚焦二进制代码-源代码的交叉领域,首次提出了一种基于AI的二进制代码/源代码端到端算法模型:CodeCMR框架,以解决传统算法匹配准确率不高的问题,并为安全研究人员致力寻找源代码的逆向分析提供新思路。

与传统算法仅提取字符串、立即数特征进行匹配的做法不同,论文提及的CodeCMR模型能够实现对代码间隐藏语义特征的自动提取,从而达到提升二进制代码-源代码跨模态检索匹配效率的目的。CodeCMR框架能够以不同模型对源代码特征和二进制代码特征两大模块的语义、字符串、立即数等三大输入特征进行向量计算,并以在基础上用拼接+BatchNorm方式最终实现高效匹配转化。其中,在语义特征识别中,端到端的GNN模型表现出更强的健壮性,对于破解传统算法高专家经验的痛点起到关键作用。与此同时,在两大模块的向量采样阶段,Norm weighted sampling 与随机采样和distance weighted采样方法相比也表现出了更好的匹配效果。这种融合训练的方法对于大幅提升二进制代码/源代码的匹配准确率探索,提升工业部署效率具有极大推动作用。

首提跨模态代码匹配算法,腾讯安全科恩实验室论文入选国际AI顶会NeurIPS-2020
(CodeCMR整体框架)

本次论文入选是腾讯安全科恩实验室继以利用图神经网络解决二进制程序函数相似性分析问题的研究成果入选AAAI 2020后,致力探索二进制安全研究的又一全新成果,也是其致力布局人工智能领域安全研究和"AI+安全"交叉场景应用的全新实践。目前,论文成果已在腾讯安全科恩实验室研发的代码检索工具BinaryAI实现了落地应用。

作为腾讯集团云与智慧产业事业群旗下一支国际一流的信息安全团队,腾讯安全科恩实验室自2018年就开始深入到人工智能领域的安全研究中,先后针对特斯拉搭载系统Autopilot高级辅助驾驶问题和AI算法与传统安全研究结合探索,分别挖掘出了业内首个实现对抗商用自动驾驶系统图像识别功能的研究案例和联合腾讯公司高校合作项目“CCF-腾讯犀牛鸟基金”发布了《深度学习在软件安全领域的应用研究》的研究课题,为促进安全与AI的深度应用提供了重要突破口。

在云计算、大数据及人工智能等技术发展趋势下,以机器学习为主要算法的AI技术显然将成为应对新安全威胁的重要手段。未来,腾讯安全科恩实验室将继续以自身的技术能力积淀和贯穿汽车、智能应用、IoT等多行业的安全实践,从瞄准实际痛点的视角,为深处数字化发展关键节点的全产业输送更多前沿技术成果和解决方案。

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
3年前
CSS2020聚焦新基建 腾讯发布云原生安全体系 助力客户备战云上“主战场”
9月11日,第六届CSS互联网安全领袖峰会产业专场正式在线上举行。本届CSS与腾讯全球数字生态大会合二为一,聚焦数字经济下的安全态势、云时代的安全新思维、生态协同技术演进与应用实践等重要命题。在大会上,腾讯安全正式对外发布腾讯云原生安全防护体系,围绕安全治理、数据安全、应用安全、计算安全和网络安全等层面,搭建完整的云上安全防护架构,助力客户应对数字时代的
Stella981 Stella981
3年前
PingCAP 开源分布式数据库 TiDB 论文入选 VLDB
8月31日9月4日,第46届VLDB会议以线上直播的方式举行(原定于日本东京召开),PingCAP团队的论文《TiDB:ARaftbasedHTAPDatabase》入选VLDB2020,成为业界第一篇RealtimeHTAP分布式数据库工业实现的论文。PingCAP联合创始人、CTO黄东旭获邀在会上
Wesley13 Wesley13
3年前
CNCF 技术监督委员会首添中国面孔,阿里巴巴李响入选全球 9 人名单
美国当地时间2019年1月29日,全球顶级开源社区云原生计算基金会(CloudNativeComputingFoundation,简称CNCF)正式宣布其技术监督委员会(TechnicalOversightCommittee,简称TOC)席位改选结果。阿里云资深技术专家李响入选,成为该委员会有史以来首张中国面孔。!(htt
Wesley13 Wesley13
3年前
33复杂美入选区块链+战“疫”优秀解决方案
近日,由中国移动通信联合会区块链专业委员会、数字岛和塔智库联合主办,中关村大数据产业联盟协办,北京邮电大学技术转移中心、北京邮电大学区块链及安全技术联合实验室提供学术支持的《2020中国区块链战“疫”活动》应用方案征集暨评选活动获奖企业名单,今日正式公布,包括杭州复杂美科技“33慈善平台”在内的多个区块链战“疫”优秀产品入选并公示。据悉,此次活动旨在征
京东云智能编程助手与安全大模型双双获奖!
人工智能大模型浪潮迭起,为更好地推广人工智能应用案例,中国通信工业协会及中国通信工业协会人工智能专委会近日发布《CCIA2023年度人工智能优秀案例》,京东云申报的Joycoder智能编程助手入选“AI技术创新应用”,京东云与深圳市信息安全管理中心联合申报
京东云开发者 京东云开发者
6个月前
请查收| 京东零售技术AI领域前沿探索-10篇顶会论文合集
作者:京东零售2024年,京东零售技术团队在AI领域发表多篇CCFA类论文,包含CVPR、SIGIR、WWW、AAAI、IJCAI等业界顶会。下面为大家简要介绍被录用的10篇论文,涵盖目标检测、多场景学习、排序模型、意图识别、创意优选、优化大模型幻觉问题等
权威认可!天翼云强势入选IDC中国CNAPP领导者象限!
近日,国际权威咨询机构IDC发布《IDCMarketScape:中国CNAPP2025年厂商评估》报告,中国电信天翼云凭借云原生应用保护平台(CNAPP)的卓越技术实力和全场景安全能力,强势入选“领导者”象限,标志着天翼云在云原生安全领域的综合竞争力已处于
安全可信 | 天翼云全栈云原生安全防护平台入选工信部“2022年网络安全技术应用试点示范项目”!
2月23日,由工业和信息化部、四川省人民政府共同主办的2023年中国网络和数据安全产业高峰论坛顺利举行。会上,工业和信息化部、中央网信办等十二部门领导代表,正式为入选“2022年网络安全技术应用试点示范项目”的单位代表授牌。全栈云原生安全防护平台成功入选,
三项国际人工智能顶会大奖!拿下!
近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6thWorkshopandCompetitiononAffectiveBehaviorAnalysisinthewild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPRABAW研讨会上作论文分享。这是继天翼云在CVPR中荣获多次佳绩后再一次斩获殊荣。
上榜!天翼分布式云操作系统入选“科创中国”先导技术榜单!
在近日召开的第二十六届中国科协年会上,中国科协正式发布2023年“科创中国”系列榜单,榜单包括先导技术榜、新锐企业榜、融通创新组织榜、技术经理人先锋榜等。天翼云自主研发的天翼分布式云操作系统入选先导技术榜,充分展现了在科技创新方面的硬实力。