Chinasoft参会特辑 | 参会心得(二)
2023-12-16 16:51:52 Author: mp.weixin.qq.com(查看原文) 阅读量:8 收藏

上次推送的分享想必大家还没看够吧!

白泽又给大家带来了更多的内容分享哦

本次推送是Chinasoft参会特辑的第二期

让我们继续来看看同学们的分享和感悟吧!

自动驾驶仿真测试论坛

by 黄宗安

开放不确定场景下的智能汽车预期功能安全检测、防护与强化

南京大学卜磊老师的演讲重点在于通过对自动驾驶系统进行形式化建模分析与验证,来评估无人驾驶系统的可信性。主要的提出了风险评估与验证、风险规避与防护两个方面的方法,以形式化验证为基础,提出在线预警与防护系统,保障无人驾驶系统的安全性。

在进行风险评估与验证阶段,通过遍历状态空间的方式,判断系统行为中是否存在“相撞”状态,并构建相应的驾驶场景进行验证。迁移了相关混成系统中的有界验证技术,尝试对待验证状态空间进行深度限制,回答阈值内可达性问题。在风险规避与防护方面,实现了面向多组件复杂混成系统的秒级验证与测试。该方法能够在运行时提前检测事故,然后通过短暂的接管采用非线性的实时系统控制优化方案生成控制参数来规避事故。

自动驾驶仿真测试的道路生成与违规诊断

复旦大学陈碧欢老师介绍了自动驾驶的安全测试中,仿真测试的重要性。他强调了仿真测试在生成复杂道路组件的完整道路网络方面的关键性,并提出基于大模型的违规场景诊断,通过真实世界的事故报告训练模型,判断事故责任,以提高测试效率。

智能网联汽车自动驾驶系统安全测试

浙江大学薛强老师的演讲更多的聚焦于信息安全对仿真测试提供了一个不同的视角。同时薛老师也提到视觉感知攻击、LiDAR感知攻击、MSF感知攻击、V2X欺诈攻击等。他们工作尝试通过对抗样本等方式,引发感知、融合等模块的AI模型错误,并构建仿真测试场景来证明这些攻击方法的现实危害,提供了对自动驾驶系统全面的安全性评估。

编译技术与编译器设计论坛

by 罗铭源

AI计算中的编译优化

深度学习中涉及大量向量计算,这些计算可以在CPU上进行,也可以在GPU上进行,还可以在深度学习专用硬件上进行(例如TPU)。同时,CPU/GPU等硬件又有多家供应商的多种型号。因此,使得同一个AI程序,能够不同的硬件上运行起来,就需要编译器的支持。然而,编译器能做到的不只是这些,还能做到算子(张量函数)的优化。

崔慧敏老师提到,软硬件协同和打破算子间的界限是他们的优化思路之一。向量处理单元是一个计算单元,一般是每个计算核有自己的向量处理单元,并且向量处理单元是私有的,不能被核共享。这导致了向量处理单元的利用率低。因此,崔老师团队设计了一种能够被共享的向量处理单元以提升其利用率。除此以外,崔老师也提到了GPU计算的安全性问题,即如何构建GPU的可信计算环境(TEE)。

面向JAVA GC性能优化的指令集扩展

GC(垃圾回收)是降低内存空置率的重要方法。然而,由于GC需要在运行时检查是否需要回收内存,会引入一定的内存开销。并且,在并行程序中,如果GC回收了不该回收的内存,可能会导致被回收内存的非法访问。为了解决这些问题,读屏障(read barrier)是一种可行的技术。为了更好地支持read barrier,曾建江团队扩展了CPU指令集。本报告是他们在扩展实践的过程中遇到的问题。一个问题是实现指令扩展的成本过高,因此需要优化。在华为内部方案评审时,他们团队的方案因为需要在指令集层面添加用户态异常,复杂度较高,因此被拒绝实现。因此他们迭代了新的方案,将异常放到软件层面去解决。

大模型与软件测试论坛

LLM辅助系统测试脚本代码生成

这一报告介绍了华为LLM辅助系统集成测试脚本代码生成的相关技术,这一项目面向企业级,各特定领域业务上下文系统测试代码生成统一解决方案,同时针对测试代码语料质量检查和清洗规范,最后经过分析,认为对于其他相关工作者提出的启示性结果是语料数量质量对模型推理结果影响最大。

基于大语言模型的单元测试生成

娄一翎研究员基于ChatGPT等代表性大模型在单元测试生成上的能力评估,包括其所生成单元测试代码的正确性、充分性、可读性和可用性等,提出基于大模型的高质量单元测试生成方法,并探索该方法在开源和商用大模型上的效果。

首先,在一些的测试中,娄老师发现基于大模型的单元测试生成方案会生成不正确的测试用例,但是可以生成充分性比较好的测试用例。面对这个问题,娄老师提出了解析error message寻找error type来修复导致问题产生的类型定义的方案,能够有效提高单元测试的性能。

基于大模型的移动应用自动化测试路径生成

刘哲研究员针对移动应用输入生成中存在的多任务扩展以及GUI测试需要理解业务逻辑两个挑战,提出了基于LLM的测试方案。刘老师提出了基于GUI上下文理解的提示工程方法,针对应用程序的业务功能进行核心业务功能敏感的提示工程测试技术。

新兴系统软件论坛

by 钟康维

遥测数据云端存储与管理系统

东北大学的杨晓春老师分享了遥测数据云端存储与管理系统,解决通过传感器被遥测终端接收到的实时数据的存储和管理问题。杨老师结合与华为合作的openGemini系统,重点介绍了支持OpenTelemetry的云端数据存储与管理系统,可以同时支持metrics和logs不同数据模型的存储与管理,实现混合数据模型的无缝集成。

固件的静态分析

霍玮老师提到,目前嵌入式设备的安全漏洞很多,但传统的静态分析技术不足以支撑挖掘嵌入式设备的漏洞。污点三要素有source、sink和sanitizer,污点分析包括三要素的识别和漏洞检测规则。前人的工作主要集中在漏洞检测规则,但污点要素的识别并没有想象中简单。因为嵌入式固件中蕴含丰富的领域语义信息,霍老师团队提出从语义增强角度提升污点三要素的识别,并从网络设备的后端污点类漏洞和蜂窝基带的污点类漏洞两个方面进行举例说明如何利用领域知识找到更精确的source和sink,并发现更多漏洞。

自治和跨域

“自治和跨域”是各行业数据基础制度建设面临的共性难题,面临着数据自治与跨域协同的矛盾。北京航空航天大学的童咏昕老师用生动的例子说明了到底什么是联邦学习,就是“数据不动计算动”。他们的研究目前主要在解决联邦学习 “搭便车”的问题,即跨域大数据价值的参差,比如小公司和大公司共享数据,但小公司的数据很少,这种情况该如何进行较为公平的联邦学习,从而引出了团队的工作联邦计算开源平台——虎符。

无人驾驶

中山大学单云霄老师介绍了无人驾驶目前遇到的问题,包括环境不确定性、车辆不确定性、控制不确定性,单老师主要关注环境不确定性,大量生成candidate轨迹,然后用栅格筛选,构建不确定性模型,提出了一种面向感知和定位不确定性的安全规划框架,并展示了仿真试验以及实车实验的结果。

隐私合规

西安交通大学的范铭老师介绍了目前隐私合规方面存在的一些问题,比如数据的过度收集、数据的越权使用以及异常的数据共享。范老师团队探索并设计了“条件-操作-目的”的隐私保护需求规约建模方法,“法律法规-隐私声明-程序行为”的统一表征,使用BERT模型对隐私政策进行了分类,并在小程序场景下做了一致性分析。

小程序由动态编译的JS语言完成,同时还提供了一些不同于传统JS的特性,比如可以接收回调函数的预定义API,范老师团队设计了面向小程序的污点分析工具,并与隐私政策结合对小程序进行了一致性分析。最终归纳了不一致的根本原因,主要是由于个人开发者缺乏隐私政策的撰写经验,并且有些小程序直接拷贝的同名APP的隐私政策文档但未做调整。

软件的缺陷检测和缺陷库

上海交通大学的钟浩老师围绕软件的缺陷检测和缺陷库介绍了团队的一些成果,主要包括推荐软件库规约和从软件库文档挖掘规约。由于代码和文档覆盖的软件库用法较少,存在大量不常见的软件库用法,实用的方法必须能处理长尾调用,因此需要从不同的来源挖掘规约。

钟浩老师提出了从代码修改历史抽取缺陷签名,首次提出通过补全上下文分析历史代码的新研究路径,提出基于图比较多缺陷签名挖掘算法;参考其他项目的缺陷报告,首次提出利编译器的缺陷报告测试编译器的研究路径。

系统与网络安全论坛

by 钟康维

物联网隐私

智能家居设备耦合程度很高,包含硬件、软件以及硬件软件供应链的交互,这其中的关系非常复杂。

中山大学南老师团队希望针对物联网设备的什么类型的数据正在被收集以及这些数据是怎么使用和分享的这两个问题进行大规模、细粒度的探索。他们观察到IoT设备的两种数据管理模式都涉及到移动端的App,因此他们通过分析物联网设备的手机配套应用来大规模分析物联网设备的隐私问题。主要的方法论就是找到对应的代码片段和数据项,对代码里的数据追踪,把真正数据的操作使用从静态角度追踪,看使用传输过程中有哪些风险。

参会心得

罗嘉骐

会议涵盖了软件测试各方面的内容,无论是自动驾驶相关领域的研究,还是软件测试其他方向的研究,听各位老师讲解他们最新的科研进展,讲解他们对于软件测试的理解,让我受益匪浅。

在自动驾驶相关的topic中,可以看到现在的研究涵盖了各个方向,但我们只是分析认为他是一个很麻烦的情况,却没有想着有没有什么办法可以去避免他,或高效的解决他。我们在平常的科研中也需要去了解更多的相关知识,而不只是关注于我们当前工作的内容,当遇见问题是,深入去思考当前遇到的问题与麻烦,思考其背后的逻辑,为什么会有这些问题,这些问题是广泛存在的还是偶然出现的,而不仅仅只是去解决问题,只有通过这样才能不断的提升自己的能力,提升自己发现问题,解决的问题的能力。

史一哲

本次参会主要有两方面的感悟,一方是领域视野的扩宽,学习到了不同领域专家的最新研究进展及研究思路;另一方面是科研历程的收获,向不同的老师同学们学习到了他们的科研历程和解决问题的方法。

其中印象比较深刻的是新兴技术推动各个领域的进步以及因此带来的问题,目前大模型比较火热,其中不应该只是简单的追随潮流,而是要思考这种新兴技术能否推动自己研究的进步,以及这种新兴技术引入的新的问题,这也是很多老师在积极探讨和回答的一些问题。我非常认同其中的一个观点:坚持与创新,要坚持原始的初始问题,新兴技术不可能替代现有所有研究,所以要坚持自己研究的意义;并且要积极尝试使用这些新兴技术来辅助自己研究,对于已经可以被替代的思路要学会取舍,并且要时刻保持思考。

黄宗安

在本次CCF中国软件大会上,自动驾驶系统安全测试以及软件故障检测成为了我关注的焦点之一。通过参与相关分论坛和技术交流,我深刻领略到了当前自动驾驶领域的挑战与前沿技术。一些报告分享了最新的自动驾驶系统安全测试方法和软件故障检测技术,特别是在仿真环境和实际道路场景中的验证与优化。这让我对如何更有效地确保自动驾驶系统的安全性有了更深刻的认识,同时也拓展了我在软件故障检测领域的视野。

看了同学们的分享

相信大家对计算机安全有了更深的了解了

但同学们探索知识的冒险仍未结束

敬请期待下一期吧!


文章来源: https://mp.weixin.qq.com/s?__biz=MzU4NzUxOTI0OQ==&mid=2247488314&idx=1&sn=062e5ad031db5cf957fde01adbea5c17&chksm=fdeb9744ca9c1e528fbf72a2b6ac4e53629d7bdf13c60053d8eea9311ae91db520bcab4cf0c0&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh