演讲嘉宾 - 第一届软件工程前沿论坛

1.李戈: 基于深度学习的程序分析与应用——问题与思考

摘要: 深度学习技术用于程序分析相关任务以来，已经取得了许多令人瞩目的成果。然而随着研究与应用的不断深入，也引发了关于深度学习技术在程序分析相关任务中应用的新的思考。本报告结合讲者的个人研究经历，对基于深度学习的程序分析研究中现存的技术难点进行讨论，对该领域研究中产生的新生问题进行探讨，并对技术边界及未来发展趋势进行讨论。

简介:李戈，北京大学信息科学技术学院副教授，斯坦福大学人工智能实验室访问副教授。主要研究方向: 深度学习、程序分析，知识工程。李戈博士是国际上最早利用深度神经网络进行计算机程序分析与生成相关研究的研究者之一，在程序功能分析、程序自动生成、程序缺陷检测等方面的研究成果受到了国内外同行的高度关注。

摘要: API、样例代码、开发问题讨论等软件开发资源已经成为开发人员不可或缺的软件开发知识和可复用解决方案的来源。然而，散布在大量不同项目和其他来源中的海量软件开发资源缺乏统一的规范化描述，难以被方便地获取和复用。针对这一问题，复旦大学CodeWisdom团队在构建API知识图谱以及利用WikiData等通用知识图谱的基础上，针对软件开发资源的语义描述和智能化推荐开展了一系列研究工作。本次报告将介绍相关方面的研究成果并展望未来的发展方向。

简介: 彭鑫，复旦大学计算机科学技术学院副院长、软件学院副院长、教授、博士生导师。中国计算机学会软件工程专委会副主任，上海市计算机学会青工委主任，《Journal of Software: Evolution and Process》联合主编，《ACM Transactions on Software Engineering and Methodology》编委，《软件学报》编委，《Empirical Software Engineering》编委，IEEE软件维护与演化国际会议（ICSME）执委（2017-2020）。主要研究方向包括软件开发大数据分析、智能化软件开发、云原生与智能化运维、泛在计算软件系统等。在ICSE、FSE、ASE、CSCW、ICSME、SANER、RE等软件工程及相关领域高水平国际会议及IEEE/ACM Transactions等国际期刊发表论文80余篇。2016年获得东软-NASAC青年软件创新奖。研究工作获得ICSM 2011最佳论文奖、ACM SIGSOFT杰出论文奖（ASE 2018）、IEEE TCSE杰出论文奖（ICSME 2018/2019/2020）、IEEE Transactions on Software Engineering年度最佳论文奖（2018）。带领复旦大学CodeWisdom研究团队开展软件开发大数据分析平台以及智能化软件开发平台的研究与实践，研究成果在多家大型企业进行了实践应用。

摘要: 过去的二十年里，数据挖掘、机器学习以及人工智能正渗透到软件工程中。这一现象级的研究趋势深刻改变了软件工程的研究现状。结合报告人一些相关的工作，本报告回顾和总结了引入上述技术的一些得失。随着数据挖掘、机器学习以及人工智能得到广泛关注并被应用到一些安全有关的场景，其中的缺陷也日益显著。应对这一挑战给软件工程的研究者带来了新的机会。结合报告人一些最新和尚未发表的工作，本报告展望了其中一些机会和其中的难点。

简介:钟浩，上海交通大学副研究员，主要研究方向为软件工程。在ICSE、ASE、OOPSLA、TSE、EMSE、JSS等期刊发表四十余篇论文。担任ICSE、FSE、ASE、OOPSLA、ICSME、MSR、COMPSAC等软工重要会议的程序会委员。

摘要: 软件技术文档是开发团队的信息仓库和沟通媒介，能够提升软件开发效率和软件质量。然而，由于缺乏时间和文档收益滞后等原因，开发者常常忽视软件技术文档的撰写和维护，从而造成技术文档缺失和过失的问题。为应对这一问题，研究者们提出了软件技术文档生成任务。近年来，软件开发呈现出的快速演进、持续迭代等新形态使面向代码变更的软件技术文档生成日益重要；而快速膨胀、丰富多样的软件大数据让智能化方法的优势和潜力得以凸显。本报告关注面向代码变更的软件技术文档智能化生成问题，将先阐述此问题的研究背景和研究现状，然后介绍作者在即时代码注释更新、代码提交日志生成和拉取请求描述生成这三个具体任务上做出的研究工作，最后展望此领域的未来发展方向。

简介:刘忠鑫，浙江大学计算机科学与技术学院特聘研究员，研究方向为智能软件工程，研究工作聚焦于软件文档自动生成，曾三次获得ASE会议的ACM SIGSOFT杰出论文奖。

摘要: 软件工程的研究经常依赖于大规模高质量的软工数据集。本次报告重点介绍我们在构建软件缺陷库（bug repository）以及程序生成库（“requirements-implementations” pairs）方面的工作。大规模高质量软件缺陷库对缺陷定位、程序修复等缺陷相关研究具有重要意义，是验证相关方法的关键数据。但目前全自动构建的软件缺陷库难以保证缺陷及其补丁的准确性，而手工构建的缺陷库难以实现量的突破。为此，我们提出了一种基于重构检测与回放机制的精准缺陷补丁提取技术，并基于该技术构建了一个日益增长的精准缺陷库growingBugs。报告涉及的另一个软工数据集是用于训练和评估程序生成技术的“requirements-implementations”对。我们从学生训练和竞赛网站上爬取了数千个竞赛题目及其对应的程序实现，经过一系列过滤和预处理构建了一个大规模的程序生成库，并以此为基础重新评估了现有的基于深度学习的代码生成技术。

简介:刘辉，北京理工大学计算机学院教授、博士生导师。目前主要研究领域包括智能化软件开发环境，软件重构以及软件质量的评估与保障

智能化软件工程（一）

1.李戈: 基于深度学习的程序分析与应用——问题与思考

2.彭鑫: 基于知识图谱的软件开发资源智能化推荐

3.钟浩: 数据挖掘与软件工程的相互促进与发展

4.刘忠鑫: 面向代码变更的软件技术文档智能化生成

5.刘辉: 软工数据集的构建与应用