芯片、操作系统与数据库,是信息时代的三大核心基础技术。聚焦于数据库前沿技术的SIGMOD会议始办于1975年,是信息科学历史最悠久的学术会议之一,也是含金量最高的数据库全球顶会,吸引了MIT、清华、浙大、卡内基梅隆大学、新加坡国立大学等高校以及谷歌、微软、AWS、阿里云、华为等科技公司参加。每年,SIGMOD组委会从入选的研究论文中评出1~2篇最佳论文,代表了该年度最具创新性及影响力的科研成果,成为数据库发展的风向标。
2023年,SIGMOD仅收录190篇论文,由浙江大学与阿里云共同完成的《在数据库管理系统的连接优化器中检测逻辑漏洞》斩获2023 SIGMOD最佳论文奖,实现了中国大陆研究团队在数据库国际顶会的历史性突破。SIGMOD审稿人评议认为,该工作巧妙、高效地解决了现代数据库的关键问题,即检测出复杂逻辑漏洞,并在业界领先的商业数据库中证明了其能力。
据了解,数据库的崩溃通常由漏洞引发,而其中的逻辑漏洞极难检测,素有数据库“隐形杀手”之称,重则导致“上万航班延误瘫痪”级别的大规模《金年会金字招牌在线入口》宕机。面对这一技术难题,浙大与阿里云研究团队提出了一种名为TQS(转换查询合成)的新方案,通过引入机器学习等方法,创造性地解决了执行实现的正确性验证难题,以极小的计算代价自动探索更大检测空间,最终实现更完备的检测覆盖。
研究团队使用TQS方法在MySQL、PolarDB等4个数据库中进行实验,运行仅24小时就检出115个严重及以上等级的逻辑漏洞,比原有方案提速近100倍,成效十分显著。这些数据库漏洞提报给相关社区后均被修复。
论文一作、浙江大学博士唐秀介绍称,在阿里云进行研究型实习期间,她与联合团队一起完成了课题攻坚:“当时阿里云团队正进行PolarDB内核测试,提出了如何更好检测逻辑漏洞的问题,这是我们研究的起点。此后两年,我们尝试了多种解决方案,并最终在商业数据库系统的真实场景中验证了TQS方法的有效性。”