近日,ACM SIGMOD/PODSInternational Conference on Management of Data(SIGMOD 2025)录用结果全部揭晓,计算机学院共有以必赢线路检测3003为第一单位的4篇长文和1篇Demo论文被大会录用。
SIGMOD是数据库领域的顶级国际会议,致力于展示和分享数据库管理系统和数据管理领域的最新研究成果。作为一年一度的重要学术盛会,SIGMOD在全球学术界和工业界享有极高的声誉,是中国计算机学会(CCF)推荐会议列表中的A类会议。2025年SIGMOD将于6月22日至6月27日在德国柏林举行。
录用论文信息如下:
标题:LSMGraph: A High-Performance Dynamic Graph Storage System with Multi-Level CSR
作者:余松,巩树凤,陶乾,沈斯杰,张岩峰,于文渊,刘朋熹,章志鑫,李红甫,罗小简,于戈,周靖人
合作单位:阿里巴巴达摩院
简介:在大数据时代,图数据规模的激增使得传统内存存储面临严峻挑战。针对这一问题,本研究提出了一个基于磁盘的动态图存储系统LSMGraph,创新性地融合了写优化的LSM-tree和读优化的CSR结构,通过多级存储层次设计实现了高效的写入性能,同时利用内嵌紧凑CSR结构显著提升了读取效率。大量实验评估显示该系统相比于现有最优方案,更新性能提升2.8倍以上,图分析性能提升3.1倍以上。该研究将为社交网络分析、金融风控、商品推荐等需要实时处理大规模图数据的应用场景提供高效解决方案。
标题:Nezha: An Efficient Distributed Graph Processing System on Heterogeneous Hardware
作者:崔鹏杰,刘昊天,江东,唐博,袁野
合作单位:南方科技大学,北京理工大学
简介:在当今数字化时代,图数据在各领域应用中的规模持续膨胀,研发高效且强大的分布式图处理系统已成为迫切需求。然而,当前的分布式图处理系统面临着两大主要挑战:一是单个节点的计算能力尚未得到充分挖掘,二是分布式环境下高昂的通信成本成为了性能提升的瓶颈。针对这些挑战,本文研发出了一款高效的分布式图处理系统——Nezha。Nezha专为异构硬件环境设计,创新性地引入高效的RDMA通信适配器、多设备协同执行器和智能负载均衡器,旨在突破图处理过程中的计算与通信瓶颈,实现更优的计算资源利用和更低的通信开销。实验结果表明,相较于现有的分布式图处理系统,Nezha在性能上实现了显著提升。
标题:Wait and See: A Delayed Transactions Partitioning Approach in Deterministic Database Systems for Better Performance
作者:隋源,杨晓春,王斌,张宇杰,郑白桦
简介:确定性数据库(DDBs)通过预先确定事务调度顺序,避免了传统分布式数据库中的高成本同步协议(如两阶段提交2PC),在保证强一致性的同时显著提升了性能。然而,事务若需跨分区访问数据(即分布式事务),会涉及远程读写操作,导致锁竞争、通信开销等问题,成为系统性能的主要瓶颈。本研究针对这一问题,提出了DelayPart,一种采用Wait and See策略的确定性数据库事务引擎。DelayPart将事务batch划分建模为基于事务相似度的k-割问题,并采用LSH森林(局部敏感哈希森林)方法,在考虑每个batch远程操作全局开销的同时,以线性时间复杂度高效求解近似最优划分方案。通过延迟单个事务的分配与执行,DelayPart能系统分析事务间关联关系,在保证执行效率的同时显著提升整体性能。在实验中,本研究在大型集群上测试验证了DelayPart的性能,结果表明其显著优于当前最先进的事务划分方法。
标题:SWASH: A Flexible Communication Framework with SlidingWindow-Based Cache Sharing for Scalable DGNNTraining
作者:宋振,谷峪,李天义,李玉帅,孙晴,张岩峰,Christian S. Jensen,于戈
合作单位:丹麦奥尔堡大学
简介:分布式动态图神经网络训练涉及多时间快照的计算及跨快照的信息交互,通常面临计算复杂度高、通信开销大及负载均衡控制困难等挑战。为此,本研究提出了一种灵活的通信架构,并定制化轻量级图划分策略以及基于滑动窗口的缓存共享技术,以提升跨窗口节点嵌入信息的复用效率,并有效降低通信量。实验结果表明,在多个数据集及分布式集群环境下,该技术实现了平均9.44 倍的效率提升,同时保持与全通信框架相当的模型精度。该研究可广泛应用于社交网络分析、交通流预测及知识图谱推理等大规模动态图处理任务。
标题:NeutronRAG: Towards Understanding the Effectiveness of RAG from a Data Retrieval Perspective [Demo]
作者:李沛铮,陈朝亿,袁昊,付振波,沈航,杨欣博,王千阁,艾新,张岩峰,闻应友,于戈
简介:在当前人工智能领域,检索增强生成(RAG)技术已成为提升大语言模型专业领域表现的关键手段。面对VectorRAG、GraphRAG等多样化解决方案在实际应用中暴露的评估标准不统一、参数配置复杂等痛点问题,本研究推出创新性工具NeutronRAG。该系统突破性地整合了混合检索策略,通过可视化分析和智能参数推荐功能,帮助研究人员直观比较不同检索方法的优劣,并精准优化系统配置。实验表明,该工具能有效提升信息检索准确率和模型生成质量,为智能客服、知识问答等需要精准数据支撑的应用场景提供了全新的优化方案。
链接地址:https://github.com/iDC-NEU/NeutronRAG