8月11-13日,第十七届全国大学生信息安全竞赛作品赛决赛成功举办,学院2021级本科生宋黄超担任队长的“三点饮咖啡先”团队获得金奖!团队提交的作品“NoGPT-基于PPL和对数曲率的AI文本检测平台”斩获决赛一等奖和最具创新创业价值奖!他们也是大连理工大学在该赛事中首支收获最具创新创业价值奖的队伍!
全国大学生信息安全竞赛是由教育部高等学校网络空间安全专业教学指导委员会于2008年发起并主办,全国知名高校轮流承办的一项大学生公益赛事活动。大赛于2020年正式入选“全国高校学科竞赛排行榜”,是国内最具影响力的大学生网络安全学科竞赛。本届比赛采用开放式自主命题,自主设计,共收到全国229所高校、3598名大学生提交的1023个作品。根据网评结果,117所高校的1650余人,共359支队伍脱颖而出,进入决赛环节。参赛高校、队伍和人数再创历史新高。
作为获奖作品,项目“NoGPT-基于PPL和对数曲率的AI文本检测平台”旨在检测大模型在学术、新闻、作业、百科、文学等领域的滥用,广泛收集多个场景数据进行模型训练。平台基于人类文本和AI文本的潜在特征分布差异,通过遮蔽扰动实验,对输入文本进行鉴别。利用vivoBlueLM、Deepseek V2、T5系列等作为遮蔽模型,GPT系列、QwenLM等作为基础模型,生成检测指标困惑度PPL、对数概率LL、对数概率差DLL等,最后根据检测指标通过支持向量机进行鉴别。平台结合OCR引擎和语音识别库支持多模态输入,并通过分词实现中英文检测。通过提高准确率来减少将人类文本误判为AI的错误,提高召回率来加大对AI文本的鉴别力度。此外,还设计了并行计算和滑动窗口的算法,实现了高效计算和细粒度检测,为维护信息的真实性提供了有力支持。
自2023年10月起,宋黄超和队友便着手赛事选题工作。得益于学院组织的多次科创讲座、训练营的积累和专业学习中对人工智能和论文算法的理解,他们在选题时,巧妙结合了最新的科技热点,提出了“AI生成文本检测”的主题。
创意提出后,他和团队一起搜集了足量资料,并在寒假和校赛中逐步打磨了作品。到参加国赛决赛时,整个备赛过程已经持续近1年。回忆这一年,宋黄超表示:“这一年的备赛过程非常曲折和艰辛。我们每个人都付出了很多,齐心协力将算法实现、网页设计、报告撰写、PPT制作、答辩演示这些部分逐个完成,并在每一次提交材料前进一步优化。在一步步地完善和改进中才实现了最终的作品。”
他还记得校赛期间,队伍压线入围校赛。还没有来得及感叹惊险晋级,他和队友便争分夺秒投入校赛答辩准备。他们的校赛结果并不理想。“我们并未因此气馁,而是选择坚持和突破,最终我们入围了国赛决赛。”宋黄超说。从校赛到决赛,他们打磨的不仅仅是作品,也是心态和信心。
作为队长,宋黄超非常注重团队合作,通过合理分工让四人的努力转化为作品的硬实力。为了更高效呈现作品,队内每位成员承担了前端网页、核心算法、模型训练等不同模块的任务。在模块完成后,大家再对接形成完整的作品。决赛过程中,宋黄超负责制作网页和PPT、增设作品功能,钟宝仪同学对接代码和实现多模态、撰写报告,曹宝泉同学接入大模型并提升算法效率,陈一诚同学制作数据集和训练分类器模型。最终,四人的通力合作换来了迭代升级的作品和专业能力的成长。
在为好成绩欣喜之余,宋黄超希望未来能投身于人工智能安全的研究中,为国家安全、信息安全和数据安全贡献大工力量。
为优秀的未来学子,点赞!