
校内模拟答辩
湖北日报全媒记者陈熹 通讯员王晋昊 杨柯 汪如意
1月13日,湖北工业大学传来喜讯,在2025年度中国青年科技创新“揭榜挂帅”擂台赛中,该校一本科生团队以“面向综合集成研讨的战略博弈智能体构建技术”项目,在新一代信息技术领域脱颖而出,获全国特等奖。
而5个月前,他们还对项目需求一头雾水;5个月后,这群大三学生交出了一份0.02秒决策、千场对战胜率超高的“硬核”答卷,成功攻克航天领域算法技术难题。
从“看不懂”到“啃下来”
“最初拿到中国航天研究院的项目需求时,我们完全摸不着头脑!”团队负责人、该校经济与管理学院大三学生田俊杰回忆起当时的情景,仍然忍不住提高了音量:6月,中国航天研究院只发布了战略博弈技术需求——“研发智能算法”,核心规则与操作平台却迟迟未公布,“这让我们这个以大数据管理与应用专业学生为主的团队十分困惑。”
7月初,谜底揭开:中国航天研究院发布基于卡牌游戏的仿真平台,包含9类国家身份、4个阶段随机事件,对战双方需在未知对方身份与决策逻辑的情况下投入资源博弈,典型的不完全信息博弈问题。
规则一出,赛道瞬间清晰,却也更加残酷——初赛必须击败官方基础智能体,决赛采用“两两PK”循环对战,每两队完成1000场对战。
“原本我们打算采用大语言模型技术。”团队指导教师、经管学院副教授胡昌龙说,但是,7月中旬的一纸“本地部署、禁止联网”通知,让团队前期基于联网数据训练的模型性能骤降,“几乎推倒重来”。
团队迅速拆分为6个研究小组,分别攻关:有人用数学建模穷举所有场景,有人复现已发表的论文的算法框架,有人专攻算法轻量化。为了筛选最优方案,团队内部对决,通过数万场模拟对战记录数据,最终只留下胜率最高的“轻装”算法。
雪上加霜的是,平台7月中旬的一次漏洞修复,把身份颜色对应关系全部打乱,团队此前基于错误映射训练的模型与提示词瞬间失效。“半个月心血归零,我们只能连夜重写代码,重新建立身份与策略的对应关系,同时优化算法结构,确保在不联网环境下也能保持决策精度。”田俊杰说,为了兼顾决策速度与收益,我们舍弃了复杂的深度学习框架,采用轻量化算法设计,最终实现0.02秒快速响应,既满足比赛时间限制,又保证了对战胜率。
“高效协同是逆袭的关键。”田俊杰介绍,团队建立了“一日一调度、两日一会议”的战时机制:成员们分工明确,部分成员负责代码编写与算法调优,其他成员承担文献查阅、数据记录、平台测试等工作,并主动联系航天研究院技术人员沟通规则细节,确保研发不偏离方向。每周指导老师还会进行一对一辅导。

团队师生讨论项目
从航天场景到应急调度,算法已收到多家单位邀约函
决赛中,湖工大团队研发的算法,在1000场对战中保持高胜率,决策时延稳定控制在0.02秒,其快速决策能力与稳定性能获得评委认可。该算法通过精准分析已知对战信息,动态调整资源投入策略,在不完全信息环境下实现收益最大化,其核心逻辑不仅适用于航天领域的战略博弈场景,还可拓展至应急资源调度、金融投资决策、智慧城市管理等多个领域。
“应急调度本质上也是一种不完全信息下的决策问题,比如灾害发生后,如何在信息不充分的情况下优化资源分配,我们的算法思路可以提供解决方案。”胡昌龙表示,目前已有多个单位的项目表达了技术借鉴意向,团队未来计划进一步深化研究,推动技术在实际场景中落地。
“最珍贵的不是奖杯,而是学生从‘我不会’到‘我可以’的蜕变。”该校经济与管理学院党委副书记余贞说,参赛队员全是本科三年级,却提前经历了科研全流程,获奖也更坚定了他们深耕信息技术领域、用科技解决实际问题的决心。
“对,这段经历更重要的是,让我们明白了要敢于创新,勇于创新。就算遇到挫折,大家一起努力,也一定能攻克。”团队成员罗友真说,比赛给了我很大的信心,未来我会继续深耕算法,继续做科研。
“学科的边界正在模糊,创新的前沿往往位于交叉地带。”胡昌龙说,管理学科的学生能把算法“啃”下来说明,当管理思维与前沿数字技术深度融合,传统的‘软学科’也能锻造出解决时代‘硬问题’的真本领。”
原文链接:https://news.hubeidaily.net/hbrbsharenew/news_detail/5/5018039/4515013/0?w=1768312251786&uik=fa5219bc&share_plat=android&sec=187a4d3d&historyback=1
责任编辑: