主屏上的《东区消防站手工调度日志复原记录》仍未关闭,那张泛黄纸页的扫描图像静静停留在第一行字:“火警一级——电话通知二队,灯亮,登记,完毕。”陆轩盯着它看了三秒,转身走出作战室。走廊尽头的技术实验室里,语音识别模块的测试正在进行。
测试间内,录音设备循环播放一段模拟高噪环境下的调度指令:“灯亮!断电了!快接三号线!”系统界面跳动数次,最终显示识别结果:“开启照明,执行断电预案,接入第三通信通道。”准确率统计浮现在右下角——58%。技术人员眉头紧锁,第二次播放同一段录音,系统却将“灯亮”误判为“登记”,第三次更是将整句解析为“启动演练模式”。
张涛站在控制台前,手指在键盘上快速翻查日志。“问题不在语料库,而在底层模型。”他抬头看向刚进门的陆轩,“我们用的是标准西语发音训练的算法,但南美地区口音混杂,俚语缩写频繁,加上现场环境嘈杂,现有架构根本无法动态适应。要提升准确率,必须重构核心识别逻辑。”
陆轩没有回应,径直走到操作台前调出《手工调度日志》中的原始语句,一条条导入测试系统。“把这些作为基准指令。”他说,“不是让他们适应系统,是让系统记住他们说话的方式。”
技术组长摇头:“可这样只能覆盖有限场景。如果每家单位都有自己的‘土话’,模型训练成本会呈指数级增长。我们现在连基础框架都跑不稳,更别说多线适配。”
陆轩沉默片刻,下令暂停所有非必要测试,召集技术骨干召开紧急会诊。会议室灯光全开,战术板上贴满语音识别失败案例的截图。陆轩站在前方,声音低而稳:“我们不是要做一个能听懂全世界的系统,而是要做一个能听懂眼前这个人的话的系统。哪怕他只说四个词,我们也得让它听得懂。”
张涛翻开笔记:“目前最现实的路径是缩小识别范围,聚焦应急状态下的高频指令。比如消防单位的‘报警’‘调度’‘断电’,水务的‘泄压’‘关阀’‘上报’。我们可以为每个模块建立独立语音模型,降低计算负荷。”
“那就按这个方向走。”陆轩点头,“但不准删减本地化功能。语音引导必须支持真实口音、真实用语、真实语速。这不是技术妥协的理由。”
会议结束,陆轩返回办公室。桌上已摆好孙明送来的财务预警报告。封面红色印章标注“紧急”。他翻开第一页,数据清晰刺目:quickStart项目预算执行率137%,现金流仅能维持六周运转。采购清单显示,团队为搭建多语种测试环境,购置了三套高价声学模拟设备,并私自增聘外包工程师三人,合同周期六个月。
陆轩拨通内线:“叫孙明和张涛,半小时后作战室见。”
半小时后,作战室灯光调至会议模式。陆轩将财务报告放在中央,目光扫过两人。“轻量化不是烧钱的借口。”他说,“我们砍掉了冗余功能,却增加了开发成本。这不是进化,是倒退。”
孙明陈述:“目前支出主要用于算法优化和硬件支持。若维持现有节奏,下个月初将出现资金缺口。若削减投入,原型交付周期至少延迟两个月。”
张涛试图解释:“语音模块的复杂度远超预期,我们必须保证核心功能可用性。否则,即使系统上线,也会被用户弃用。”
“我同意保证核心功能。”陆轩打断,“但不意味着可以无视资源边界。我们不是在实验室做研究,是在战场上建工事。每一笔投入,都要问一句——它能让系统更快落地吗?能让用户更安心使用吗?”
他站起身,走到战术板前写下三行字:
技术不可妥协
资源必须可控
节奏可以调整
“quickStart不能失败,但也不能拖垮整个南美布局。”陆轩转身,“从今天起,冻结所有非核心岗位招聘,暂停高成本设备采购。你们给我一个精简版技术路线图,七日内提交。我要看到,如何用更少的资源,实现同样的目标。”
张涛欲言又止。
“我知道你们担心什么。”陆轩语气放缓,“怕简化路线会牺牲本地化深度。但真正的深度,不在于用了多少技术,而在于解决了多少问题。我们不是在拼投入,是在拼效率。”
两人离开后,陆轩独自留在作战室。他重新打开财务报告,翻到附录页,目光落在那句自己曾写下的批注:“真正的适配,不是让用户学会系统,而是让系统学会用户。”笔迹清晰,力透纸背。
他盯着这句话良久,缓缓合上文件。
第二天清晨,技术实验室传来新消息:团队尝试将《手工调度日志》中的口语指令转化为声学特征模板,嵌入现有模型进行小范围训练。首次测试,系统在高噪环境下成功识别“灯亮”指令,准确率提升至71%。但当加入更多俚语变体后,模型开始出现混淆,误识率再度攀升。
陆轩赶到现场,调出失败案例逐一分析。他发现,系统能在单一口音下稳定运行,却无法处理同一区域内不同城镇的发音差异。例如,“登记”在沿海地区发音偏软,在山区则带有喉音,现有模型无法区分。
“我们缺的不是数据,是理解。”他对张涛说,“他们不是在说不同的语言,而是在用同一种语言表达不同的生存方式。我们的系统,必须能听出这种差别。”
张涛递上初步评估报告:“如果要在三个月内交付完整原型,需引入外部算法支持或组建专项攻坚组。预计追加投入将超过当前总预算的150%。”
陆轩翻开报告,一页页翻过技术参数、成本测算、风险评估。最后停在结论页:“建议暂缓语音本地化模块,优先推出基础交互版本,待后续迭代中逐步完善。”
他合上文件,走到窗前。晨光洒在总部大楼外墙上,映出一道斜长的光影。他沉默良久,转身走向战术板,拿起笔,划去了原本写着的“三个月交付”时间表。
新的字迹浮现:
重新评估技术路径与资金结构
他按下通讯键:“通知孙明,准备召开跨部门资源协调会。所有与quickStart相关的团队,下午两点前提交当前人力、设备、资金使用明细。我要知道,每一个铜板,都花在了哪里。”
通讯刚结束,林娜推门进来,手里拿着一份刚打印的文件。“技术组提交了最新测试记录。”她将文件放在桌上,“他们在尝试用手工日志的语句做声纹锚点,但模型泛化能力仍然不足。目前只能覆盖东区消防站的特定人员。”
陆轩点头,目光落在文件第一页的测试录音波形图上。其中一段高频波动被标注为“误识别源头”。他盯着那道起伏的线条,仿佛看见调度员在浓烟中伸手按动按钮的画面。
“告诉他们,”他说,“继续用手工日志做训练基准。不要追求完美识别,先做到关键指令零遗漏。”
林娜记录完毕,正要离开,陆轩忽然开口:“把‘应急优先模式’的三大特征再确认一遍。”
“是。”她停下脚步,“核心功能不超过三个按钮;支持语音引导与本地术语替换;离线状态下,基础警报流转必须可完成。”
陆轩看着战术板上的新字迹,声音低沉:“如果连这一点都做不到,我们就没有资格谈什么‘系统学会用户’。”
他转身,拿起笔,在“重新评估”下方写下新的指令:
优先保障离线功能与核心按钮稳定性
语音模块暂定为二期扩展项
资源重组方案明日晨会审议
作战室门再次开启,张涛站在门口,手里握着一份新整理的技术瓶颈清单。陆轩抬头,迎上他的目光。
“我们还能走这条路吗?”张涛问。