以前聊AI进步,大家总说“模型越大、数据越多,能力就越强”,这就是所谓的“AI Scaling Law(规模定律)”。但现在业界发现,靠“堆规模”练模型的效果越来越差,就像给植物浇水,一开始浇得多长得快,后来再怎么浇,长得也慢了。不过不用慌,AI的发展焦点已经转了方向,接下来的突破会从3个新维度来,咱们一个个用大白话讲透。
一、定律“换赛道”:从“练模型时堆规模”,转向“用模型时提能力”
先搞懂“规模定律”到底在“换”什么。以前的“规模定律”,核心是“预训练规模定律(pre-trained SL)”,简单说就是“练模型的时候,把数据量、模型参数堆得越大,模型就越聪明”。比如以前练一个语言模型,用1000亿数据、1万亿参数,比用100亿数据、1000亿参数的模型,写文案、答问题的能力强得多。
但现在这条路走不通了——不是堆得越大没用,而是“边际效益平缓”,也就是“多花10倍钱堆规模,能力只多1倍”,不划算。所以行业开始把焦点转向两个新的“规模定律”,相当于从“练内功”转向“练实战”。
第一个转向是“推理规模定律(Inference SL)”。“推理”就是AI“用知识解决问题”的过程,比如你问AI“怎么修漏水的水龙头”,它要从脑子里调出“水龙头结构”“维修步骤”,再组织成你能懂的话,这个过程就是“推理”。以前没人关注“推理”的规模,现在不一样了——行业开始研究“怎么让AI在推理时,能处理更复杂的问题、更长的任务”。比如以前AI只能帮你想“修水龙头的3个步骤”,现在能帮你想“先判断是阀门坏了还是水管漏了,再告诉你买哪种零件,甚至帮你查附近的五金店,对比零件价格”,这就是“推理规模”提升了,能把“解决漏水问题”这个事从头到尾想明白。
第二个转向是最终目标:“智能体规模定律(Agentic SL)”。“智能体”就是咱们之前聊的“能自己干活的AI”,这个定律的核心是“衡量智能体综合能力的规模”。简单说,以前看AI强不强,看“练模型用了多少数据”;以后看AI强不强,看“智能体能不能搞定更复杂的任务、跟更多设备联动”。比如一个智能体,能帮你“搞定出差行程”,这是基础能力;要是能帮你“搞定出差+同步处理工作邮件+跟客户预约面谈+回来后写出差报告”,这就是“智能体规模”更大,综合能力更强。这个定律一旦成熟,AI就能从“只会解决单一问题”变成“能包办一整套事”。
二、范围“扩圈子”:从“只会玩语言”,到“能看、能听、能懂各行各业”
以前的“规模定律”,基本只在“语言模型”里管用,也就是AI“学说话、写文字”的领域。比如练语言模型时,堆的是“文字数据”,提升的是“写文案、翻译、答问题”的能力,其他领域不管。但现在不一样了,“规模定律”开始“扩圈子”,往更多领域延伸,最明显的就是两个方向。
第一个方向是“视觉模型规模定律(Vision SL)”,也就是AI“看东西”的能力。以前AI看图片,只能认出“这是猫”“那是狗”,因为“视觉模型”没怎么堆规模;现在行业开始用“规模定律”练视觉模型——堆更多的图片数据、更大的模型参数,让AI不仅能“认东西”,还能“懂东西”。比如你给AI看一张“厨房乱糟糟的照片”,它不仅能认出“有脏碗、没叠的抹布、散落的调料瓶”,还能告诉你“收拾步骤:先把脏碗放进洗碗机,再叠好抹布,最后把调料瓶归位到橱柜第二层”,甚至能根据照片里的橱柜大小,推荐“买哪种调料架更合适”。这就是“视觉规模”提升了,从“能看”变成“能看懂、能给方案”。
第二个方向是“领域特定规模定律(domain SL)”,也就是“针对具体行业的规模定律”。以前的AI是“通用选手”,什么行业的问题都能答,但都不精;现在行业开始给AI“分专业”,针对医疗、教育、汽车这些具体领域,用“规模定律”练“专业模型”。比如医疗领域,练模型时堆的不是“通用文字数据”,而是“几百万份病历、几千万张ct影像、几万种疾病的诊疗指南”,这样练出来的医疗AI,不仅能“认出ct里的肿瘤”,还能根据患者的年龄、病史,推荐“先做穿刺检查,还是直接手术”,甚至能对比“不同化疗方案的副作用和治愈率”,给医生参考——这就是“医疗领域的规模定律”,让AI从“懂点医疗常识”变成“半个医疗专家”。
现在这两个方向一扩展,AI就从“只会玩语言的单一选手”,变成“能看、能听、懂各行各业的全能选手”,多模态(又会说、又会看、又会懂专业)的能力越来越强。
三、成本“砍半价”,能力“翻十倍”:AI终于能从“纸上谈兵”变“真干活”
这是最关键的一个变化——以前AI虽然聪明,但“用起来太贵”,比如让AI帮公司处理1万份客户数据,可能要花几千块,小企业用不起;现在不一样了,AI的“成本”和“能力”正在形成一个“剪刀差”,简单说就是“花的钱越来越少,干的活越来越好”,这直接让AI能从“只在实验室里厉害”变成“能大规模帮人干活”。
先看“成本陡降”:AI“推理单位成本”每年降10倍。“推理单位成本”就是“AI帮你解决一个问题,或者处理一份数据,你要花的钱”。比如2023年,让AI整理1份客户沟通记录,要花1块钱;2024年,同样整理1份,只要花1毛钱;2025年,可能只要1分钱。为什么降这么快?因为技术在升级,比如现在能让AI“用更少的算力处理更多数据”,就像以前手机充1次电只能用1天,现在能用上3天,“用电成本”降了,AI的“使用成本”也跟着降。
再看“能力跃升”:智能体综合能力和所需算力每年涨10倍。“综合能力”就是AI“干实事”的本事,比如2023年,智能体只能帮你“订机票”;2024年,能帮你“订机票+安排酒店+预约客户面谈+整理出差报告”;2025年,可能能帮你“搞定整个项目的从启动到落地,包括分工、进度跟踪、风险处理”。同时“所需算力”也在涨,不是说“用的算力多了成本就高”,而是“同样的算力,现在能支撑AI干更复杂的事”,相当于“以前1台电脑只能同时开1个软件,现在能开10个,还不卡”。
这一“降”一“升”的“剪刀差”,带来的影响特别大。以前企业觉得“用AI不划算”,现在“花1分钱,能让AI干10块钱的活”,自然愿意用;以前AI只能“帮人想方案”(比如“写一份营销计划”),现在能“帮人把方案落地”(比如“写计划+找合作方+跟踪效果+调整策略”),从“能思考”变成“能实干”。比如小餐馆,以前雇人整理订单、算库存,每月要花几千块;现在用智能体,花几十块就能让AI“自动接收外卖订单、提醒后厨备菜、统计每天的食材消耗、推荐第二天的采购清单”,还不会出错——这就是AI“实用化、规模化”的体现,以后不管是大企业还是小个体户,都能用得上AI,而且用得起。
总结:AI下一轮突破,看“实战、专业、划算”
以前AI靠“堆规模练模型”,现在靠“练推理、扩领域、降成本”。简单说,下一轮厉害的AI,得满足三个条件:一是“能实战”,不是只会写文字,而是能从头到尾解决复杂问题;二是“够专业”,不是什么都懂一点,而是在某个行业里能当“帮手”;三是“很划算”,不管谁用,都花不了多少钱。
以后咱们再看AI强不强,不用问“模型有多大”,而是问“能不能帮我搞定这件事”“用起来贵不贵”——这才是AI真正走进生活、改变行业的关键。