趣趣阁 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

“chatGpt你知道吧?‘言心’也是一个语言模型,跟chatGpt的差别就是,相比之下,‘言心’更擅长中文语料。”

这个话题一旦展开,是怎么也绕不过去现今大火的聊天机器人chatGpt的,chatGpt推出2个月即拥有1亿月活用户,在消费者应用程序里,它是历史上最快达到这个数字的。

如今,它就是聊天机器人的标杆产品,火的一塌糊涂。

“chatGpt的三代模型的核心架构都是transformer,从本质上讲,它依然是基于海量数据的延伸,并没有新的颠覆性技术,也没有从本质上超出现有的技术。”

说起chatGpt,程旭对此很不以为然——现阶段,人工智能的理论并没有新的进展,谁强并不是强在理论先进、技术高超上,而是强在硬件实力、强在算力堆积上。

换句话说,就是钱——就拿chatGpt来说,它训练一次几乎就差不多需要三千万人民币以上的资金。

更别说每年的运营,据估算,每年仅是cpU和GpU的成本就能达到十亿人民币这个级别,再加上其他的费用,这真的不是一般企业能够承受的住的。

哪怕是千寻这样的巨头搜索企业,搞出“言心”这个语言模型,也是持续投入了十年以上,每年的投入几乎是整个千寻科技利润的五分之一——这绝对是一个惊人的数字。

“但微软是真的舍得投钱啊,十亿美金十亿美金的,钱跟不是钱似的往里投资。”

说着的时候,潘正甚是羡慕:“他们甚至给openAi团队配了一台性能极为强悍的超算,看着就让人眼红。”

“千寻科技的投入也不差吧?而且以后肯定还会越来越重视。毕竟现在Gpt已经开始集成到bing搜索引擎,未来肯定是要发力的。

“而搜索引擎,这可是千寻科技的核心业务、甚至可以说是根基所在。bing未来在国内肯定是要跟千寻搜索直接竞争的,千寻也绝对不会无动于衷的!”

要说chatGpt这种极为强悍的聊天机器人出现对谁的影响最大?

那当然是搜索业务,它对搜索引擎的影响简直就是颠覆性的。

相比于传统的搜索引擎来说,拥有极致的语言处理技术和语言理解能力的chatGpt简直太超前了!

它与用户直接对话,用类似于人与人交互的方式进行搜索,而不是传统的关键词匹配。

这种搜索得出的结果更加直接、快捷,也更加容易使用,甚至直接放到论文里都没问题,查重都查不出来。

更有甚者,程序员给它描述需求,它能直接生成可用的代码——它对语言的理解能力已臻于化境!

而这对于千寻搜索来说,肯定不是什么好消息。

而“言心”模型,程旭印象中,“言心”好像是确实出了什么问题,好像还闹挺大的。

原本说是三月上线,三月是上线了,不过更多的是偏向于于商业合作伙伴,比如各类媒体、地图、房产等大型的合作伙伴——提供智能化的检索服务。

对个人的开放一开始就有所限制,初期好像就没开,印象中搞了一个什么邀请测试方案。

后来才关注到,好像是模型的训练出了什么问题,但这其中究竟发生了什么,程旭也没有过多的关心。

“千寻确实花了不少钱,投资也数十上百亿了。”

潘正没有否认程旭的说法,这些东西都已经是公开可求证的了,不过,随后他便微微摇了摇头:“但是现在有点儿,坏了!”

“坏了?”

程旭有些不解,坏了是个什么概念?有这个术语吗?

“难道是寒武纪受到限制,训练卡和推理卡都不能及时供应得原因?”程旭有些不解,这是有些影响,但按理说,这还影响不到当前的上线。

“也不是什么机密,稍微消息灵通点儿的人一打听都知道。”

潘正无奈道:“不是硬件的问题,寒武纪的问题影响暂时确实没有那么大,是‘言心’基础模型的问题。”

程旭更加不解了,基础模型能有什么问题?

都训练那么长时间了,数十上百亿的资金都投入进去了,基础模型有问题都没发现吗?

“这算是早期的一个小失误,”潘正解释道:“原本不是什么大问题,但现在确实不好解决了。”

程旭没有吭声,等着潘正的下文,他是越听越糊涂了。

“早期训练的时候,训练人员也没想那么多,那个时候也没有什么严苛的标准,就使用了自己的产品做语料……”

“自家的产品?”程旭眼睛猛地一跳,瞬间就想起来发生了什么事儿了——千寻自家的产品,除了搜索引擎,也就文库和贴吧了!

而对话,贴吧,这……

程旭瞬间醍醐灌顶——脑海中冒出了一大堆的名词:大帝吧,航空吧,人口吧,孙吧,中西部发展吧……

这……

用这些语料做得模型早期训练?

这t-m-d究竟会训练出来个什么玩意儿?

“卧槽!”实在是没忍住,程旭爆了个粗口:“不会训练出‘阴阳人’加‘乐子人’的‘言心’模型吧?拿他岂不是只会阴阳怪气儿,指桑骂槐?”

程旭摇了摇头,只是这样还是好的,真要培养出来一个类似“50w人格”的价值观出来,那千寻真的是哭都没地儿哭去!

“不不不不,没那么严重!”

潘正教授急忙摆手,制止程旭的思维再发散下去,再发散下去要完蛋了。

“真要那么严重的话,早就被发现了,也不会拖到现在。事实上,那只是在极早期的时候发生的事情。

“后续有了标准的训练流程,语料的选择和清洗也有了明确的选择和标准,模型的成长也非常顺利。

“事实上,言心模型也非常强大,毕竟,这也是数十上百亿资金堆起来的。但是,就是偶尔,对于某些问题,‘言心’偶尔就会冒出一些极为离谱的回答。

“就是因为问题是偶发的,技术人员以为是培养的问题,负责人中途也更换过,所以也就没有往早期训练语料方面去考虑。只是选择了选择纠正训练。纠正的效果其实还是不错的,所以就延续下来了。

“但是,事实证明,根儿坏了,是怎么也无法完全纠正回来的,无论迭代多少次,总是有概率出现哪些极为离谱的回答。”

程旭简直无语,早期的模型就是根基啊,咋能出这样愚蠢的失误呢?

其实也不能完全说是技术人员的问题——早期大家都没有经验,都是在摸着石头过河,出现这样那样的问题都是无法完全避免的。

语料清洗,今天已经是一个标准概念了,专业教材都有讲,还没有毕业的大学生都能明白他的重要意义。

但放在十年前,十年前人工智能刚起步,那个时候,谁能知道语料清洗的重要性?

这都是无数人交了巨额的学费,付出了几乎难以承受的代价,才慢慢得出的宝贵经验。

趣趣阁推荐阅读:成神风暴签到从捕快开始穿越火线之英雄有梦快穿攻略:花样男神求推倒我拍科幻片,你说我是军工企业?武侠世界大穿越妖怪茶话会末世神魔录四合院:天坑局,带妹过上好日子快穿女主真大佬系统之农妇翻身逆袭学术渣星际之小白花生存手札末世天灾,我用金屋囤货躺赢逐道在诸天最强恐怖系统逆命从重回末世开始崛起火种纪元机甲:开局武圣附体快穿攻略之女配逆袭手册电影黑科技明末称雄超级制造帝国时空倒爷生活我有一个熟练度面板超级灵泉傲剑镇天重返大隋空降部队进攻悍秦赘婿在生存游戏伪装小白花锤爆丧尸养鬼为祸超神猎人美漫大镖客穿越者杀手异闻:从试睡凶宅开始驱魔人的自我修养快穿:你惹她干嘛?她外挂来的!北宋闲王少女大召唤豪门农媳有空间惟我神尊从留级开始的星际生活星际破烂女王大明悍刀行乐尊横行在宇宙间的龙美剧世界有点乱我家有间万事屋
趣趣阁搜藏榜:玄门医圣我只是踏遍万千银河星海的一束光神话复苏:我东方神明何惧征战快穿我宿主貌美如花逆袭废柴:组建最强联盟如何成为苦瓜苟在港影世界中宇宙织思维度低语的解读者诸天风起灵笼重生之球王巨星为找工作,开局公布黑科技地窟求生:开局获得百倍增幅末世最强兵王尸控岛国未来之丹游星际最强寰宇主神第四天灾的史诗游戏末日之异能主宰源来者末世觉醒,和闺蜜一起囤物资天灾来临,我在末世嘎嘎囤货末世,我创造了僵尸军团快穿之凝魂开局忽悠全球移民,我偷走了蓝星重生之末日时空主宰奇雾山黄泉记忆骷髅,在末世中的旅途无限技能之游戏世界快穿之病态忠犬攻略计末日降临:我率先抢到鼠符咒为了吃遍全宇宙成为植物采集师末世无限夺舍快穿之:腹黑boss宠上天序列降临:从打卡九叔开始我的血液变异了星域狂潮旅人书我的卧室通异星诸天科技之路边境旅者幻想世界大掠夺末世觉醒双异能,我控制世界漫步诸界之旅吞噬之我能简化功法我有一座电子工厂序列进化之我要化成光奇闻调查组主神都得死我在现代量子封神
趣趣阁最新小说:恶雌挺孕肚流放,雄兽们宠疯啦我和IT博士的探灵日记鲛人女配觉醒,毛茸茸大佬争着宠欧皇海上求生?反派他妹只想苟命谁让她误闯废土的!在末日游戏里当农场主惊悚:国家把我F级天赋玩出花!恶毒男配都在我的修罗场末世恶毒女配?我靠十倍返还躺赢穿越后我靠蘑菇干翻虫子只想安静种个田,全员逼我当大佬天灾囤货,我靠毛茸茸在末日躺赢末日降临:从修仙界回来后无敌了末世灾变:我靠收割反派暴富穿成乱世寡嫂,靠空间南迁搞基建穿进男频文,我在末世捡垃圾!我的电脑里有个神级文明牺牲的他与保护的她星河苍芒幻厅恶毒向导不装了,全员火葬场吧末世:我捡的废物都成了神明大佬海洋求生:我靠无限抽卡带飞祖国末世列车,我靠预言读档成为榜一梦里穿越十二宫植物成珍稀?而她一天能种一千亩渣女摆烂后,五个前男友扯头花星际:被迫继承疗养院的餐厅星际娇软雌性,被六S大佬强绑定我在末世被营销成神无限副本:告白后我被邪神盯上了快穿:绿茶大佬今天又被钓了渣雌死遁五年回归,黑化父子爱惨病弱美人在诡异世界封神克系末日摆摊,邪神被我喂成萌宠穿成残次品?全星际大佬嗜我成瘾天才俱乐部雄多雌少,我靠木系异能风生水起星际写小说,雄兽们跪求我更新末日求生:我靠农场系统堆满粮仓兵家镇万界末世种田求生:捡个崽崽开农场我在末日盖房子快穿:硬核宿主玩转三千世界穿成稀有向导,误入哨兵修罗场末世海上求生,在灯塔建造度假村生育值0?兽世大佬们全是我榜一荒野求生:毛茸茸同居手册乙游对象非人类,各个为我修罗场恶雌娇又欲,五个兽夫缠欢上瘾