章节目录 第875章 第一代AI大模型新思NewMind诞生
第876章 第一代AI大模型新思NewMind诞生
方青叶得到这消息是早上上班以后,白藕打电话告诉他的。
白藕语气平静但也压抑不住内心的激动:「根据周胜铉的汇报,N.0.V.A.已经完成了对话状态跟踪丶多轮一致性丶数学定理证明丶符号推理丶对抗性红队测试等,昨晚又完成了创造性能力内容中的内容创作,AI大模型已经初步完成。」
啊?
成了?
半年前汇报不是遇到技术难题停滞吗?
方青叶有些惊讶。
但周胜铉不会骗自己,也没必要,因为自己从未给他限定时间表。
方青叶也兴奋起来。
不容易啊...
三年半时间投资了近30个亿,AI大模型终于建成,这也是拓方集团最烧钱的一个项目,已经超过智云科技的CloudLedger(云帐本)的研发投入。
于是他立刻决定,下午赶赴申城亲自看一看这个划时代的AI模型。
早上处理完银行的事情后,下午让岳凯开车匆匆赶往申城,也没回御翠园的家直奔拓方大厦。
刚进大厦,就看到自己的秘书路雅楠穿着一身0L套裙,手里还拿着公文包站在大厅里似乎等什么人,看到他走进立刻迎上来,很恭敬的叫了声:「方董好。」
方青叶感到有些奇怪「小路,你怎么知道我现在过来?」
白总给我说了,您下午要来集团总部,吃完饭从南新市区出发,我是按着时间下来接您,现在白总丶李总她们都在模型二组办公区。」路雅楠回答道。
呵....
这个小秘功课做的好啊。
「直接去模型二组。」
方青叶回了声,又匆匆走向电梯门口,路雅楠急步上前按下电梯按钮。
三人进了电梯直奔32楼。
出了电梯迎面就是公司安保人员,要进入办公区域还要刷门禁,30—层和33层是整个拓方大厦安保最严格的区域之一。
除了模型二组的研发人员,集团总部也只有方青叶丶白藕丶李丽等少数高层拥有出入的权力,路雅楠作为秘书无法直接进入—必须进行授权。
通过刷脸系统进入办公区域,方青叶直接来到周胜铉的办公室,白藕和李丽都在,还有名义上是周胜铉顶头上司的魏杏花,以及模型二组的副组长黄桦。
几人看样子在开会,看到方青叶进来,大家都站起来招呼。
方青叶打了个招呼,又看向周胜铉。
卧槽!方青叶吓一大跳。
胡子拉碴丶眼窝深陷很明显是连日熬夜睡眠不足的缘故,不过头发倒是很浓密,就是乱蓬蓬的像个鸟窝。
「我说,周胜铉,你简直像个野人啊.....」方青叶开起玩笑来。「还有黄桦,就你现在这邋遢样,你回家梅朵让不让你进门?」
「嘿嘿.....」黄桦一笑:「我已经三天没回家了,幸亏一身邋遢,否则梅朵认为我又跑到那个夜店鬼混去了。」
这小子,没结婚最喜欢干的事就是泡夜店,差点把苗宏斌的儿子苗伟带坏,不过结婚后听说老实许多,当然工作也很忙根本没时间花天酒地。
开了几句玩笑,方青叶坐下,路雅楠已经给他倒好茶水,他又看着周胜铉:「成了?」
「嗯!」周胜铉点点头:「我们经过语言能力丶知识能力丶对话与交互能力丶推理与问题解决能力丶多模态能力丶创造性能力等十余项国际公认的AI大模型评测标准,全部通过。」
「当然还有些不满意的地方甚至BUG,还需要进一步优化和调试,下一步我们准备开放大模型的网页埠以及开发APP,推向市场。
「胜铉,我记得五月份你汇报时还说N.0.V.A.遇到技术瓶颈,进展停滞,怎么突然就突破了?」方青叶问出心中的疑惑。
「这得感谢黄桦,」周胜铉语气诚恳,「是他建议彻底抛弃原有的底层架构,采用一种全新的架构,我们才得以快速突破。」
虽然自己这个搭档看上去懒散有些不靠谱,甚至夸夸其谈丶自我标榜,但于起活来确实没得说,尤其是脑瓜子聪明,虽然只是硕士,但团队里有些博士还聪明。
不过一向爱自夸的黄桦这次却格外谦虚:「我也是站在巨人的肩膀上—一开个玩笑。其实是受到谷歌那篇《AttentionIsAIIYouNeed》的启发————之前我们走错了路。」
原来,周胜铉的团队在方青叶的安排下从三年前就开始秘密对AI大模型的研发。
用的是国际上所流行的循环神经网络(RNN)和卷积神经网络(CNN)架构,但研发到最后总无法达成预定目标,因为无论是RNN或者CNN都有没办法克服的问题:
无法有效处理序列数据尤其是长序列!
这个缺陷是致命的!
黄桦打了个比方:「它就像一个试图解读整本《红楼梦》的学者,却被强制要求每次只能通过一个钥匙孔去看一个单词。」
「他或许能理解当前的词汇,却永远无法把握段落间的逻辑,更无从知晓:「夏金桂」的登场如何影响了整个故事的命运—一信息的支离破碎,注定了其对整体语境的理解从根源上就是扭曲与徒劳的。」
「直到六月份,谷歌发表的一篇名叫《Attention IsAlI YouNeed》文章,提出了Transformer架构。它完全摒弃了之前RNN)和CNN,用的是完全基于自注意力(Self—Attention)机制,我大受启发,就建议胜铉推倒重来。」
「结果,我们就成功了。」周胜铉最后插话进来。
呵?
还有这段故事?
虽然方青叶在重生前也用各种大模型,什么GPT丶BERT丶DEEPseek等,但那很少注意他的底层架构。
「今天晚上,我请客给大家庆功!」方青叶笑道。
「好啊,方哥,吃完饭,要去夜店消食啊....」黄桦马上提出要求。
「行,没问题!」方青叶一口答应。
「你也得来,不准中途开溜!」黄桦说着又看向白藕,「嫂子,你可别拦着方哥啊?」
「我什么时候说过他?!」
白藕瞥了黄桦一眼,随即正色道:「事情还没讨论完呢,青叶,我们现在正在给N.0.V.A.起个正式名字呢,这个只是它的内部代号。」
名字?deepseek多好听啊。
方青叶第一个想到这个名字。
但一想算了。
给人家小梁同学留条路吧..
于是就问,「你们想好没有?」
「嗯.....有好几个备选。」
白藕说着拿出一份清单递给方青叶。
呵?挺多HeavenlyGenesis(乾元)丶Ne us(联结)Promethea(先觉者)NewMind
(新思).....
「就用NewMind(新思)吧,「全新的思维」,简洁丶乾净。」方青叶提出自己的建议。
「OK,那就NewMind,这是第一代全称可以叫NewMind—MKI」周胜铉立刻决定门方青叶听了点点头,抬头又看了看墙上挂着的钟表,然后对周胜铉说道。
「今天是11月20日————你们能不能在十天内完成优化调试,然后对外发布?」
「方哥,其实这些都是小问题,两三天时间足够,为什么非要等到月底?」
黄桦不解。
「因为,第五届乌镇网际网路大会要在12月3日召开,我要在那天让NewMind—
MKI露一小脸.....」方青叶一脸微笑。 记住本站网址,Www.biquxu1.Cc,方便下次阅读,或且百度输入“ biquxu1.cc ”,就能进入本站
方青叶得到这消息是早上上班以后,白藕打电话告诉他的。
白藕语气平静但也压抑不住内心的激动:「根据周胜铉的汇报,N.0.V.A.已经完成了对话状态跟踪丶多轮一致性丶数学定理证明丶符号推理丶对抗性红队测试等,昨晚又完成了创造性能力内容中的内容创作,AI大模型已经初步完成。」
啊?
成了?
半年前汇报不是遇到技术难题停滞吗?
方青叶有些惊讶。
但周胜铉不会骗自己,也没必要,因为自己从未给他限定时间表。
方青叶也兴奋起来。
不容易啊...
三年半时间投资了近30个亿,AI大模型终于建成,这也是拓方集团最烧钱的一个项目,已经超过智云科技的CloudLedger(云帐本)的研发投入。
于是他立刻决定,下午赶赴申城亲自看一看这个划时代的AI模型。
早上处理完银行的事情后,下午让岳凯开车匆匆赶往申城,也没回御翠园的家直奔拓方大厦。
刚进大厦,就看到自己的秘书路雅楠穿着一身0L套裙,手里还拿着公文包站在大厅里似乎等什么人,看到他走进立刻迎上来,很恭敬的叫了声:「方董好。」
方青叶感到有些奇怪「小路,你怎么知道我现在过来?」
白总给我说了,您下午要来集团总部,吃完饭从南新市区出发,我是按着时间下来接您,现在白总丶李总她们都在模型二组办公区。」路雅楠回答道。
呵....
这个小秘功课做的好啊。
「直接去模型二组。」
方青叶回了声,又匆匆走向电梯门口,路雅楠急步上前按下电梯按钮。
三人进了电梯直奔32楼。
出了电梯迎面就是公司安保人员,要进入办公区域还要刷门禁,30—层和33层是整个拓方大厦安保最严格的区域之一。
除了模型二组的研发人员,集团总部也只有方青叶丶白藕丶李丽等少数高层拥有出入的权力,路雅楠作为秘书无法直接进入—必须进行授权。
通过刷脸系统进入办公区域,方青叶直接来到周胜铉的办公室,白藕和李丽都在,还有名义上是周胜铉顶头上司的魏杏花,以及模型二组的副组长黄桦。
几人看样子在开会,看到方青叶进来,大家都站起来招呼。
方青叶打了个招呼,又看向周胜铉。
卧槽!方青叶吓一大跳。
胡子拉碴丶眼窝深陷很明显是连日熬夜睡眠不足的缘故,不过头发倒是很浓密,就是乱蓬蓬的像个鸟窝。
「我说,周胜铉,你简直像个野人啊.....」方青叶开起玩笑来。「还有黄桦,就你现在这邋遢样,你回家梅朵让不让你进门?」
「嘿嘿.....」黄桦一笑:「我已经三天没回家了,幸亏一身邋遢,否则梅朵认为我又跑到那个夜店鬼混去了。」
这小子,没结婚最喜欢干的事就是泡夜店,差点把苗宏斌的儿子苗伟带坏,不过结婚后听说老实许多,当然工作也很忙根本没时间花天酒地。
开了几句玩笑,方青叶坐下,路雅楠已经给他倒好茶水,他又看着周胜铉:「成了?」
「嗯!」周胜铉点点头:「我们经过语言能力丶知识能力丶对话与交互能力丶推理与问题解决能力丶多模态能力丶创造性能力等十余项国际公认的AI大模型评测标准,全部通过。」
「当然还有些不满意的地方甚至BUG,还需要进一步优化和调试,下一步我们准备开放大模型的网页埠以及开发APP,推向市场。
「胜铉,我记得五月份你汇报时还说N.0.V.A.遇到技术瓶颈,进展停滞,怎么突然就突破了?」方青叶问出心中的疑惑。
「这得感谢黄桦,」周胜铉语气诚恳,「是他建议彻底抛弃原有的底层架构,采用一种全新的架构,我们才得以快速突破。」
虽然自己这个搭档看上去懒散有些不靠谱,甚至夸夸其谈丶自我标榜,但于起活来确实没得说,尤其是脑瓜子聪明,虽然只是硕士,但团队里有些博士还聪明。
不过一向爱自夸的黄桦这次却格外谦虚:「我也是站在巨人的肩膀上—一开个玩笑。其实是受到谷歌那篇《AttentionIsAIIYouNeed》的启发————之前我们走错了路。」
原来,周胜铉的团队在方青叶的安排下从三年前就开始秘密对AI大模型的研发。
用的是国际上所流行的循环神经网络(RNN)和卷积神经网络(CNN)架构,但研发到最后总无法达成预定目标,因为无论是RNN或者CNN都有没办法克服的问题:
无法有效处理序列数据尤其是长序列!
这个缺陷是致命的!
黄桦打了个比方:「它就像一个试图解读整本《红楼梦》的学者,却被强制要求每次只能通过一个钥匙孔去看一个单词。」
「他或许能理解当前的词汇,却永远无法把握段落间的逻辑,更无从知晓:「夏金桂」的登场如何影响了整个故事的命运—一信息的支离破碎,注定了其对整体语境的理解从根源上就是扭曲与徒劳的。」
「直到六月份,谷歌发表的一篇名叫《Attention IsAlI YouNeed》文章,提出了Transformer架构。它完全摒弃了之前RNN)和CNN,用的是完全基于自注意力(Self—Attention)机制,我大受启发,就建议胜铉推倒重来。」
「结果,我们就成功了。」周胜铉最后插话进来。
呵?
还有这段故事?
虽然方青叶在重生前也用各种大模型,什么GPT丶BERT丶DEEPseek等,但那很少注意他的底层架构。
「今天晚上,我请客给大家庆功!」方青叶笑道。
「好啊,方哥,吃完饭,要去夜店消食啊....」黄桦马上提出要求。
「行,没问题!」方青叶一口答应。
「你也得来,不准中途开溜!」黄桦说着又看向白藕,「嫂子,你可别拦着方哥啊?」
「我什么时候说过他?!」
白藕瞥了黄桦一眼,随即正色道:「事情还没讨论完呢,青叶,我们现在正在给N.0.V.A.起个正式名字呢,这个只是它的内部代号。」
名字?deepseek多好听啊。
方青叶第一个想到这个名字。
但一想算了。
给人家小梁同学留条路吧..
于是就问,「你们想好没有?」
「嗯.....有好几个备选。」
白藕说着拿出一份清单递给方青叶。
呵?挺多HeavenlyGenesis(乾元)丶Ne us(联结)Promethea(先觉者)NewMind
(新思).....
「就用NewMind(新思)吧,「全新的思维」,简洁丶乾净。」方青叶提出自己的建议。
「OK,那就NewMind,这是第一代全称可以叫NewMind—MKI」周胜铉立刻决定门方青叶听了点点头,抬头又看了看墙上挂着的钟表,然后对周胜铉说道。
「今天是11月20日————你们能不能在十天内完成优化调试,然后对外发布?」
「方哥,其实这些都是小问题,两三天时间足够,为什么非要等到月底?」
黄桦不解。
「因为,第五届乌镇网际网路大会要在12月3日召开,我要在那天让NewMind—
MKI露一小脸.....」方青叶一脸微笑。 记住本站网址,Www.biquxu1.Cc,方便下次阅读,或且百度输入“ biquxu1.cc ”,就能进入本站