【现在的gpu运算是偏向于量化分析的,如果能够引入“模拟质性思考”
,让机器学习更接近于人类获取知识的方式和手段,而非是大力飞砖堆积算力?】
【关键位决策?自我否定替代外部反馈?簇式模型卷积网络?……】
一个个想法如泉涌般冒了出来,无论有用没用,都被纪弘飞速的记录了下来——这都是不可多得的灵感。
【簇式模型卷积网络,用微参数模型决策簇作为神经网络模型的簇式节点,可以让簇式节点本身具有“类质性思考”
能力……】
纪弘不断的思考着,整个方案在基本完整的基础上不断完善,星星点点的模块在他的大脑里迅速形成了千丝万缕的一张大网,如漫天星辰迅速交织,直至牢不可破。
“如果按照这样来搞,模型不会很大,但是会很强。”
纪弘一边点头一边感慨:“类思考式的模型,这是一种微模型,而且训练的模式和理念也全都变了,更加接近人类幼童牙牙学语时的状态。
“因此,训练所需要的数据量大幅减少,“质性思考”
在训练中所占的地位会越来越大,所需算力会越来越小。
“如果把这种微模型跟大模型再结合在一起呢?搞到极致那会是一个怎样的效果?相当于人的智力再加上人工智能的数据规模?啊这……”
纪弘思维越想越发散,甚至有一点儿止不住的趋势,他没有刻意停止,不管可不可行,记录下来回头试试总是没有什么错的。
发散性的思维停下的时候已经好两个小时过去了,纪弘也记录下了非常多不知道有用没用的资料。
“验证一下吧。”
思路很清晰,纪弘也是决定找个样板先验证验证,样板都是现成的,正是之前的《我的赛博女友生气了》。
大模型就用万舸平台提供的文心大模型接口,而类思考微模型是需要他自己搞定的部分。
微模型理念复杂,但规模确实较小,算力需求并不高。
但是,现有的硬件确实存在不太兼容的问题,不管是图形卡还是推理卡训练卡,其本质都是运算核心gpu,都是不太满足需求的。
“现在去搞硬件不现实,还是模拟一下吧,”
纪弘脑筋转了转:“性能损失确实不小,但不是完全不能用,现在只能暂时凑合。”
纪弘捣鼓了好几个小时,都接近凌晨了才终于把所需要的环境搭建好、训练材料配置。
“老婆,睡得太晚了,早上不用叫我吃饭,12点喊我起来就行。”
纪弘拿出手机,给程荟的微信发了一条留言消息,然后很快沉沉睡去了。
……
一觉睡得很香甜,直到纪弘感觉到整个脸上被吹着热气,一睁眼,程荟就紧贴着他正在眼前。
“起床啦,都已经快一点了,赶紧起来吃点儿东西。”
程荟起身一边把衣服扔来床上,一边说道:“以后也别熬那么晚了,对身体不好。
“买房子我们其实不急,我爸妈说什么其实不用管,是我嫁给你,生活是过给自己的,不是给别人看的,咱们自己觉得好就行了。
“再说了,你看现在,房子价格其实也在阴跌,买了说不定还会亏呢,租房子不是一样住吗?
“老公你放心,现在我爸妈拼命的阻止不让结婚,过几年要真不结,急的就是他们了你信不信……”
纪弘没有再听程荟“唠叨”
,迅速的从背后抱住她:“遇到你是我人生最大的幸运。”
宋铮睁开眼睛,看到周围陌生的一切,以及一个四岁大,管他叫爹的小姑娘时,他知道,自己的人生已经发生巨大的转变。...
穿越到了地狱的贝尔希,意识到自己成为了一条深渊龙。携带着暴食之加护的他,只能够依靠不断的吃吃吃来变强了。桂花蜜味道的深渊魔虫花生酥味道的蛋壳,还有一只跟着他蹭吃蹭喝的史莱姆故事也将从这里开始。—已有多本完本经验,成绩一般但依旧坚持将故事讲完,人品大概还算可靠。书友群(与残月狂徒大人一起玩)926993534各位书友要是觉得暴食之龙从地狱位面开始还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...
失手摔了一下游戏头盔,谁曾想,居然摔出一个金手指苏白手上多了个没人能看见的进度条,每隔10个小时,就能创造一个bug第一个bug,苏白提前了全球玩家十个多小时,进入了游戏等所有玩家进入游戏后,苏白已经...