天天快播：3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

当前位置：首页 > 滚动 > >正文

天天快播：3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

来源：商业新知网时间：2023-05-19 10:36:57

来源" 机器之心

谷歌内部文件又泄露了，这次是谷歌新一代大模型 PaLM 2 的训练细节：训练数据量是前代的近 5 倍、参数量是前代的三分之二左右。

【资料图】

上周四，在 2023 谷歌 I/O 大会上，谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM2 ，并正式发布预览版本，改进了数学、代码、推理、多语言翻译和自然语言生成能力。

PaLM 2 模型提供了不同尺寸规模的四个版本，从小到大依次为 Gecko、Otter、Bison 和 Unicorn，更易于针对各种用例进行部署。其中轻量级的 Gecko 模型可以在移动设备上运行，速度非常快，不联网也能在设备上运行出色的交互式应用程序。

不过会上，谷歌并没有给出有关 PaLM 2 的具体技术细节，只说明了它是构建在谷歌最新 JAX 和 TPU v4 之上。

昨日，据外媒 CNBC 看到的内部文件称， PaLM 2 是在 3.6 万亿个 token 上训练。作为对比，上代 PaLM 接受了 7800 亿 token 的训练。

此外，谷歌之前表示 PaLM 2 比以前的 LLM 规模更小，这意味着在完成更复杂任务的同时变得更加高效。这一点也在内部文件中得到了验证， PaLM 2 的训练参数量为 3400 亿，远小于 PaLM 的 5400 亿。

PaLM 2 的训练 token 和参数量与其他家的 LLM 相比如何呢？作为对比，Meta 在 2 月发布的 LLaMA 接受了 1.4 万亿 token 的训练。OpenAI 1750 亿参数的 GPT-3 是在 3000 亿 token 上训练的。

虽然谷歌一直渴望展示其 AI 技术的强大能力以及如何嵌入到搜索、电子邮件、文件处理和电子表格中，但也不愿公布其训练数据的大小或其他细节。其实这样做的不只谷歌一家，OpenAI 也缄口不言其最新多模态大模型 GPT-4 的细节。他们都表示不披露细节是源于业务的竞争属性。

不过，随着 AI 军备竞赛的持续升温，研究界越来越要求提高透明度。并且在前段时间泄露的一份谷歌内部文件中，谷歌内部研究人员表达了这样一种观点：虽然表面看起来 OpenAI 和谷歌在 AI 大模型上你追我赶，但真正的赢家未必会从这两家中产生，因为第三方力量「开源」正在悄然崛起。

目前，这份内部文件的真实性尚未得到验证，谷歌也并未对相关内容置评。

网友评论

在官宣 PaLM 2 之初，就有网友根据 Chinchilla 定律预测其参数量，ta 预测 PaLM 2 模型家族的参数结果为 80B / 90B / 100B 不等，和这次爆料的 340B 还是差距很大的。

还有人对 PaLM 2 的训练成本进行了一波预测，根据历代大模型的发展来看，这位网友表示，打造 PaLM 2 需要耗资 1 亿美元。

PaLM 2 参数都泄密了，可以试着推测 Bard 了，这位网友表示：

随着 PaLM 2 token 数的泄露，网友不禁疑问，在 AGI 到来之前，多少 token 才能迎来一次大转折？

X 关闭

最近更新

500 Internal Server Error

2023-09-09 14:44:50

滚动
鹏辉能源：公司现金流正常，目前能满足公司经营需要

2023-09-09 12:53:30

滚动
商丘市梁园区平原街道办事处开展功能型党支部建设观摩活动

2023-09-09 10:56:07

滚动
遗憾！王欣瑜谢淑薇止步美网4强

2023-09-09 09:41:56

滚动
别克E5汽车今日首次OTA升级已有1.2万用户更新

2023-09-09 08:06:34

滚动
《古堡》：李慧奇的文化苦旅

2023-09-09 04:58:54

滚动
黔东南“村BA”代表队将亮相男篮世界杯决赛

2023-09-08 23:01:09

滚动
赤练蛇赤练

2023-09-08 21:10:06

滚动
女儿凌晨三点误拨妈妈电话，醒来一看手机“吓坏了”

2023-09-08 19:59:38

滚动
GGII：7月我国新能源汽车出口约10.1万辆同比增长87%

2023-09-08 19:22:18

滚动
广汽集团：8月汽车销量196761辆，同比减少9.68%

2023-09-08 17:58:22

滚动
非遗亮相“丰·创”市集丰台惠民文化消费季启动

2023-09-08 16:59:04

滚动
工信部等五部门：着力培育元宇宙龙头企业和专精特新中小企业打造产业创新联合体

2023-09-08 15:51:09

滚动
沙雕出击狂飙上色怎么过

2023-09-08 14:42:50

滚动
华力创通再度涨停，9天涨超160%

2023-09-08 13:27:31

滚动
中国驻瑞典大使崔爱民在瑞媒体发表署名文章《真实的新疆，美好的家园》

2023-09-08 11:49:47

滚动
甘肃电网6月“两个细则”结算执行情况公布

2023-09-08 10:53:43

滚动
圣晖集成9月8日快速回调

2023-09-08 10:25:35

滚动
光刻胶概念持续活跃，张江高科强势3板

2023-09-08 09:40:43

滚动
用万用表怎样检测三相电机的好坏（万用表测三相电机好坏怎么测）

2023-09-01 09:52:49

滚动
上海街头惊现“露天激情”，视频曝光引争议：辣眼睛

2023-09-01 09:14:39

滚动
生益科技：8月31日融券净卖出5.24万股，连续3日累计净卖出10.97万股

2023-09-01 08:21:33

滚动
初秋野钓鲫鱼技巧（钓鲫鱼技巧）

2023-09-01 07:02:51

滚动
sandisk是什么牌子u盘被写保护怎么办 sandisk是什么牌子

2023-09-01 04:04:38

滚动
我国明年将发射2艘神舟飞船和2艘天舟飞船

2023-08-31 22:40:39

滚动
康强网口腔招聘网官网（康q网）

2023-08-31 20:55:03

滚动
孩子被锁车里不见大人消防接报破窗营救

2023-08-31 19:38:43

滚动
男排奥运资格赛将于9月底在西安开赛

2023-08-31 18:07:13

滚动
哈利波特与凤凰社读后感100字哈利波特与凤凰社读后感

2023-08-31 17:21:29

滚动
奥特佳股东户数减少100户，户均持股6.58万元

2023-08-31 16:06:09

滚动
海关总署：2023 年促进跨境贸易便利化专项行动取得明显阶段性工作成效

2023-08-31 14:59:26

滚动
头季稻亩产1334斤四川再生稻新品种“崇香优20”首次试种成功

2023-08-31 13:33:13

滚动
莫尔斯纳的群像(关于莫尔斯纳的群像简述)

2023-08-31 12:18:03

滚动
三峡新材（600293）：该股换手率大于8%（08-31）

2023-08-31 11:02:49

滚动
最新半年报出炉中银战略新兴产业股票A持仓曝光！加仓减仓这些股…

2023-08-31 10:04:48

滚动
贵南高铁全线开通运营贵阳到南宁3小时内可达

2023-08-31 09:01:59

滚动
外资二季度追捧A股三大产业新能源尤其受青睐

2023-08-31 07:57:35

滚动
海南5年来制定30余项生态文明建设相关政策法规

2023-08-31 05:45:40

滚动
迷失自我的句子经典语录_迷失自我

2023-08-31 01:13:45

滚动
北京怀柔雁栖湖怀柔必去的十大景点）

2023-08-30 21:46:48

滚动
三维通信：多维筑基营收引擎通信运营业务增幅大

2023-08-30 20:35:07

滚动
瑞丰高材：实控人及其一致行动人承诺未来六个月内不减持公司股份

2023-08-30 19:08:13

滚动
北水动向|北水成交净买入45.91亿港元港股市场流动性改善可期内资加仓港交所(00388)超6亿

2023-08-30 17:51:22

滚动
昆明大观街道推进“口袋公园”建设

2023-08-30 17:02:18

滚动
西流湖街道数字化城管提升城市管理水平

2023-08-30 15:32:15

滚动
廊坊福利院救助站联系电话＋地址

2023-08-30 14:28:01

滚动
云溪社区反诈宣传进村入户

2023-08-30 13:05:36

滚动
安全帽后面贴什么标识好看（安全帽后面贴什么标识）

2023-08-30 11:37:41

滚动
游魅力雅安享清凉舒爽

2023-08-30 10:23:35

滚动
慧智微-U（688512）盘中异动股价振幅达6.32% 上涨7.26%（08-30）

2023-08-30 09:31:15

滚动
西蒙斯：我是三届全明星最佳阵容，回来统治对手

2023-08-30 08:47:01

滚动
孔李博(关于孔李博简述)

2023-08-30 07:00:39

滚动
南丁格尔奖获得者刘小娟：一碗热干面让患者重拾信心

2023-08-30 04:42:07

滚动
息差压力、存量房贷、分红前景，农行管理层回应多个热点问题

2023-08-29 23:04:16

滚动
复盘每场考试及时查缺补漏

2023-08-29 21:28:28

滚动
圣农发展：上半年净利润4.26亿元同比扭亏

2023-08-29 19:51:04

滚动
中粮资本：2023年半年度净利润约8.19亿元同比增加191.54%

2023-08-29 18:09:50

滚动
洪幕村：弘扬传统文化探索中草药的奥秘

2023-08-29 16:47:53

滚动
8月29日福斯达涨5.93%，交银启诚A基金重仓该股

2023-08-29 15:15:07

滚动
梦幻西游降妖伏魔副本怎么过2023（梦幻西游降妖伏魔副本攻略2023）

2023-08-29 13:50:20

滚动
《博德之门3》术士怎么加点术士加点推荐

2023-08-29 12:25:26

滚动
职工医保跟居民医保的区别是什么?职工医保跟居民医保同时参保怎么办？

2023-08-29 10:40:31

滚动
三星ativ（q）

2023-08-29 10:12:44

滚动
8月29日生意社电石基准价为3283.33元/吨

2023-08-29 09:13:52

滚动
谁花5555元买早餐了老板正找你！老板：百分百扫多了不该挣的不挣具体是什么情况?

2023-08-29 07:44:01

滚动
奇迹暖暖破晓之战什么时候复刻奇迹暖暖破晓之战复刻信息介绍

2023-08-29 06:00:53

滚动
【西街观察】A股的信心进阶之路

2023-08-29 00:57:40

滚动
中国海警局：盗采海砂高发势头已得到有效遏制

2023-08-28 21:34:33

滚动
电子行业周报：英伟达业绩超预期，AI浪潮大势所趋

2023-08-28 20:21:14

滚动
95只创业板股换手率超20% 10股浮现机构身影

2023-08-28 18:45:21

滚动
扣非净利超预期增长，大语言模型助力产品端研发

2023-08-28 17:29:15

滚动
沉浸营造与创意焕新：青岛啤酒节“潮流IP”悦动全国

2023-08-28 15:55:56

滚动
“深圳－巴黎”空中货运专线加密至每周6班

2023-08-28 14:28:57

滚动
惠特摩尔：当选夏联MVP是有原因的所有的工作都得到了回报

2023-08-28 13:14:28

滚动
捡到他人财物随意丢弃，处置不当如何承担法律责任？

2023-08-28 11:15:17

滚动
阎崇年和祝勇：同名不同味的《故宫六百年》

2023-08-28 09:49:45

滚动
金田股份（601609）634.27万股限售股将于8月28日解禁上市，占总股本0.43%

2023-08-28 07:54:51

滚动
女人梦见水果什么预兆

2023-08-28 05:39:44

滚动
自适应空气悬挂是什么意思（空气悬挂是什么意思）

2023-08-28 03:01:22

滚动
复旦大学迎来2023级本科新生

2023-08-27 21:42:02

滚动
印花税减半征收，A股迎来及时雨！

2023-08-27 19:44:44

滚动
中国正能量：让网络空间与时代脉动同频共振

2023-08-27 17:41:28

滚动
怎么放风筝才能起飞得更高（怎么放风筝才能起飞）

2023-08-27 15:37:09

滚动
恭喜梅西！迈阿密主帅官宣！3大神迹将延续，冲第45冠＋第8座金球

2023-08-27 13:31:42

滚动
天交作品“交响诗篇《长城》”将登国家大剧院用旋律展现长城精神

2023-08-27 11:57:21

滚动
揪心！19岁女生失联多日，监控拍下最后身影……

2023-08-27 10:09:05

滚动
微视频丨何为警察

2023-08-27 08:41:03

滚动
近期好价，入手小米12S，仅需2499元

2023-08-27 05:53:44

滚动
黄守愚：儒商心史藏金匮——评李文金《草籽花》散文集

2023-08-26 22:52:12

滚动
常州一隧道口发生惨烈车祸车辆翻过隔离带撞上对面车辆

2023-08-26 20:30:38

滚动
王太利老婆李桃（王太利老婆）

2023-08-26 17:59:28

滚动
勇利投资(01145)公布中期业绩净亏损98.3万美元同比盈转亏

2023-08-26 15:50:54

滚动
注意了！这些名字容易考上理想大学

2023-08-26 14:00:07

滚动
探访北京海鲜市场：有店家遮住招牌上“日料”字样

2023-08-26 11:36:20

滚动
长洲情侣烧炭女死，男清醒涉藏毒，宾馆女职员搬炭被捕

2023-08-26 10:02:47

滚动
最高法聘任第四届共149名特约监督员

2023-08-26 09:07:57

滚动
成都一培训机构突然关门？负责人：之前运营问题场馆暂时关闭，目前已恢复上课

2023-08-26 07:31:22

滚动
IMF总裁预计在全球主要央行对抗通胀后货币政策将出现分化

2023-08-26 05:12:49

滚动
骁龙7+Gen2：最“短命”的神U ？

2023-08-26 00:35:14

滚动
【明日方舟】桃文不想被忘记的迷迭香

2023-08-25 21:19:06

滚动

天天快播：3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

推荐内容

最近更新