找到相关的专题报道信息 - 论证

热门搜索

数学论证GPT-4不是随机鹦鹉：真如此的话整个宇宙都会坍缩

克雷西发自凹非寺量子位 | 公众号 QbitAI对于ChatGPT的工作原理，一个常见的解释是根据统计学规律预测下一个词。但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论：若是如此，所需的信息量足以让整个宇宙都坍塌成黑洞。这一数据量是50000^8000，根据贝肯斯坦上限(Bekenstein bound)原理，如果把这些信息分配到空间当中，所需要的信息密度已经远超宇宙能承受的最大值。而这仅仅是把数据存储起来的消耗，更不必说还要进行运算了。而ChatGPT与单纯统计预测的区别，可以做这样的类比：如果天文学家通过历史观测记录推算出月食的周期，这可以算是统计学。但当他们总结出牛顿万有引力定律的时候，就已经超越了统计学。什么是“随机鹦鹉”一个流传很广的说法，所谓大语言模型实际上相当于一个“随机鹦鹉”——与我们观察其输出时的情况相反，语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起，根据概率生成文本，但不清楚文字背后的任何含义，就像一个随机的鹦鹉。出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big这对过去的语言模型，或许确实成立。比如曾经流行的n-gram算法。比如当我们在搜索引擎中进行搜索时，出现的联想词就能用此方法实现。具体来说，下面的三行文本中，第一行纯粹是随机生成，第二行考虑了单词在英语中整体的出现概率，第三行则考虑了单词在前一个词后面出现的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…不难看出，随着n值的升高，文本越来越接近人类语言。而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念，就能生成像模像样的句子。据此有人猜想，GPT-4会不会也只是一种高级的n-gram呢？Bayless提出，GPT必须学会抽象才能有如今的效果，至少GPT-4肯定如此。GPT-4不只是“随机鹦鹉”要证明这一点，可以先看下棋机器人的例子。如果有一种下棋机器人，存储了巨量棋谱数据，对于每个棋局都能推荐下一步。那它就能通过“背谱法”模仿其他任何棋手或程序的下法比如Stockfish是最先进的国际象棋程序，如果仅通过对战而不看源码，是无法确定Stockfish是否在背谱。但实际上，包含所有情形和步骤的棋谱数据量可能超过2^154。而Stockfish的程序只占用了不到50MB的空间，根本不可能存下需要的所有棋谱。所以Stockfish肯定是通过更高级的方法来实现下棋的。人类语言的复杂度远超过棋类游戏，因此GPT的数据量更是同理。仅在是上一代的GPT-3的token字典中就有超过5万token。如果对每个词都逐一建立统计信息，n-gram模型中n值将高达8000。届时，需要存储的情景数量将达到50000^8000。正如文章开头所提到，这简直是天文数字，足以让整个宇宙坍缩。因此，GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。“随机鹦鹉”达不到的高度仅在理论上进行说明是不充分的，因此研究人员还进行了两个实验，意图证明大模型在学习过程中已经抽象出了算法。第一个实验关于一道经典的农夫过河问题。一个农夫有一条船，和狼、羊、菜，农夫要把这3样东西运到河到另一边，农夫每次最多只能通过这个船运一样东西，要防止狼吃羊、羊吃白菜（即不能在没有农夫在的情况下同时在同一岸边），该怎么过？研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。狼、羊和菜则分别换成火星人、金星人和月球人。替换的目的是因为互联网上不太可能出现类似语料，可以判断大语言模型是不是真的掌握了通用方法。如果GPT不是“随机鹦鹉”，那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。GPT-4针对替换后的问题给出了正确的回答，GPT-3.5则没有。但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。回答中使用的句子，也无法在互联网中被检索到。这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。第二个实验则是数字排序。如果让GPT学习数字排序，它们究竟是只会记住给出过的数字顺序，还是真的研究出排序算法呢？其实只要从GPT的输出当中就可以看出来了。假如从1-100中随机选择10个数字，并将其顺序打乱，将一共有这么多种情形：如果再考虑数字的重复出现，又或者数字的数量发生变化，根本不可能存储如此之多的情形。因此，只要GPT能够针对未知的排序问题给出正确的回答，便可以说明它们是真的研究出了排序算法。研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT，专门让它做数字排序。结果显示，随着训练步数的增加，模型给出的数字顺序越来越完美。虽然在训练步数达到16万左右时突然出现了大量错误，但也很快得到了纠正。这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序，而是已经掌握了背后的方法。这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。更不必说GPT-4了。参考链接：https://jbconsulting...

智能设备 2023-05-27 16:02:19
首个企业净零排放标准正式发布联想集团参与科学碳目标组织（SBTi）标准论证

10月28日消息，科学碳目标倡议组织（SBTi）正式发布首个基于科学研究的企业净零排放标准。该标准的提出解决了目前围绕全球 “零排放” 目标不一致的问题，实现了对企业减排的统一测量和评估...

互联网 2021-10-29 14:30:35
论文论证谷歌FB免费产品如何损害消费者政府如获至宝

前数字广告行业高管蒂娜·斯里尼瓦桑(Dina Srinivasan)的研究工作推动了监管机构对谷歌和Facebook发起的反垄断诉讼。三年前，斯里尼瓦桑还是一位数字广告高管，对自己的工作感到厌倦，并为行业的黯淡前景感到担忧...

互联网 2020-12-23 17:11:07
瑞幸回应做空报告：论证有缺陷，坚决否认所有指控

2020年2月3日，瑞幸咖啡(Nasdaq:LK)今日对于在2020年1月31日公开的匿名做空报告进行回应，瑞幸称报告中包含的误导性和虚假指控，公司坚决否认报告中的所有指控。知名做空机构浑水（Muddy Waters Research）日前在Twitter发布了一份长达89页的瑞幸咖啡研究报告，称其“在2019年第三季度和2019年第四季度，每店每日商品数量分别夸大了至少69%和88%，有11260小时的门店流量视频支持”...

互联网 2020-02-03 22:02:05
中兴全力应对美国禁令：正进行翻译和论证工作

站搜网4月19日消息北京时间4月16日晚间，美国商务部宣布禁止美国企业向中兴公司出售零部件产品，期限为7年。此外，美国商务部工业和安全局还对中兴通讯处以3亿美元罚款...

业界动态 2018-04-19 15:07:09
证监会回应独角兽回A股上市：仍处论证阶段

（原标题：证监会回应独角兽回A股上市：进行了多方调查，仍处论证阶段）关于资本市场服务“四新”和独角兽企业的时间表，证监会新闻发言人高莉23日表示，3月20日李克强总理就此作出回应，证监会将创造积极条件让更多新经济、创新经济在中国上市，这是落实党中央国务院要求的具体措施，近期证监会对此进行了多方调查，也充分研究借鉴了国际经验，该项研究仍处于论证阶段，条件一旦成熟，证监会将积极落实贯彻此项工作。 ...

互联网 2018-03-23 19:32:11
“网络版银联”建设具体方案正在论证中央行

在互联网金融专项整治启动半年之际，包括中国人民银行在内的金融监管部门集中公开发布了相关归口领域的实施方案和答记者问。10月13日，中国人民银行官网发布《中国人民银行有关负责人就非银行支付机构风险专项整治工作答记者问》，集中回应了包括为什么要对客户备付金实行集中存管、为什么要建立非银行支付机构网络支付清算平台、无证经营支付业务行为专项整治将采取哪些工作措施等问题...

业界动态 2016-10-13 19:10:25
英国科学家实现理论证实隐身斗篷不是梦

站长搜索讯隐身能力是很多人梦寐以求的，然而目前依然没有很好的方法来实现完全的隐身，而且有科学家论证完美隐身只是传说。不过近日英国科学家在隐身斗篷的研究上取得了实质性进展，理论上已经可行...

趣科技 2016-07-18 20:30:46
格力披露收购新能源车企珠海银隆新方案并正论证员工持股计划

站长搜索讯（韩依民） 7月5日，格力电器发布公告，披露了收购珠海银隆新能源的详细方案，并称正在论证实施员工持股计划。根据公告，格力电器拟向珠海银隆新能源有限公司（简称“银隆新能源”）的全体股东发行股份收购其持有的银隆新能源合计100％股权，并计划向含员工持股计划在内的不超过10名特定投资者发行股份配套募集资金...

业界动态 2016-07-05 18:55:05
科学论证：玩暴力游戏有助于降低犯罪率

AS网站目录（www.adminso.com）：科学论证：玩暴力游戏有助于降低犯罪率有关游戏中暴力元素对玩家影响的争论不仅是在游戏业内、在社会范围内都是一个争论不休的话题。近日纽约州立大学布法罗分校的助教Matthew Grizzard发表了其最新的研究结果，Grizzard认为“游戏中的暴力元素会丰富玩家道德层面的感受性”，这一结果与许多社会学家所认为的“暴力有罪”可以说是背道而驰...

业界动态 2014-07-03 23:28:28

网站分类

热门文章

热点

标签列表

分享到:

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索