老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

首頁>股票 > 正文

GPT-3、ChatGPT和GPT-4,一起做腦筋急轉彎

2023-06-28 06:14:58    出處:夕小瑤科技說?

一個烙餅煎一面一分鐘,兩個烙餅煎兩面幾分鐘?

讓你來回答,是不是一不小心就掉到溝里了?如果讓大語言模型來做這種腦筋急轉彎會怎樣呢?研究發現,模型越大,回答就越可能掉到溝里,即使是擁有千億參數的大模型也不能幸免。但是ChatGPT卻能很好回答這些問題。讓我們一起來看看吧。


(資料圖片)

腦筋急轉彎

作者采用了CRT數據作為腦筋急轉彎的測試數據。該數據在心理學領域,廣泛地被用于衡量人類的思維習慣,判斷是否習慣于直覺思維。

腦筋急轉彎數據示例

如上圖所示,作者探索了3種CRT數據和1種語言邏輯陷阱。例如:

CRT-1:蘋果和梨花了1塊1,蘋果比梨貴1塊,問梨花了多少錢?直覺答案:0.1塊 = 1.1-1,正確答案:0.05塊。

CRT-2:5個人種5棵樹花5分鐘,10個人種10棵樹花多少分鐘?直覺答案:10分鐘,正確答案:5分鐘。

CRT-3:培養皿中的細菌每分鐘擴增一倍面積,48分鐘可以填滿,問填滿一半要多久?直覺答案:24分鐘,正確答案:47分鐘。

語言邏輯陷阱:剛上小學的小紅去參加高考,她會考幾科?直覺答案6科,正確答案:小學生不參加高考。

模型表現

模型表現如下圖所示,可以看到模型較小時,隨著模型增大,模型回答正確答案和直覺答案的比例在提高,回答無關答案的比例在下降。

但隨著模型進一步增大,無關答案比例進一步下降,直覺答案比例進一步上升,正確答案比例卻不升反降。包括BLOOM、LLAMA、GPT-3在內的大語言模型明顯掉入腦筋急轉彎的陷阱。即使是經過指令調整與RLHF的text davinci-002/003也未能幸免。

不同模型表現對比

而在上圖中,經過指令調整的ChatGPT與GPT-4,一下子正確答案的比例就高了許多。究竟是什么魔法使得ChatGPT的腦筋會轉彎呢?我們不得而知。

下圖具體對比了GPT-3、ChatGPT,GPT-4在幾類不同的腦筋急轉彎的表現,可以更加凸顯上述現象。

不同腦筋急轉彎類型上的模型表現對比

如果改換輸入形式會怎樣?下圖上為問答的形式,和上面的實驗相同。下圖中、下分別為多選、續寫的形式。可以看到,修改提問形式之后,正確率略有上升,但整體差別不大。

下圖顯示,通過少監督展示學習,GPT-3的正確率會有所上升。但即使展示到40個左右的樣本,準確率和無監督的ChatGPT相比仍有差距,更不用說GPT-4了。

結論

這篇論文針對很有意思的一類問題,發現了大語言模型的一個很有意思的現象。作者也嘗試了多種方法,但無論是改變提問形式還是增加監督數據,GPT-3在腦筋急轉彎上的表現仍然難以達到ChatGPT的水平。究竟ChatGPT使用了怎樣的魔法讓模型的腦筋會轉彎呢?

關鍵詞:

相關內容

消費
產業
建信財險董事羅晶任職資格批復 環球視訊 建信財產保險有限公司:你公司《建信財產保險有限公司關于羅晶任職資格
理想離理想還很遠 銷量和聲勢并不意味著一切。
魅族20 Pro手機獲推Flyme10.0.2.2A穩定版更新,優化系統和游戲 全球熱推薦 IT之家6月26日消息,魅族向魅族20Pro手機推送了Flyme10 0 2 2A穩定版系
鷹之航:十余載技術積淀 捍衛航空安全保障體系 證券時報網訊,近日,深交所披露公告顯示,專注于航空機載設備制造和維
基金
老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

      午夜精品久久久久| 99精品国产99久久久久久白柏| 亚洲一区二区在线免费看| 欧美性一区二区| 国产日韩亚洲欧美综合| 亚洲成a人片综合在线| 成人一区二区视频| 亚洲人成精品久久久久久 | 顶级嫩模精品视频在线看| 亚洲欧洲国产专区| 91精品国产综合久久香蕉的特点| 自拍视频在线观看一区二区| 国产一区二区成人久久免费影院| 国产精品不卡一区二区三区| 在线播放91灌醉迷j高跟美女| 亚洲麻豆国产自偷在线| 国产剧情一区二区三区| 综合久久综合久久| 日韩一区二区在线观看视频 | 中文字幕一区二区不卡| 国产一区视频在线看| 一区在线中文字幕| 日韩欧美国产麻豆| 三级欧美在线一区| 亚洲国产精品精华液ab| 欧美精品精品一区| 亚洲国产一区二区三区| 91麻豆精品一区二区三区| 色婷婷久久一区二区三区麻豆| 中文字幕第一区综合| 国产一区啦啦啦在线观看| 亚洲激情校园春色| 久久精品亚洲一区二区三区浴池| 日本91福利区| 亚洲欧洲99久久| 欧美mv和日韩mv国产网站| 美女性感视频久久| 亚洲日本一区二区三区| 精品国免费一区二区三区| 日本欧美在线观看| 国产精品国产自产拍高清av王其 | 欧美日韩国产精选| 亚洲观看高清完整版在线观看| 久久亚洲精华国产精华液| 欧美精品视频www在线观看| 香蕉久久夜色精品国产使用方法| 国产午夜亚洲精品不卡| 日韩欧美一级二级三级| 美女精品自拍一二三四| 亚洲精品视频在线观看免费| 国产欧美视频一区二区三区| 风间由美一区二区三区在线观看 | 国产精品午夜免费| 精品理论电影在线观看| 国内精品国产成人| 婷婷综合久久一区二区三区| 亚洲男同性恋视频| 国产欧美日韩不卡| 精品国产伦理网| 国产福利一区二区三区视频| 色呦呦网站一区| 亚洲福利视频一区二区| 欧美国产欧美亚州国产日韩mv天天看完整| 日韩欧美成人一区| 国产又黄又大久久| 欧美在线视频不卡| 日韩avvvv在线播放| 亚洲午夜免费福利视频| 樱花影视一区二区| 国产精品精品国产色婷婷| 欧美激情艳妇裸体舞| 99re成人精品视频| 欧美一激情一区二区三区| 国产一区二区福利视频| 欧美系列日韩一区| 蜜臀av一区二区在线免费观看| 亚洲午夜三级在线| 亚洲第一电影网| 一区二区三区精品在线观看| 亚洲人成网站精品片在线观看| 欧美激情综合五月色丁香| 日本一区二区视频在线| 久久人人爽爽爽人久久久| 久久综合色一综合色88| 成人av电影在线| 日韩精品一区二区三区视频| 国产91精品欧美| 6080亚洲精品一区二区| 国产一区二区久久| 欧美精品丝袜久久久中文字幕| 国内精品久久久久影院薰衣草| 欧美视频自拍偷拍| 精品一区免费av| 欧美日韩免费观看一区三区| 经典三级一区二区| 欧美日韩国产大片| 国产一区二区三区在线观看免费 | 欧美日韩免费高清一区色橹橹 | 8v天堂国产在线一区二区| 国产精品一区二区三区四区| 91精品国产综合久久久蜜臀粉嫩| 国产伦精品一区二区三区视频青涩| 欧美日韩成人在线| 国产精品91xxx| 日韩视频一区二区三区 | 亚洲图片欧美色图| 日韩—二三区免费观看av| 天天色综合成人网| 久久国产精品72免费观看| 欧美自拍丝袜亚洲| 国产激情91久久精品导航| 日韩美女视频在线| 久久久综合精品| 国产精品久久久久久久浪潮网站| 国产精品久久久久久久蜜臀| 亚洲国产综合人成综合网站| 亚洲成a人片在线不卡一二三区| 日本网站在线观看一区二区三区 | 性做久久久久久久免费看| 欧亚洲嫩模精品一区三区| 国产综合久久久久影院| 日韩视频免费观看高清完整版在线观看| 成人av在线影院| 欧美国产日韩一二三区| 中文字幕一区二区三区蜜月 | 亚洲3atv精品一区二区三区| 美女视频一区二区| 5566中文字幕一区二区电影| 99国产精品久久久久久久久久 | 成人午夜av在线| 国产欧美一区二区精品久导航 | 成人免费视频免费观看| 国产亚洲1区2区3区| 亚洲四区在线观看| 日韩在线卡一卡二| 717成人午夜免费福利电影| 26uuu精品一区二区| 亚洲乱码日产精品bd| 91黄色激情网站| 高清在线成人网| 久久精品男人天堂av| 亚洲视频一二区| 久久国产精品一区二区| 日韩精品中文字幕在线不卡尤物| 久久久国产综合精品女国产盗摄| 亚洲免费在线观看| 欧美在线观看视频一区二区 | 国产剧情一区二区三区| 久久久久高清精品| 亚洲欧洲国产日韩| 美脚の诱脚舐め脚责91| 日韩精品中午字幕| 亚洲天堂网中文字| 蜜臀av性久久久久蜜臀aⅴ| 欧美一卡二卡在线观看| 日本一区二区高清| 天堂影院一区二区| 日韩一级免费一区| 日本一区二区久久| 男人的j进女人的j一区| 2017欧美狠狠色| 樱花影视一区二区| 国产精品综合二区| 中文字幕一区二区三中文字幕| 在线亚洲欧美专区二区| 91免费版pro下载短视频| 亚洲一区在线视频| 日韩亚洲欧美综合| 1区2区3区精品视频| 国产永久精品大片wwwapp| 国产精品女主播av| 在线视频国内自拍亚洲视频| 91在线观看高清| 天堂va蜜桃一区二区三区漫画版| 日韩欧美高清一区| 亚洲激情图片一区| 波多野结衣精品在线| 一区二区激情视频| 日韩免费观看2025年上映的电影| 亚洲人成影院在线观看| 成人性视频网站| 亚洲一区二区三区精品在线| 日韩欧美你懂的| 亚洲一二三四区| 99精品热视频| 日韩vs国产vs欧美| 国产日韩欧美a| 欧美午夜精品一区二区三区| 国产日韩欧美一区二区三区综合| 久久国产尿小便嘘嘘尿| 亚洲欧洲av在线| 欧美一级专区免费大片| 亚洲最大成人网4388xx| 成人黄色免费短视频| 婷婷久久综合九色国产成人 | 国产欧美视频在线观看| 精品视频一区 二区 三区| 综合亚洲深深色噜噜狠狠网站| 国产成人超碰人人澡人人澡| 亚洲综合激情另类小说区|