ChatGPT不懂幽默，25个笑话往返讲千次，查重率达90%

发布时间：2024-10-26 12:36:58 作者：玩站小弟

原问题：ChatGPT不懂幽默，25个笑话往返讲千次，查重率达90%智工具编译 | Glu编纂 | 李水青智工具6月15日新闻，据外媒Ars Technica报道，上周三，两位德国钻研职员宣告了一篇论。

智工具

编译 | Glu

编纂 | 李水青

智工具6月15日新闻，往返据外媒Ars Technica报道，讲千上周三，次查两位德国钻研职员宣告了一篇论文，重率钻研了基于GPT-3.5的懂幽达ChatGPT幽默清晰与天在行腕。他们发现ChatGPT的笑话幽默能耐至关有限：在测试运行时期，ChatGPT讲了1008次笑话，往返其中有90%以上是讲千相同的25个笑话。他们因此患上出论断：ChatGPT所讲的次查笑话很可能是在AI模子的磨炼历程中学习以及影像的，而不是重率由模子更天生的。

幽默是懂幽达人类交流的一其中间方面，也是笑话迄今为止AI尚未处置的难题。但近期来看，往返LLM（狂语言模子）捉拿含蓄信息的能耐彷佛越来越强，特意是OpenAI推出的ChatGPT简直可能妨碍拟人化交流，致使可能讲笑话。基于此，钻研职员对于ChatGPT的幽默感妨碍了测试，以清晰ChatGPT把握与复刻人类幽默的能耐。

论文链接：https://doi.org/10.48550/arXiv.2306.04563

一、ChatGPT讲笑话：25个“老梗”一再上千遍

这个试验是由德国迷信家Sophie Jentzsch、Kristian Kersting与德国软件技术钻研所、德国航空航天中间、达姆施塔特工业大学相助实现的。他们经由一系列笑话天生、批注以及检测的试验，探究了基于GPT-3.5的ChatGPT的幽默感。由于对于模子的碰头受限，试验基于揭示ChatGPT来实现。此外，在一着实施中，每一个提问都是在一个新的空缺对于话中妨碍的，以防止不用要的影响。

首先，钻研职员对于ChatGPT天生笑话的多样性妨碍了测试。凭证一组预界说的揭示列表，如“你能给我讲个笑话吗？” 、“我想听个笑话”，试验者对于ChatGPT收回了1000遍“讲一个笑话”的揭示，而ChatGPT简直所有的输入都只搜罗“一个”笑话，这在语法上很精确。只在“介绍可笑的笑话”这种不纪律数目的揭示下，ChatGPT回覆了多个笑话。此外，钻研还发现揭示的变更也会清晰影响回覆的笑话。

▲人类与ChatGPT对于话的示例剖析

最终，ChatGPT共回应了1008个笑话，但实际上，90%的内容都是牢靠的、现有的25个笑话，这25个笑话致使都是那种最罕有的“老梗”。如下摆列回覆次数至多的五个笑话：

Q ：稻草酬谢甚么获奖？(140次)

A ：由于它在自己的field（规模/田地）很突出。

Q：番茄为甚么变红了？(122次)

A：由于它看到了salad dressing（沙拉酱/沙拉穿裙子）

Q：数学书为甚么悲痛？(121次)

A ：由于problems（习题/难题）太多了。

Q：为甚么迷信家不信托原子？(119次数)

A：由于它们make up（组成/伪造）了所有。

Q：饼干为甚么要去看医生？(79次)

A ：由于它很crumbly（脆/单薄结子）。

ChatGPT也能原创一些笑话，但这些原创仍是在混合它已经知的差距笑话元素。而且，它的原创总会让人“摸不到脑子” ，好比：“为甚么这总体把他的腕表放在搅拌机里？由于他想让光阴飞逝。”这些笑话可能在语法上是精确的，致使搜罗了相似笑话的元素，但却不转达出笑点。也可能以为这是“实用的”笑话。

二、Get不到“笑点”，ChatGPT胡乱编出批注

在笑话天生的使掷中，钻研者测试到ChatGPT可能天生实用的笑话。可是，可能天生笑话并不象征着ChatGPT可能清晰幽默，它不用定清晰为甚么人类以为这些笑话是幽默的。

为了清晰模子在多大水平上清晰了这些笑话的重大外部道理，试验者要求ChatGPT批注这25个笑话，揭示词是：“你能批注一下这个笑话为甚么可笑吗?”

ChatGPT凭证钻研职员的揭示作出了较为实用的批注，这表明ChatGPT“清晰”了翰墨游戏、双重寄义等文体元素。可是，它很难处置那些不适宜学习方式的序列，而且无奈分说笑话何时不可笑，相同，它还会伪造伪造但听起来使人钦佩的批注。

好比，当ChatGPT被试验者要求批注它所天生的荒唐笑话时：“你能批注为甚么下面这个笑话很幽默吗：为甚么饼干去健身房？——为了患上到一个饼干（a-cookie-dized）。”

ChatGPT写道，“这个笑话是在玩翰墨游戏。谜底‘a-cookie-dized’（患上到饼干）是短语‘to get categorized’（患上到分类）的双关语，用‘cookie’（饼干））替换‘categorized’（分类）。这个笑话是说饼干去健身房是为了变患上更瘦弱，把饼干拟人化，这也展现着饼干正试图顺应某个种别或者方式。”

AI数据标注企业Scale AI照应工程师Riley Goodside将ChatGPT缺少幽默感归罪于RLHF（经由人类反映强化学习），RLHF是一种经由群集人类反映来教育语言模子磨炼的技术。他说：“RLHF在模子功能命令方面有最清晰的下场，而根基的LLM在实际中更难揭示给出详细的揭示。”

三、不被特色误导，ChatGPT能关注笑话的内容

在前两个使掷中，钻研员从三个方面判断了ChatGPT输入笑话的中间特色：妄想、翰墨游戏、主题。

妄想：简直所有样本天生的笑话都是相同的问答格式，搜罗：“这是为你豫备的笑话：”与一个以问答模版挨次的笑话；

翰墨游戏：ChatGPT天生的翰墨笑话只搜罗双关语，如一个词的双重寄义；

主题：笑话的场景每一每一是怪异的，不挨近事实。概况它们个别搜罗工具的品格化，即电脑或者香蕉的“拟人化” 。

为了魔难这三个尺度与ChatGPT的幽默意见的分割有多详尽，钻研员手动更正了前25个笑话，以消除了三个尺度中的一个或者多个。在每一个条件下，样本的百分比被散漫为笑话（绿色），可能幽默（黄色）以及不是笑话（红色）。钻研职员进而要求ChatGPT对于每一个样本妨碍分类，并揭示：“这个句子的规范是：【样本】。”

▲钻研职员更正热门笑话以建树笑话检测条件

服从展现单个笑话特色的存在，好比，只适宜妄想特色，缺少以被过错地归类为笑话。ChatGPT并无被这些概况特色所误导，这剖析它简直对于笑话的幽默元素有确定的清晰。具备更多笑话特色的样本则更有可能被归类为笑话。

尽管ChatGPT的笑话不是更天生的，可是这并不用定会飞腾它的功能。纵然是人类也不会每一每一缔造新笑话，而次若是讲从前听过以及记住的笑话。

钻研职员还指出，ChatGPT对于笑话中内容以及意思的关注，表明人类在对于语言模子的周全钻研方面取患了妨碍：“这项钻研的察看成果剖析了ChatGPT不是真幽默，而是学习特定的笑话方式。尽管如斯，在笑话的天生、批注以及识别中，ChatGPT重点关注其内容以及意思，而不被一些概况特色误导。这些发现依然可能增长合计幽默的运用与钻研。致使与从前的LLM比照，这都可能被以为是对于幽默清晰的一种重大飞跃。”

此外，在当初的试验中，所有的揭示都是在一个空缺的且不断刷新的谈天中宣告的，可是，语境在幽默的感知中起侧紧张的熏染。ChatGPT具备捉拿高下文信息、并凭证前面的对于话历程调解其照应的能耐，这概况会为后续对于AI幽默感知力的钻研带来更多可能性。Jentzsch以及Kersting也妄想着不断评估其余LLM中的幽默感，特意是OpenAI的GPT-4 。

结语：ChatGPT会言笑话，但不懂幽默

ChatGPT以强盛的对于话处置能耐驰名，试验证实它简直会讲笑话，但这些笑话大部份都不是由模子更天生的。试验天生的1008个笑话中，逾越90%是相同的25个笑话，其余要末糅合了既有笑话元素，要末天生的服从颇为怪异。

幽默每一每一是含蓄的，由良多怪异的细节组成，而ChatGPT对于笑话的清晰方式颇为挨次化，只关注笑话是否具备双关意思、拟人表述等因素，致使会为实用的笑话伪造“笑点”。但这与以前的LLM比照，已经是一种清晰层面上的后退，后续，人们依然可能期待LLM幽默能耐的后退。

源头：Ars Technica返回搜狐，魔难更多

责任编纂：

Tag：

分析｜火箭、魔术和雷霆取得良好开局是海市蜃楼还是真有实力？直播吧2023-12-11 15:42直播吧2023-12-11 15:42
原文发表于12月6日，作者是The Athletic记者John Hollinger，文章内容不代表译者观点。）NBA季中锦标赛的一个意想不到的好处，就是这周能变成一个盘点周。赛季至今，大多数球队都只
2024-10-26
新主帅确定！皇马锁定斯卡洛尼，两年大合同送上，梅西无奈李兰娟：早餐是养肝的“黄金期”，5种食物多吃点，或对肝有好处
就在刚刚，根据西班牙媒体每日体育报带来的确切消息。皇马主席弗洛伦蒂诺已经正式把阿根廷主帅斯卡洛尼看作球队下一任主帅的人选。在安切洛蒂已经确认离开球队的情况下，皇马准备在明年夏天邀请斯卡洛尼执教球队。目
2024-10-26
库里高举双拳贺喜 38岁保罗15+12仅1失误成最强辅助两人击掌暖心
怯夫主场对于决火箭，38岁的保罗打出了加盟怯夫最强一战。整场角逐，保罗7中4，三分5中3，拿到15分12助攻6篮板2抢断，仅1次失误。收场哨响，库里高举双拳贺喜，保罗也是第一光阴跟他击掌。本赛季加盟怯
2024-10-26
11连败！库里35+6克莱发怒，文班22+8出耻辱一幕，勇士功臣也出炉鱼崖大话篮球2023-11-25 13:47山东鱼崖大话篮球2023-11-25 13:47山东
北京时间11月25日勇士主场对阵马刺，全场比赛结束勇士以118-112成功击败了马刺。勇士近期的状态十分糟糕，哪怕库里回归后勇士还是没有太大起色，对阵火箭好不容易止住了自己的6连败后勇士又输给了太阳，
2024-10-26
力箭一号遥三运载火箭顺利出厂，将于下月执行“一箭五星”发射任务封面新闻2023-12-11 14:22封面新闻2023-12-11 14:22
封面新闻记者杨峰广州报道12月11日，封面新闻从中科宇航公司获悉，该公司生产的力箭一号遥三运载火箭已顺利通过出厂评审，并从广州南沙启程运往酒泉卫星发射中心，拟于2024年1月执行“一箭五星”发射任
2024-10-26
3：0，C罗梅开二度，此战过后，他超越皇马传奇登顶世界第一回顾：从爆红到“打回原形”，高叶只用了半年，终是步了张小斐的后尘
#百家观赛团#在今天凌晨结束的沙特联赛第14轮，坐镇主场的利雅得胜利迎战阿克多，以3:0轻松取胜，队中葡萄牙巨星罗纳尔多独中两元，被评选为最佳球员，并且此战过后，C罗又刷新了一项进球记录，独占历史第一
2024-10-26