显示更新内容
不二 转嘟

#论文导读 @mature
机器一旦幽默起来,可不是开玩笑的
hdsr.mitpress.mit.edu/pub/wi9y

这篇综述论文介绍了计算幽默学computational humor。虽然别的动物也有会笑,但是似乎幽默是一种人类特有的能力。至于人类为什么能欣赏和生产幽默,一般认为“不协调性”incongruity是幽默的元素,也就是说叙述的不协和矛盾点恰恰制造了笑料。其中比较广为接受的“不协调-解决”理论
incongruity-resolution(简称IR)把幽默简化成了两个部分:制造不协调(铺垫),再解决它(抖包袱)。这个模型给出了制造笑话的配方,适合机器来学习和生成笑话。文中举例的IR笑话胜“Two fish are in a tank. Says one to the other:“You man the guns, I’ll drive.””,这是个谐音梗,翻译过来大概是“两条鱼在鱼缸(tank坦克)里,一条说,你装炮我开车”,这个叙述乍看起来有矛盾,我们的大脑反应过来原来鱼在坦克而不是鱼缸里的时候,“解决”矛盾产生了快感,是为幽默。

计算幽默学目前主要有三个大用途,一是给笑匠们提供支持帮助,比如自动联想双关语,谐音梗,提供点子,翻译笑话,或者计算笑话的铺垫时长。二是对话机器人需要幽默感来让人类用户感到亲切,比起预先写好的罐头笑话(题外话,siri说的是你),如果能够自动生成笑话更容易被人类当作朋友。三是对于幽默机制的研究本身就需要大量的笑话语料,用来对比测试分析,如果能自动生成这些笑话就最好不过了。

好了,怎么生成笑话呢?九十年代开始的一众论文使用了“填空”的形式:给定一些笑话句式,机器通过近义词反义词来填空,比如铺垫是“什么东西既xx又yy”,包袱是“一个zz的ww”。后续有人让孩子给这些机器笑话打分,最高分的是这个“What's the difference between leaves and a car? One you brush and rake, the other you rush and
brake. ” 额,全是谐音梗,扣钱。

另一种“填空”式机器笑话是“类比”笑话,比如这个“我对咖啡和战争的喜好相同:冷”...近几年的新进展是用生成对抗网络(GAN),一边生成类比笑话,一边给自己打分,来进行训练,这个任务还是比较简单的。

还有一类机器笑话是“改词”,也就是把一句普通的话改一个词变得搞笑,其实就是通过相关性搜寻谐音梗,比如“我昨天不小心吞了墨水,I dyed(died) a bit inside”,这论文全是谐音梗,看得我脚趾头痒痒

现有的大型语言理解模型,比如GPT2,GPT3模型和BERT,让更多的机器笑话成为了可能。甚至可以生成整个standup台本。不过网上好笑的例子都是百里挑一挑出来的,大部分生成的文本可能并不一定有趣。问题在于,这些大模型实质上把词汇含义嵌入在某些空间里理解,而并没有对应具体的拼写,所以很难找寻如上面几个例子的谐音梗(dye-die,tank-tank),GPT2笑话大部分是以“怪”取胜,比如“鸡被卡车撞了之后说了什么?它说“哦我没事”。”GPT3稍微好了一些,可以生产很多自涉笑话(gwern.net/GPT-3#tom-swifties ) 近年的Transformer模型也提供了更多笑话来源,但是笑点也是奇怪。那么问题来了,怎么评判这些笑话好不好笑?

这就是计算幽默学的另一个课题:发现和评估幽默。虽然有很多模型能够区分正常语句和一句话笑话,但并不代表机器学会了辨别幽默性,比如机器看到”食人族“,“酒吧”这些词就直接判断成笑话,准确率也可以很高。更好的办法是从同样的语料库提取“正常”和”幽默“语句,有人用了TED Talk的视频制作了训练数据集。在这项任务上Transformer模型表现非常好,可以学到一些幽默感了。

最后,作者也指出了一个我一直如鲠在喉的问题——这个领域研究的大部分都是英文笑话,而且种类很有限(自反和谐音梗笑话让我想到微博上的“弱智吧”这个号)。我很好奇别的语言语境下能否生成好笑的笑话。相关论文我找到了台湾研究人员用ptt语料做的训练的幽默识别模型,没见到过中文笑话生成器。更深层的问题是,我觉得IR模型可能无法解释一些更隐晦的笑料,比如苏联笑话。单凭“读万卷书”训练来的模型所缺少的,可能恰恰是理解这些笑话所需要的生活经验

@nan 哈哈哈 拍!这次不知道❄️能存活多久。想实践下today at apple出的拍故宫课程!➡️b23.tv/RvYAxq

感谢微软把PPT带进元宇宙。(打工人震怒!:azukisan015:

@Chord 对于大部分人来讲,手机已经成为一个电子器官,是身体的一部分了。

@elephantasy 可以在这个网址看:instances.social/
(也欢迎来俺们的实例看看!

不二 转嘟

👀下面 

@Sonubia 你真的好好,还在为大家着想!想说就说吧,让自己舒服最重要!如果心里还是有负担,可以像我这条评论一样用cw功能来折叠,这样就不会打扰到大家啦 :azukisan025: 关心你的人也会自己展开来看!

不二 转嘟

@monob yess!也是最近添加的功能!嘿嘿 :ablobcatbongo:

yo!大家好吗!

本站刚刚上新了水族馆以及暹罗小猫两组表情包:

:Aquarium14: :Aquarium19: :Aquarium4: :Aquarium5: :Aquarium9: :Aquarium22:

:azukisan001: :azukisan010: :azukisan028: :azukisan032: :azukisan016: :azukisan025:

大家请尽情发发发吧!
@dealer 感谢赌站的无私奉献 :azukisan026:

显示更早内容

不二 的推荐:

雾海

雾海是一个开放且不限制讨论主题的非营利性中文社区,名字来源于德国浪漫主义画家 Friedrich 的画作《雾海上的旅人》。生活总是在雾海中吞吐不定,不管怎么艰辛,他还是站在了这里!希望大家在这里玩的开心~