谷歌AI看不懂网友评论会错意高达30%

发表于 2年以前 | 总阅读数：1271 次

不过与流行文化之间有代沟这事，可不仅限于长辈们，还有 AI。这不，一位博主最近就 po 出了一篇分析Google数据集的文章，发现它对 Reddit 评论的情绪判别中，错误率竟高达 30%。

就比如这个例子：

我要向朋友怒表达对他的爱意。

Google数据集把它判断为“生气”。

还有下面这条评论：

你 TM 差点吓坏我了。

Google数据集将其判别为“困惑”。

网友直呼：你不懂我的梗。

人工智能秒变人工智障，这么离谱的错误它是怎么犯的？

断章取义它最“拿手”

这就得从他判别的方式入手了。Google数据集在给评论贴标签时，是把文字单拎出来判断的。我们可以看看下面这张图，Google数据集都把文字中的情绪错误地判断为愤怒。

不如我们由此来推测一下Google数据集判别错误的原因，就拿上面的例子来说，这四条评论中均有一些“脏话”。

Google数据集把这些“脏话”拿来作为判断的依据，但如果仔细读完整个评论，就会发现这个所谓的“依据”只是用来增强整个句子的语气，并没有实际的意义。

网友们的发表的评论往往都不是孤立存在的，它所跟的帖子、发布的平台等因素都可能导致整个语义发生变化。

比如单看这条评论：

his traps hide the fucking sun.

单单依靠这个很难判断其中的情绪元素。但如果知道他是来自一个肌肉网站的评论，或许就不难猜出了，（他只是想称赞一下这个人的肌肉）。

忽略评论的帖子本身，或者将其中某个情感色彩强烈的词语单拎出来判断其情绪元素都是不合理的。一个句子并不是孤立存在的，它有其特定的语境，其含义也会随着语境的变化而变化。

将评论放入完整的语境中去判断其情绪色彩，或许会大大提升判别的准确率。但造成 30% 这么高的失误率可不仅仅只是“断章取义”，其中还有更深层次的原因。

“我们的梗 AI 不懂”

除了语境会干扰数据集判别之外，文化背景也是一个非常重要的因素。

大到国家地区，小到网站社群都会有其内部专属的文化符号，这种文化符号圈层之外的人很难解读，这就造成了一个棘手的问题：若想更准确地判断某一社区评论的情绪，就得针对性地对其社区进行一些数据训练，深入了解整个社区的文化基因。

在 Reddit 网站上，网友评论指出“所有的评分者都是以英语为母语的印度人”。

这就导致会对一些很常见的习语、语气词及一些特定的“梗”造成误解。说了这么多，数据集判别失误率这么高的原因也就显而易见了。

但与此同时，提高 AI 判别情绪的精确度也有了清晰的方向。例如博主也在这篇文章中就给出了几条建议：

首先，在对评论贴标签时，得对他所处的文化背景有深刻地理解。以 Reddit 为例，要判断其评论的情绪色彩，要对美国的一些文化、政治理解透彻，并且还要能够迅速 get 到专属网站的“梗”；

其次，要测试标签对一些讽刺、习语、梗的判别是否正确，确保模型能够整整理解文本的意思；

最后，核查模型判断与我们真实判别，以做出反馈，更好地训练模型。

One More Thing

AI 大牛吴恩达曾发起过一项以数据为中心的人工智能运动。

将人工智能从业者的重点从模型 / 算法开发转移到他们用于训练模型的数据质量上。吴恩达曾说：

数据是人工智能的食物。

用于训练数据的好坏对于一个模型也至关重要，在新兴的以数据为中心的 AI 方法中，数据的一致性至关重要。为了获得正确的结果，需要固定模型或代码并迭代地提高数据质量。

……

最后，你觉得在提高语言 AI 判别情绪这件事上，还有什么方法呢？

欢迎在留言区讨论~

参考链接：

[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/
[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled
[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence

刘强东夫妇：“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而，京东官方通过微博发言人发布的消息澄清了这些传言，称这些言论纯属虚假信息和蓄意捏造。

发布于：1年以前 | 808次阅读 | 详细内容 »

博主曝三大运营商，将集体采购百万台华为Mate60系列

日前，据博主“@超能数码君老周”爆料，国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于：1年以前 | 770次阅读 | 详细内容 »

ASML CEO警告：出口管制不是可行做法，不要“逼迫中国大陆创新”

据报道，荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦（ASML）CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于：1年以前 | 756次阅读 | 详细内容 »

抖音中长视频App青桃更名抖音精选，字节再发力对抗B站

今年早些时候，抖音悄然上线了一款名为“青桃”的 App，Slogan 为“看见你的热爱”，根据应用介绍可知，“青桃”是一个属于年轻人的兴趣知识视频平台，由抖音官方出品的中长视频关联版本，整体风格有些类似B站。

发布于：1年以前 | 648次阅读 | 详细内容 »

威马CDO：中国每百户家庭仅17户有车

日前，威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”，同时，他发文表示：中国汽车普及率低于非洲国家尼日利亚，每百户家庭仅17户有车。意大利世界排名第一，每十户中九户有车。

发布于：1年以前 | 589次阅读 | 详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日，一项新的研究发现，维生素 C 和 E 等抗氧化剂会激活一种机制，刺激癌症肿瘤中新血管的生长，帮助它们生长和扩散。

发布于：1年以前 | 449次阅读 | 详细内容 »

苹果据称正引入3D打印技术，用以生产智能手表的钢质底盘

据媒体援引消息人士报道，苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后，3D系统一度大涨超10%，不过截至周三收盘，该股涨幅回落至2%以内。

发布于：1年以前 | 446次阅读 | 详细内容 »

千万级抖音网红秀才账号被封禁

9月2日，坐拥千万粉丝的网红主播“秀才”账号被封禁，在社交媒体平台上引发热议。平台相关负责人表示，“秀才”账号违反平台相关规定，已封禁。据知情人士透露，秀才近期被举报存在违法行为，这可能是他被封禁的部分原因。据悉，“秀才”年龄39岁，是安徽省亳州市蒙城县人，抖音网红，粉丝数量超1200万。他曾被称为“中老年...

发布于：1年以前 | 445次阅读 | 详细内容 »