鉴黄师要下岗了！日本学者用AI识别“隐晦小黄文”—

AI不仅可以在围棋盘上打败人类，还可以 ……智能识别小黄文。

5月23日到5月26日，在中国棋手们努力迎战阿尔法狗的同时，日本也举办了第31届全国人工智能大会。在这次大会上，立命馆大学情报理工学科的三名研究人员发布了一篇关于AI识别小黄文的论文。

论文的主要内容是，如何利用AI来识别那些“使用隐喻手法”来表现“少儿不宜”的文章。也就是说，即使作者只是在小说里遮遮掩掩地进行了某些暗示，也会被AI给揪出来。

研究人员为什么要做这种奇怪的研究我们不得而知，但使用的研究样本对同人文化、腐文化非常不友好，在日本国内也引发了激烈的争论。

论文截图

争论的原因之一是，这篇对全年龄段读者公开发表的论文，引用了网站分级为R18的小说内容，而且还没有提前取得网站和小说作者的同意。

论文使用了pixiv网站上，2016年十月R18分类下人气最高的10篇BL同人小说。论文将这些小说作为研究样本，在“小说里有不健康内容”的前提下，来说明“AI如何识别出通过隐喻手段表达的不健康内容”。

为了说明AI的识别方法，论文里引用了不少“少儿不宜”的内容。论文作者在引用前没有取得作者或pixiv网站的授权，还私自公布了小说的题目、作者和URL地址。

pixiv是一家日本同人插画和小说网站，对内容有严格的分级制度，它有一个中文名字“插画交流网站”（而且还支持新浪微博登陆）。pixiv上分类为R18的内容只有年龄设置在18岁以上的注册用户才能查看。

这篇论文公开发表后，所有年龄段的人都可以看到被引用的少儿不宜内容，也都可以通过论文中的URL地址找到被引用的R18小说。一些小说作者只能将被引用的小说删除或设成不公开状态。

论文中给出的小说作者和URL地址

除了会被小朋友看见，在未经网站和作者允许的情况下，使用这些小说作为研究对象在日本还存在版权问题。

被引用的小说在pixiv网站上只有注册用户能够查看，并且不对18岁以下用户公开。这样的内容是否可以被判定为“网络公开内容”加以引用和公开发表，在日本法律界还没有定论。

日本网友们的另一个争论点是，把这些有分级的小说划为不健康内容真的合适吗？

被引用的小说在pixiv网站已经被分级在R18类型下，未成年人不能阅读。研究中依然将这些小说归为“内容不健康文章”，还公布了小说作者和URL地址，一些日本网友认为这是对小说作者的诽谤，有违研究伦理。

这篇论文5月24日在大会上发表，5月25日，pixiv就公开表示：

我们已经要求发表论文者所在学校对这件事加以调查和解决，也希望大家以后能够继续安心使用P站。

机器的日文翻译大家随便看看就好

学校方面则表示正在着手调查这件事。这篇论文在此之前已经在日本人工智能学会的网站上发布，不过目前已经被隐藏。论文作者之一、立命馆大学助理教授山西良典在接受日本媒体采访时表示，论文确实存在一些问题，之后是否会继续发表还有待研究。

虽然这项利用AI判断隐晦小黄文的研究存在问题，但用AI来识别网络内容的研究方向实在让人不寒而栗。如果将来AI真的开始监督网上发布的内容，我们在网上说话的时候是不是要更小声了呢？

感到背后的寒意了吗？Big AI is watching you.