prev next

贝博网页登录版.人工智能检测的猫捉老鼠游戏难分高下写作将进入人机协

发布时间:2024-04-04 07:03:38 来源:ballBET贝博BB艾弗森 作者:贝博艾弗森体育网页版
  • 咨询热线:0754-89933008
  • 产品详情

贝博网页登录版

  神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

  编者按:随着生成式人工智能的爆火,催生出各种应用。有人利用它来帮写作,判断家庭作业是否学生自己写的成为了老师头疼的问题。检测文字是否为人工智能生成的工具于是应运而生。但道高一尺魔高一丈,规避检测的工具也接踵而至。这就像一场猫捉老鼠的游戏,双方在互相对抗中不断升级。实践表明,没有误报和漏报的检测工具几乎是不可能的。可以预见的是,人工智能写作已无法阻止,未来写作将进入人机协作的半人马时代。文章来自编译。

  阿尔法一代(Gen Alpha) 正在迅速开发识别人工智能生成的文本的工具,以及逃避这种检测的工具,猫捉老鼠的游戏正在上演。

  Edward Tian不觉得自己是一位作者。作为普林斯顿大学计算机科学专业的学生,他修过几门新闻课程,从中学习了报道的基础知识,他开朗的性格与修补匠般的好奇心让他深受老师和同学的喜爱。但他形容自己那时候的写作风格“非常糟糕”——非常的公式化且十分的笨拙。一位新闻学教授说他擅长“模式识别”,这对制作新闻文案很有帮助。所以当Tian在大二那年获得了人数有限定的约翰·麦克菲(John McPhee)非小说类写作研讨会的邀请时,他感到很惊讶。

  每周,16 名学生都会聚集在一起,聆听这位传奇的《纽约客》作家剖析自己的创作技艺。麦克菲布置的练习迫使他们认真思考自己的遣词造句:描述校园里的一件现代艺术作品,或者删减葛底斯堡演说的长度。麦克菲用投影仪和幻灯片分享了自己手绘的图表,展示了他建构自己文章的不同方式:直线、三角形、螺旋形。Tian记得,麦克菲说他没法告诉学生该如何写作,但至少可以帮助他们找到自己的独特声音。

  如果说麦克菲唤起了Tian一种浪漫的语言观的话,那么计算机科学则为他提供了一个不同的视角:语言即统计。疫情期间,他曾在 BBC 工作过一年,并在开源新闻项目 Bellingcat 实习,在那里他编写了检测 Twitter 机器人的代码。大三时,他学习了机器学习与自然语言处理的课程。 2022 年秋,他开始撰写关于检测人工智能生成文本与人类书写文本之间差异的毕业论文。

  当 ChatGPT 在2022年 11 月首次亮相时,Tian 发现自己处在一个不同寻常的境地。尽管当时全世界在这个全新的、经过彻底改进的聊天机器人面前失去理智,但Tian 早已熟悉了底层的 GPT-3 技术机制。作为一名致力于根除虚假信息活动的记者,他知道人工智能生成的内容对这个行业的影响。

  回多伦多过寒假时,Tian 开始编写一个新程序:ChatGPT 检测器。他泡在自己最喜欢的咖啡馆里,喝着茶,然后在卧室里熬夜敲代码。他的想法很简单。这个软件会扫描文本,寻找两个因素:一是“困惑度”,也就是词语选择的随机性;二是“突发性”,也就是句子的复杂性或变化情况。人类写手这两个指标的评分往往高于人工智能写手,据此 Tian 能够猜测出文本是怎么写出来的。Tian把这个工具命名为“ GPTZero” ——“零”代表真理,回归到原点——今年 1 月 2 日晚,这款工具上线了。他在 Twitter 上发布了相关链接,并进行了简短介绍。他写道,工具的目标是打击“日益严重的人工智能抄袭行为。高中老师会希望学生用 ChatGPT 来写历史论文吗?也许不会。”然后他就睡觉去了。

  第二天早上,一觉醒来的Tian看到帖子有数百条转发和回复。托管服务器的流量也爆了,很多用户都没法访问。Tian说: “这实在太疯狂了。我的手机都要爆了。”一位朋友祝贺他在网上火了。 TikTok 上的年轻人称他为缉毒。 Tian笑着说:“刚开始很多的仇恨言论大概是,‘这孩子是个告密者,他的人生毁了,他会找不到女朋友的。都是老一套。” (田有个女朋友。)几天之内,世界各地的记者都找到他,他的名字最后出现在从 NPR 到《》乃至于 Anderson Cooper 360 的各种媒体上。一周之内,他的那条推文的浏览量就已超过了 700 万。

  ChatGPT 让整个行业陷入歇斯底里,导致人工智能生成的引言泛滥,但GPTZero的出现让媒体的叙事有了的视角。 (2019年的时候研究人员曾开发过一个针对 GPT-2 文本的检测器,但 Tian 的检测器是第一个针对 ChatGPT 的检测器。)教师们感谢 Tian 的工作,感谢他们终于可以证明自己对学生论文的猜疑是有道理的。人类是不是在机器人的接管当中找到了救世主呢?

  Tian的程序可以说是一记发令枪。现在,开发出权威的人工智能检测工具的竞赛已经开始。其想法是,在一个人工智能生成内容日益渗透的世界里,我们需要区分哪些内容是机器编造的,哪些是人造的。 GPTZero代表了一种希望,也就是这确实是可以分辨的,并且坚信这种差异很重要。在接受媒体采访时,微笑、真诚、身为典型优等生代表的Tian详细阐述了一个令人宽慰的观点,那就是不管生成式人工智能工具发展到多复杂的程度,我们总能揭开它们的面纱。Tian说,人类的写作有某种不可约的特质:“它有一种永远无法用数字表示的元素。”

  互联网的生活一直是检测者与造假者之间的战斗,双方都从这场冲突中获利。早期的垃圾邮件过滤器会筛选电子邮件中的关键字,阻止包含“免费!”或“超过 21 岁”等字眼的邮件,并最终学会了过滤掉不同的写作风格。垃圾邮件发送者的回应是,从旧书上摘录一些听起来像人话的片段,然后跟垃圾内容混在一起。 (这种被所谓的“ litspam ”本身就成了一种流派。)随着搜索引擎变得越来越流行,希望提高网页排名的创作者诉诸与“关键词填充”——也就是一遍又一遍地重复同一个词——从而占据优先位置。而搜索引擎则通过降低此类网站的排名来反击。在谷歌推出 PageRank 算法(该算法有利于拥有大量入站链接的网站)之后,垃圾邮件发送者则建立了一整个相互支持网页的生态体系。

  到了世纪之交,验证码工具出现了,它可以基于人类具有解读扭曲文本图像的能力将人类与机器人区分开来。一旦部分机器人能够处理这个问题之后,验证码就会增加其他的检测方法,包括解析摩托车与火车的图像,以及感应鼠标移动模式与其他用户行为等。 (最近GPT-4 的早期版本在一次测试中已经展现了一定的能力,它跑到Taskrabbit上雇了一个人来替它完成验证码任务。)甚至一家公司的命运都要取决于找出假冒的:埃隆·马斯克当初为了反悔收购 Twitter 的交易,就借用了机器人检测工具来支持他的观点,即 Twitter 没有如实陈述其网站上的机器人数量。

  生成式人工智能再次让这方面的赌注加大。虽然大语言模型与文本生成图像工具在过去十年一直在稳步发展,但由于ChatGPT 与 Dall-E 等消费者友好型工具,2022年出现爆发式的增长。悲观主义者认为,我们很快就会被淹没在合成媒体的海啸里。《纽约时报》科技专栏作家凯文·罗斯(Kevin Roose)去年警告说: “几年后,我们在互联网上看到的绝大多数照片、视频与文字都可能是人工智能生成的”。随着我们努力过滤掉生成出来的噪音, 《大西洋月刊》想象着“文字末日”的迫在眉睫。竞选活动正在利用人工智能工具来制作广告,亚马逊上充斥着 ChatGPT 撰写的书籍(其中很多是关于人工智能的)。翻看产品评论已经给人以在做着全世界最烦人的图灵测试的感觉。下一步往哪儿走似乎已经很明确:如果你觉得尼日利亚王子的电子邮件很糟,等你看到尼日利亚王子的聊天机器人再说吧。

  Tian发布GPTZero后不久,一波类似的产品就如雨后春笋冒头。 今年1月,OpenAI推出了自己的检测工具,4月,反抄袭巨头 Turnitin推出了一个分类器。大家的基本方法都差不多,但每个模型训练所用的数据集有所不同。 (比方说,Turnitin 聚焦于学生写作。)所以,精度方面差别很大,最低的OpenAI 声称检测人工智能书写文本的准确度为 26%,而最乐观的Winston AI声称达 99.6%。为了在竞争中保持领先地位,Tian 必须不断改进GPTZero ,推出下一款产品,同时修完自己的大学学业。

  Tian马上聘请自己的高中好友 Alex Cui 担任首席技术官,并在接下来的几周内从普林斯顿大学及加拿大引进了一些程序员。然后,在春天,他招募了三位来自乌干达的程序员,他们是四年前他在一家在非洲培训工程师的初创公司工作时认识的。 (Tian 是一名全球公民,在东京出生,在北京生活到 4 岁,后来随身为中国工程师的父母举家搬到加拿大安大略省。)团队一起开始开发出下一个app:一个可以扫描文本并确定是否是人工智能生成的Chrome 网页插件。

  GPTZero的另一个威胁是GPTZero 自己。几乎在这个工具推出后不久,社交媒体上对它表示怀疑的人就开始发布这个工具把文本归类错的尴尬例子。有人指出,它把美国宪法的部分内容标记成可能是人工智能编写的。当学生把自己被GPTZero错误地“指控”成作弊的故事发到 Reddit 上面时,嘲讽变成了愤怒。有一次,一名被错误指控的学生家长联系了马里兰大学计算机科学教授 Soheil Feizi。 Feizi 说:“他们真的很愤怒”。去年秋天,在GPTZero首次亮相之前,Feizi以及其他几位同事正在开始做一个关于人工智能探测器问题的研究项目,他怀疑这种工具可能不可靠。现在, GPTZero及其模仿者让他认为这些工具弊大于利。

  Tian还有一个头大的事情,有很多狡猾的学生在想方设法绕过探测器。 Twitter 上有个人给用户支招,让他们在 ChatGPT 生成文本的每个“e”之前插入一个零宽度空格。 有个TikTok 用户写了一个程序,通过用类似的西里尔字母替换某些英文字母来绕过检测。其他人则开始利用流行的释义工具QuillBot来跑一边自己的人工智能文本。Tian后来修补了这些漏洞,但解决方法层出不穷。迟早会有人会开发出一款竞争产品——反探测器的。

  今年3月初,斯坦福大学新生约瑟夫·塞姆莱(Joseph Semrai)跟几位朋友正在文图拉(Ventura)沿着太平洋海岸高速公路开车前往洛杉矶的路上,然后突然被锁在了 Zipcar 的车门外。他们步行到附近的一家星巴克,等待路边援助。但鉴于等待时间持续了几个小时,塞姆莱跟一位朋友琢磨着该怎么弥补失去的时间。塞姆莱下周要交一篇新生写作课的论文。这是他最不喜欢的那种作业:写一篇旨在展示逻辑推理的格式文章。塞姆莱说: “这其实差不多是个算法化的过程”。

  ChatGPT 是显而易见的解决方案。不过在当时,ChatGPT顶多只能吐出几个段落,因此生成一篇完整论文得是一个多步骤的过程。 塞姆莱想开发一款一次性就能写完论文的工具。他还知道有可能被GPTZero检测出来。在朋友的鼓励下, 塞姆莱拿出笔记本电脑,写了一个脚本,让它根据提示写出一篇文章,然后再用GPTZero来检测这篇文章,接着不断调整措辞,直到GPTZero再也检测不出是人工智能写的——本质上是用GPTZero来对抗自己。

  几天后, 塞姆莱在Friends and Family Demo Day(针对斯坦福大学本科生社区的一种演示讲解活动)上演示了他的程序。站在一屋子的同学面前,他让观众推荐一个论文主题——有人建议加州的“高档餐饮”——于是他将主题输入到提示框中。几秒钟后,程序吐出了一篇有八个段落的文章,虽然缺乏原创性,但条理清晰,还提供了引文。 塞姆莱笑着说:“我可没说我会提交这篇论文啊。但不管怎么说,呃我不知道,反正挺省时间的。”他把这个工具命名为WorkNinja ,并在两个月后上架到应用商店。在 Z 世代网红 David Dobrik 的促销活动以及给注册用户赠送 10 辆特斯拉的帮助。

0754-836308890754-83630889
公司邮箱info@rhlcd.com
在线咨询在线咨询