G.O.S.S.I.P 特别报道——问渠哪得清如许
2024-12-11 20:18:0 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

一、CCS风云——审稿中的道德危机

国际知名的计算机安全研究学术会议——ACM CCS一贯以各种高水平的安全研究成果,特别是各种高危安全漏洞的技术分享而引人关注。可在2024年的ACM CCS会议上,最吸引参会者眼球的,却是一页名为“Review Ethics Crisis”的幻灯片(见上图):这一页上包含的信息量可不小,它曝光的“安全漏洞”竟然直指安全研究社区自身,引发了参会者的高度关注。一时间,不论是安全研究人员还是网络上的吃瓜群众纷纷参与到讨论中来,这一话题引发的热议遍及中文和英文网络,大家不禁要问,这背后究竟发生了什么样的故事?

二、暗流涌动

事实上,科学研究社区绝非一方净土,学术造假、学术作弊等种种不端行为从未消失。远的不说,就拿这几年声称发现“首个室温超导体”的美国罗切斯特大学物理学家Ranga Dias作为例子,他在学术生涯中多次欺诈,包括曾发表在Nature上的2篇室温超导研究都存在造假,直到今年4月终于被彻查,并在11月被学校解雇。不过,回到CCS的讨论上,这次的道德危机可能比单纯的学术造假更令人震惊,因为它涉及的不仅仅是学术论文的创作者,还牵扯到了同行评议(peer review)的参与者

要想弄清楚到底发生了什么,我们首先要详细解释一下当前主流的计算机学术会议(特别是计算机安全研究学术会议)的审稿流程和机制。一般来说,学术会议会组织一个程序委员会(program committee,PC),有1-2名chair负责管理,其余成员负责审稿(关于学术会议的组织者的角色的职责,大家可以参考 https://xxmy7.github.io/blog/2023/11/05/conference-chair/ 这篇博客文章)。整个审稿流程会按照下面的步骤进行:

  1. 投稿:这个阶段是大家最熟悉的,即在规定的deadline之前把论文投稿到在线系统(例如hotcrp或者easychair),并且要遵循会议的要求,例如要求论文中不得出现任何透露作者身份的信息等。

  2. 初步筛选:在进行审稿之前,学术会议的组织者会先检查投稿论文的格式,如果不符合要求,会给论文一个desk rejection的处理,也就是立即拒稿,不要浪费审稿人时间。

  3. 论文挑选(bidding):在投稿的deadline结束后,每个审稿人能够看到所有的投稿论文的基本信息(标题、摘要,大部分情况下也允许查看论文的PDF全文),然后给每篇论文标记一个自己的喜好分数(Review preferences),分数越高表明自己越想要审稿这篇论文,分数越低(可以为负数)则说明不想审稿这篇论文。

  4. 论文分发:会议组织者按照bidding的情况,将论文分发给不同的审稿人。一般情况下(参考最近几年的学术会议),每篇论文最初会有2个审稿人负责。

  5. 第一轮审稿:在完成论文分发后,每篇论文的2个审稿人会各自进行审稿,在提交审稿意见之前,审稿人之间互相看不到对方的信息和审稿意见;在提交审稿意见以后,这些信息就变成可见,方便审稿人互相讨论。

  6. 提前拒稿(Early reject):在第一轮审稿结束后,程序委员会chair一般会把那些审稿意见都是负面的(reject或者weak reject)的论文标记为early reject,不再进入后续的流程;而剩余的论文(至少有一个审稿人给出正面的审稿分数)进入到第二轮审稿。

  7. 第二轮审稿:在这一轮审稿中,每篇论文除了原来的2名审稿人,会再分配2-3名审稿人,这些新分配的审稿人同样在提交审稿意见之前看不到其他任何信息。

  8. 论文讨论和作者反馈(Rebuttal):在所有的审稿人都提交了审稿意见之后(当然有时也会有一些不太负责的审稿人会迟交或者不交审稿意见),程序委员会chair会组织每篇论文的几个审稿人进行讨论,特别是审稿人意见有分歧的时候(比如部分人觉得论文应该接收,部分人却觉得应该拒掉),大家会讨论出一个共同的意见(其实就是互相说服);在疫情前,这种讨论通常是线下的,叫做PC meeting,而COVID-19的出现导致目前绝大部分讨论都是线上进行;此外,有些学术会议会给作者一个反馈的机会,也就是我们常说的rebuttal环节,让作者先看看审稿人的review意见(但是看不到审稿人内部的讨论信息),然后写一个500-700 word的反馈信息,看看审稿人是否会回心转意。

  9. 最终决定:到了这个阶段基本上就是离学术会议的通知(notification)日期还有1-2天了,程序委员会chair会把所有的论文都做个标记,除了录用或者拒稿之外,往年的会议会有一个conditionally accept选项,就是审稿人觉得论文还差口气,但是只需要小修小补就好了,那么会有一个审稿人作为监督者(shepherd)来负责让作者修订;近年来很多会议引入了期刊才有的“修订模式”(revision),也就是允许作者对论文进行比较大的改动,然后再交给全体审稿人(或者还是只有一个审稿人作为shepherd)进行审阅,如果大家觉得这个修订版本合格了,就给予录用,如果修订了也没法挽救论文的质量,那就还是采取拒稿的决定。

也许只有投稿过的同学(或者你本人做过审稿人)才能很好理解上面的流程,不过我们都是搞安全研究的,很容易抓到上面流程中的许多weakness,实际上,在CCS会议上讨论的学术不端中,最引人关注的是所谓的“collusion ring”,这是一个什么样的问题呢?

我们注意到标准审稿流程中的第三步(也就是常说的bidding),这里面的安全假设是审稿人和投稿者之间互相没有办法了解到彼此的信息。但是现实中哪有这么理想,程序委员会的所有成员信息都在会议网站上公开,那么投稿的人完全可以去打听到底自己的论文是否被某个审稿人相中。更为现实一点,是不是投稿的人完全可以去请某些审稿人帮忙挑选自己的论文来审稿呢?完全可以!如果投稿的人和审稿的人关系很好,又没有什么道德危机感,那审稿人自然可以提前从投稿人那儿获得投稿的论文的ID、标题和摘要等信息,然后帮忙去挑选,最后在审稿的时候打高分。

那你可能会问,为什么审稿人要做这种事情呢?好问题,这就回到了我们前面所说的collusion ring上面——成年人的世界里面讲的是利益交换,也需要“人人为我,我为人人”,投稿人请审稿人帮忙,大概率是存在利益输送的,除了我们容易想到的送礼送钱,更为可怕的情况是投稿人和审稿人形成了利益集团,特别是投稿人本身也是审稿人(不一定是同一个会议)的情况下,双方可以互相“帮助”对方,给论文打上高分;而且,在近年来revision机制的加持下,这种“互帮互助”变得更为容易:在以前要说服所有审稿人都支持一篇论文的情况,现在只需要1位审稿人“力挺”论文,给它提供一个revision选项,然后摇身一变成为shepherd,最后就能把这篇论文给送到最后的录用阶段了。

三、公开信

2024年10月28日,就在ACM CCS结束后的第十天,普渡大学的李宁辉教授在网络上发表了题为《净化安全圈学术环境》的公开信,言辞犀利,直指当前安全研究社区中存在的严重问题。

一石激起千层浪,这封公开信特别点名了安全学术会议审稿中的review collusion问题,也引发了安全研究社区的激烈讨论,一时间众说纷纭,大家忍不住追问,安全研究学术会议特别是“四大安全顶会”的光环是否因为这些问题而黯然失色?有人会受到惩罚吗?怎样才能真正净化安全圈的学术环境呢?为了更好地回答这些问题,为了更深入地贯彻公平公正的学术评审,而不是掀起一场“来得快、去得也快”的舆论风波,我们非常有必要从各方面深入解读公开信内外的许多信息。

四、“公地悲剧”

李宁辉教授的公开信里面,着重提到了一个叫做“公地的悲剧”的概念。这是什么意思呢?“公地悲剧”理论模型是1968年由英国学者加勒特·哈丁(Garrett Hardin)在他的著作《The tragedy of the commons》中首先提出的,简单来说,就是指的公共资源的所有使用者,如果每个人都不加限制地对公共资源的滥用,就会发生严重的后果。举个例子,对于牧羊人来说,如果有一片草原是大家都可以免费去放羊的,而每个牧羊人都希望自己的收益最大化,那么在只考虑短期利益的情况下,牧羊人的决定就很可能是不顾草地的承受能力而不断增加羊群数量,尽管这有可能使草地过度放牧,最后竭泽而渔。而一旦一个牧羊人这样做,其他牧羊者不管情不情愿,都只能加入这一行列,否则不但短期利益无法最大化,最后还可能要为别人造成的后果(过度放牧导致草地恶化)买单。

“公地悲剧”之所以被称为悲剧,是因为每个当事人都知道资源将由于过度使用而枯竭,但每个人对阻止事态的继续恶化都感到无能为力。而且都抱着“及时捞一把”的心态,反而加剧了事态的恶化。回到大家关注的审稿道德危机事件上,为什么李宁辉教授也要把它比作一起“公地悲剧”呢?

近年来,我们注意到,学术界似乎有一点把发表论文(特别是在四大安全会议上发表论文)本身当成“数字游戏”的倾向,比如我们在去年圣诞节的文章《G.O.S.S.I.P 圣诞特别篇 2023-12-25 安全研究人员的天梯排行榜》中介绍的System Security Circus数据集对安全研究人员发表论文数量的排序。不管这些行为本身的动机是好是坏,它肯定潜移默化地助长了“唯论文数”的风气。

与此同时,学术会议(以及它的论文审稿机制)本是作为一种几乎免费的优良社会资源存在:许多已经成名的研究人员几乎是全义务地担负起对同行发表的研究工作的审查职责,遴选出优秀的成果;论文作者可以通过会议和后续出版更好地传播知识。可一旦有人把论文数目当成了唯一的目标,那学术会议就成了“练级打怪”的对象,不惜使用各种方法来提高自己的论文录用的机会,只要能速速通关,管它论文质量怎么样,反正最后大家关心的只是录用篇数这种简单粗暴的指标。短期来看,这类人很可能在短期受益,可长此以往下去,会议质量滑坡甚至声名扫地的可能性也不是没有。更可怕的是,如果遇到抱团作弊的情况,对整个研究社区的伤害就更大了,李宁辉教授在公开信中也直言不讳:

Review collusion对科研生态危害极大。最开始的几个人可能开始能从中得到利益,但做的人多了,整个Community受害。做这种事情的人是纯粹的用损人来达到利己的目的,而最终的结果可能是损别人,又害自己。大家可以了解一下公地的悲剧。小集团一旦形成,打压集团外的文章,只收集团内的文章。有些原本不愿参加的人觉得不参加不行。而大多数了解情况又不愿玷污自己人格和名声的人,就会抛弃这个会议。

可见,如果再没有人行动,也许安全研究社区就要“吾恐季孙之忧,不在颛臾,而在萧墙之内也”了,于是就有了公开信最开始提到的信息——“在CCS会议期间,ACM SIGSAC宣布成立SIGSAC PROTECT委员会 (https://www.sigsac.org/protect.html),以应对review collusion的危机。

五、来自ACM的声音

尽管SIGSAC PROTECT委员会目标直指当前潜藏的审稿作弊风波,但是学术舞弊从来就不是一个简单的问题。自SIGSAC PROTECT成立以来,也能听到不同的声音和问题。为了能够更好地了解SIGSAC PROTECT的使命,也为了进行更深入的交流,我们向李宁辉教授发起了采访的请求。李教授非常爽快地答应了我们的采访请求,通过远程视频会议跟我们进行了深入的讨论,也回答了许多我们提出的尖锐问题。我们把对李宁辉教授的采访内容进行了总结,希望通过这些内容,更好地回应大家对SIGSAC PROTECT的关注。


G.O.S.S.I.P:李教授在您的公开信里面公开呼吁安全研究社区关注和制止学术会议中的审稿危机,但是在这件事情上,似乎作弊容易,抓到坏人难,目前SIGSAC PROTECT采取了哪些举措?

李宁辉教授:如果只关注单次学术会议,只看少量的样本,也许确实不是那么容易就能发现有问题的审稿。但是只要是形成了“小团体”的集体舞弊行为,从数据分析的角度,是很容易发现这种异常情况,特别是如果他们多次舞弊,积累了大量的异常数据,更是几乎肯定能被发现。现在SIGSAC PROTECT不仅会关注ACM旗下的会议,更会积极和其他会议的组织者一起开展联合的数据分析,收集更多的信息,捕捉到潜藏的舞弊行为。

G.O.S.S.I.P:如果真的发现了舞弊行为,会对涉事者采取什么样的惩罚措施呢?

李宁辉教授:在证据确凿的情况下,ACM会采取严厉的惩罚措施,包括追溯并撤销过去所有有问题的论文,限制涉事者在此后一定的期限内(视情节轻重而定,从1年、2年到5年不等)不能投稿到ACM的所有出版物,同时也禁止涉事者参与ACM的学术活动(例如担任PC)。实际上ACM已经明确制定了Penalties for Publication Violations(可以参考 https://www.acm.org/publications/policies/penalties-for-publication-violations 网页信息),大家可以去看里面的细节。

G.O.S.S.I.P:有些声音质疑说SIGSAC PROTECT是否在针对国内这几年在四大安全会议上论文数量的迅猛上升趋势?

李宁辉教授:就我所知,国内有很多非常棒的研究团队,他们的研究工作在每年四大安全会议上也得到了高度的认可,完全不存在SIGSAC PROTECT特别针对某个国家或某一类群体(例如华裔研究人员)的情况,而且SIGSAC PROTECT本身也有国内研究人员的参与。更重要的一点在于,如果将监督当成是某种“歧视”或者“迫害”,可能反过来还会伤害到弱势群体的利益。

G.O.S.S.I.P:SIGSAC PROTECT是否会对安全会议的程序委员会组织工作进行干预?

李宁辉教授:SIGSAC PROTECT并不会直接干涉安全会议的组织工作,只会起到监督的作用。但是对于已经明确了存在舞弊行为的个人,SIGSAC PROTECT会通过和会议组织者进行沟通的方式,禁止其参与重要决策(例如担任area chair)。同时,从我个人的角度,我觉得当前各大安全会议的PC选拔工作确实是个挺麻烦的任务,很多时候PC chair也很辛苦,却不一定能够找到合适的人。有没有研究人员愿意去制作一个开源的数据集,维护全世界安全研究人员的研究特长,这样在会议的PC chair组织形成committee的时候,可以参考这个数据集,也算某种程度上帮助了程序委员会的组织工作。

G.O.S.S.I.P:近几年安全会议引入的revision机制是否助长了舞弊之风?

李宁辉教授:任何举措都有利有弊,实际上major revision的出现确实让有一些人钻了空子,但是这个更多是人的问题。反过来,在没有major revision之前,大家经常会遇到的情况是刚刚投完一个会议被拒稿,审稿人给了一大堆的建议,按照审稿人的意见修订后,在投稿下一个会议时却拿到了完全不同的审稿意见,大大浪费了整个社区的时间和资源。在启动了major revision机制之后,避免了很多无用功,因此不能否认这个机制的优点。


除了采访李宁辉教授之外,我们还邮件联系了ACM副主席,同样来自普渡大学的Elisa Bertino教授,请她谈谈ACM对审稿危机的看法。Elisa Bertino教授第一时间回复了我们,她首先表达了ACM对学术不端行为的高度关注,并且告诉我们,除了SIGSAC PROTECT,ACM前期也成立了一些学术道德监督相关的委员会(例如 COPE https://ethics.acm.org/about/ 和 the Ethics & Plagiarism Committee https://www.acm.org/publications/publications-board-committees 等),对各种学术活动进行严格的监督,一旦发现学术不端问题就会采取行动。同时,ACM也高度重视公平公正和多元化原则(https://www.acm.org/diversity-inclusion),绝对禁止在调查中特定针对某一国家、地区或族裔群体。

除了基本原则,Bertino教授也表示,ACM目前已经采取了很多相关措施,在不同领域(不仅仅是计算机安全研究方向)来打击学术舞弊行为,大家也都在积极寻找更好的手段来“抓坏人”。而且在制止学术不端这件事情上,ACM的努力绝非只是一朝一夕,而是持续不断地监督和收集证据,确保在证据确凿的情况下对那些干坏事的人进行惩罚。

六、正义是否会迟到

在对Elisa Bertino教授的采访中,她专门提到了一起发生在并不遥远的2019年的事件——涉及原佛罗里达大学电子和计算机工程系终身教授(已辞职)、前ACM会员(已被开除)、前IEEE Fellow(已被除名)李涛的学术不端事件。

这起在网上闹得沸沸扬扬的事件,却经过了长达两年的调查才最终有了定论(https://www.sigarch.org/wp-content/uploads/2021/02/JIC-Public-Announcement-Feb-8-2021.pdf)。Bertino教授告诉我们,在查看关于这起事件的调度报告时,她被整个调查过程的详细程度所震惊(“I read the final report about this case, and I was really impressed by how detailed and thorough the investigation was and the amount of evidence that was gathered.”)在很多人可能都快忘记了这件事的两年间,ACM聘请了专业的调查团队来参与调查,收集了大量的证据,最终才做出了处罚决定。

可见,作为围观群众,传播一些八卦肯定是容易的,但是要真正确保正义,既要抓到坏人,又要防止误伤,背后有大量的工作要做,我们的读者大部分身为学术研究人员,肯定知道这种严谨性需要的时间成本。所以,也许我们在短期内很难看到SIGSAC PROTECT有那种爽剧情节一样的操作,但是相信安全研究社区的努力一定会在长期收到成效。

七、To Review or Not to Review

从ACM CCS 2025开始,我们注意到审稿机制发生了一些改变(PC成员已经收到了正式邮件通知),包括启用一套新的自动化论文审稿分发系统,同时要求审稿人提交自己的代表性研究论文,从而帮助系统匹配论文和审稿人。这也和CCS 2024会议上的slide里面提到的改革措施对应上了:

在我们对李宁辉教授的采访中,同样也聊到了关于当前审稿机制的一些问题,其中特别提到了关于程序委员会的组织。李宁辉教授认为,其实当前的审稿流程并没有根本性的缺陷,重要的是如何确保不能被人利用。作为一名在安全领域工作多年的资深研究人员,李宁辉教授也表示,除了遴选合适的人选,是不是也可以适当引入一些限制,比如在承担了多届程序委员会审稿人后就不再继续任职,以及给每个投稿人设置在每次会议上的最大投稿数目等等。李宁辉教授这种鼓励更多的年轻人积极发挥作用,把机会留给新生代的想法,让我们深为感动。我们的讨论也许也可以化用丘吉尔的名言来总结:“当前的双盲审稿制度也许不是最好的,但是其他的论文选择机制可能更糟糕”。

八、问题背后的思考

除了关注审稿危机这一事件,我们也不禁要问,发生如此严重的问题,有什么更深层次的原因吗?通过和很多研究人员的沟通,我们也挖掘出了不少的线索。

首先,很多研究人员都认为,近年来越来越数据化的一些排名(ranking)机制(比如著名的CS ranking)可能在无形中把评价体系变得更为单一,也就是大家口中常常说起的“唯四大安全会议不投”。这种把资源全部都集中在金字塔尖的趋势,不仅让除了四大安全会议的其他会议受到了很大的影响,同时四大安全会议的投稿量暴涨,也难免出现良莠不齐的现象。更重要的是,了解一个研究人员/研究组不再是通过具体的研究方向,而是单纯去数他们发表的论文的数目,这难道不是一种严重的倒退吗?评价体系的问题也许值得我们社区的每个人去深思。

其次,科研体系的过度竞争也是学术不端的催化剂之一。严重的资源内卷,导致申请一个普通的职位都需要非常高的门槛,这样,只要一个学术不端的人进入竞争体系,其他人可能连洁身自好的权利都没有了。科研领域不能讲“达尔文主义”,做科研还是需要一些基本保障的。要落实终身教职制度,保证每个人一进来就是一条线。只要水平到了,经过同行评议,就可以拿到终身教职。只有这样,可能才能让大家静下心做研究,让浑水摸鱼的人无利可图。

除了关注教师,我们也应该更关注在这些问题背后的学生的心理。过去也发生过很多学生被导师胁迫去论文造假和论文作弊的情况。在和李宁辉教授的讨论中,我们也请他给广大学子一些建议,李宁辉教授表示,在学术研究的过程中,应该“work hard against rejection, but never too hard”。李宁辉教授认为,一个好的研究工作,作者本人应该对自己的工作最为自信,即使遇到了审稿人的负面意见,也应该有一个很好的心态:投稿和审稿不是吵架,任何时候遇到审稿人可能写得不好的评价,首先想一下,我们是否可以用更好的方式去表达自己的想法,让对方(和以后的读者)能更容易理解我们的论文。而且永远不要觉得只有自己受到了不公正的待遇,图灵奖得主Silvio Micali的获奖工作,在第一次投稿时候也一样被拒稿嘛。

九、尾声

距离CCS 2024已经过去了一个半月,波澜似乎渐渐平息。可正如安全研究领域的攻防是一场永无止境的竞赛一样,学术正义和学术不端的较量也从来没有停止过。问渠哪得清如许,为有源头活水来。SIGSAC PROTECT的成立、更多人(特别是年轻研究人员)的高度关注、新的机制的引入,是否能够根除影响安全研究社区的沉疴痼疾,让我们拭目以待!


文章来源: https://mp.weixin.qq.com/s?__biz=Mzg5ODUxMzg0Ng==&mid=2247499386&idx=1&sn=736fc2012d6a23e83cbb6abf7115a5cb&chksm=c063d0a3f71459b5c0307d5ec11b4bb76bfbe11747b7be70d4359c95e956e974d4684c5881ac&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh