第(1/3)页 我花了我四天时间写完了“实话”。 其实三千字的东西按我平时的速度一个晚上就够了。 但是这次格外难,我面前摊着朱雀给的那批日志,几百页的系统操作记录,我看明白了里面的东西,但让我写成一个没有技术背景的人都能看懂的话,就不太容易了。 第一版我写了五千字,写完自己读了一遍,太像报告了,删了。 第二版我砍到两千字,又读了一遍,太短了,关键的因果链断了,读完会觉得这是一篇情绪发泄而不是一份证据。 第三版我写到凌晨四点多,这次写了三千二百字,读完了觉得还是不对。 我趴在桌上睡了两个小时,醒了之后重新看,突然明白了——我一直在用【系统】当主语,系统被污染了、系统的数据被篡改了、系统的检测标准被扭曲了,但读这篇东西的人不关心系统,他们关心的是人。他们想知道的是那些被系统判死的人里有多少个像沈微一样的冤魂。 我把第三版的结构留着,把所有的主语换成了人。 “过去三四年,每一个被判定为魇人的作者,他们面对的检测模型有一部分是用被篡改的数据训练出来的。这意味着判定他们生死的那个标准本身就是错的。六十一分可能是真人,五十九分可能是魇人,没有人知道那条线到底在哪里,因为画那条线的尺子是坏的。” 写完这一段的时候天亮了,这已经是我能做到的极限了,剩下的交给读它的人。 朱雀那边在同时推进。 他没有告诉我他具体是怎么拿到纸鸢那把密钥的事,他只在某天傍晚来我这里说了一句:“钥匙拿到了。” 我看了他一眼,脸上什么表情都没有。 他说:“纸鸢知道是系统内部审计需要核实训练数据来源,她不知道其他的。” “她信了。” “她没有理由不信。” 这是最安全的处理方式,但我心里还是有一个结。 “等事情结束了,我们要告诉她真相。” “会的。”他说。 核心数据到了我手里。 我花了一整天时间把那些东西跟日志对照着,看那些被标注为“真人文本”的魇人生成的内容。 它们的提交渠道都指向同一个内部端口,审核人的编号是同一批,时间分布呈现出明显的规律性。 这不是一个人能做到的,这是一个团队在做。 系统的训练数据被污染了,而这套被污染的系统判了成百上千人的生死。 这就是我要写进“实话”里的东西。 核心数据拿到手之后我把“实话”最后改了一遍。 这一版加了数据:被污染的样本占训练库总量的百分之多少、污染集中发生在哪几个时间段、污染高峰期对应的核验误判率是多少。 写完之后我把全文发给了朱雀,他在半小时之内回了我一个字:“发。” 我坐在屏幕前面,文件已经准备好了,发送渠道朱雀之前帮我接通了全城凭证灯终。 我盯着那个发送按钮看了一秒钟,然后按下去了。 发出去之后的十分钟我一直站在窗口。 先是对面楼的凭证灯开始闪,从待机的蓝色变成了白色,一盏一盏的像多米诺骨牌一样从最低层往最高层亮上去。然后是隔壁楼,再隔壁楼,一栋一栋的,视线范围内所有的凭证灯都在变白。 街上开始有人停下来看,提着凭证灯赶路的人在路灯底下站住了,低着头看手里那块发白光的东西,有的人站了一会儿就走了,有的人站着不动,一直在看。 楼道里有人开门出来了,很多人在急切地说话。 我的手指还有一点麻,按那个键的时候用了太大的力,指尖压在键帽上的时间过长。 朱雀这时给我发了一条消息:“收到。” 那天晚上他带着核心数据和我的举报信去了法院。 去之前他来了一趟,说:“我走之后你把门锁好,窗户关上,凭证灯关掉。” “我知道。” 第(1/3)页