他点开那个黑客论坛的私信界面,准备给对方发过去。
就在这时,对方的头像闪了起来。
发来了一个十几兆的压缩包。
紧接着是一条留言:
【兄弟,代码如果跑通了,顺手帮个忙。这是我们网站初期的两万条原始图片数据标签,你用你的新程序跑一遍,把里面的乱码和错误标签筛出来,跑完没问题,一千五百块钱我立刻打你卡上。】
楚戈愣了一下。
他点开那个压缩包,解压。
打开里面的文本文档。
只看了一眼,楚戈的脸就黑了。
密密麻麻的文本,几百页。
里面全是不规则的数据。
有些是正常的中文标签风景,人物。
有些是乱码%amp;:*#¥。
还有些是拚写错误的英文单词,甚至是半角全角混杂的标点符号。
这根本不是程式设计师写出来的东西,而是那些不懂电脑的文员,用各种千奇百怪的输入法手动录入的原始垃圾。怎麽了?
陈拙看出了楚戈的不对劲。
楚戈指着屏幕上的那堆乱码。
对方让拿这些原始数据跑一次测试。
楚戈头疼地揉了揉太阳穴。
这活儿没法干,这数据太脏了,里面全是不符合任何逻辑规律的人为输入错误。
陈拙走过去,看了一眼屏幕。
写个正则筛除脚本不行麽?
不行。
楚戈摇头。
正则表达式只能抓取有规律的东西,你看这行,他把苹果打成了pinguo,旁边还跟了个火星文,这种东西一进底层逻辑,程序立马就会判定为异常变量,直接卡死。
楚戈咬着牙。
这帮孙子,自己不愿意花时间去清理这些垃圾数据,想用一千五百块钱让我连代码带清洗全包了。旁边,陆嘉被楚戈的说话声吵醒了。
他迷迷糊糊地直起身子。
看了一眼屏幕上的那些东西。
这没有数学规律。
陆嘉看了一眼就得出了结论,声音带着刚睡醒的沙哑。
代数方程解不了无序的错误。
屋里安静下来。
楚戈靠在椅子上,看着屏幕上的两万条数据,有些泄气。
熬了一整夜,脑子都快炸了。
就差这临门一脚。
要不....我明天写个稍微复杂的脚本,多加几个条件判断,能筛多少是多少?
楚戈自己都没底气。
这种脏活儿,用代码去防人为的愚蠢,是最费力不讨好的。
陈拙看着屏幕上不断滚动的乱码。
他伸手拿过滑鼠,往下拉了几页。
不用写脚本。陈拙松开滑鼠,机器分不清这种无规律的错误,但人眼分得清。
楚戈愣了。
这两万条,纯靠人眼看?那得看到什麽时候去?
一个人看两万条当然慢。
陈拙走到自己的书包前,拿出一张崭新的空白软盘,插进楚戈电脑的软碟机里。
陈拙把那个装满原始数据的文本文档拖了进去。
拔出软盘,装进口袋里。
他看了一眼楚戈,又看了一眼揉着眼睛的陆嘉。
这活儿交给我吧。
陈拙走到窗前,拉开一点窗帘。
外面的天已经蒙蒙亮了。
今天早上正好没课,你俩把电脑关了,回去睡觉。
陈拙转过身。
明天晚上,我把乾净的数据带回来,你直接跑程序交差。
楚戈张了张嘴,想问陈拙去哪找人看这两万条数据。
但看着陈拙那副淡定的样子,他把话咽了回去。
行。
楚戈也是真熬不住了。
他关了电脑。
把满桌子的草稿纸收拢起来,塞进兜里。
拍了拍还在打呼噜的王大勇。
大勇迷迷糊糊地醒过来,抹了一把嘴角的口水。
跑完了?
跑完了,睡吧。
楚戈站起身,伸了个懒腰。
他看了一眼陈拙,没多说客套话。
谢了。
楚戈带着陆嘉,走出了215的门。
上午十点。
科大老图书馆。
阳光透过常春藤的叶子,在木地板上投下斑驳的光影。
借阅前没什麽人。
苏微正坐在一张高脚凳上。
手里拿着一本有些年头的线装书,正在仔细地修补脱落的书页。
陈拙走过来,把手里的软盘放在木制面上。
发出轻轻的一声响。
苏微擡起头。