《白云书园》之数字时代(二七)

人?猫?机器?

等园园和小书不知不觉地把桌上的饭菜都收拾干净,才发现原来两人吃起东西来都是还蛮拼的。这顿饭吃出的收获就是发现两人还是有不少共同爱好的,最重要是了解到大家都是吃货。

园园擦干净嘴,又开始思考那个天马行空的社交经济学的问题了。喝了口茶,她开口了:“你说那些僵尸粉,我们能不能用什么简单方法把他们和正常微博用户区分出来?”

小白好无奈啊,“美女你还真学术嘞。区分真人和机器这事可是有点历史了,大概十几年吧。好吧,我就我所知来给你八卦一下吧。”

“好啊,我洗耳恭听。”

“关于这个问题我听说的最早的段子是这样的。有天一位英国作家小哥在计算机前敲文章,渴了就起来去弄杯咖啡来喝。等这哥们回来,发现他的猫刚在他的键盘上玩了一会,在屏幕上留下了一长串字符,像个喝醉了的人留下的句子。虽然语法完全消失,但也还不赖。”

“猫咪真行,经过训练吧。”

“于是他把这串字符发邮件给了他那学考古的女朋友,解释说这是他在山上攀岩时在一个岩洞壁里发现的。没两分钟她的电话就来了。

答铃,这句子是在哪找到的?快带我去。虽然写这句子的人当时已经饿的脑子不灵光了,但我还是把这上面的古文破译了。句子说TA在山洞里藏了一个圣杯。

这哥们听的这个汗啊,瀑布流不断从头上淌下。这哥们于是就想起来这个看一串字符是不是出自真人的问题,同时也对像他女友那样做研究的科学家的无限发现和创造能力产生了无限钦佩。”

听了小白的长篇瞎扯,园园很不以为然地评论道:“你就瞎编吧!又对做学问的有意见是吧。”

“呵呵,就是讲个笑话。不过分辨句子是不是人写的这个问题在互联网时代确实发展成了一个大问题。你知道吗,你在注册电子邮件地址或网络用户时经常要添的验证码就是为了分辨在计算机前填信息的是不是真人而产生的。”

“这个听起来还挺有意思的,讲讲这个故事。”

“那我先考考你,你说在所有发送出的电子邮件中多大比例是垃圾邮件?”

“这个,我估计大概10%是垃圾吧。我数数我的收件箱和垃圾邮件箱中的邮件数就大概可以了解了。”

“按小书他们统计里的名词,你这是个有偏估计。你估计是和你相识的邮件用户看到的邮件中垃圾的比例,我的问题是所有发送出的邮件中的比例。”

“难道还有邮件发出后对方没收到?我发出的邮件从来没碰到这问题啊。别扯了,电子邮件要是这么不靠谱,谁还用它?”

“其实还是有些你没看到的。这个先不管,你这样本量也不够。我看到的数字是这个比例这几年一直在下降,就拿2013年来说吧,垃圾邮件占电子邮件的 69.6%, 比2012年降低2.5%。”[1]

 

2013年垃圾邮件占电子邮件的比例

 

“下降了这几年了还这么高啊,那以前得多高呢?”

“在2000年到2010之间,很多年维持在90%以上。发这些垃圾邮件的人注册一些免费的邮箱(比如Yahoo,gmail……),然后狂发广告。不过成天坐在屏幕前注册邮箱也不是事,这些高级码农就写程序来注册邮箱。”

“这样啊,那邮件提供商就有动力来分清楚是真人在填信息注册邮箱,还是机器人或代码程序在试图开邮箱。”

“你真是一点就透。这个问题等到了网络供应商也有动力解决时,就很快向前发展了。”

这下轮到园园得意的笑了,“看,还是我说的经济学准则吧,有了利益的驱动,人的创造力就很容易被激发出来。”

“别说还真是这么回事。其实发垃圾邮件的人也是有很大利益驱动才会费劲地去狂发邮件的。这些邮件大多数的内容不是给治人病的广告就是要毒害计算机的病毒。”

“咦,怎么想到平一指这么个人名呢?救一人杀一人。”

“当双方都有利益驱动时,网络供应商和垃圾邮件供应商之间的一场猫捉老鼠的好戏就在十几年前开始了。”


[1]Kaspersky Lab 关于2013年的报告: http://securelist.com/analysis/kaspersky-security-bulletin/58274/kaspersky-security-bulletin-spam-evolution-2013/

[*] 原文同时发布在: 《白云书园》之数字时代(二七) http://wp.me/p5Da4b-3U

本文链接:《白云书园》之数字时代(二七)
本站文章若无特别说明,皆为原创,转载请注明来源:火光摇曳,谢谢!^^


火光摇曳

《白云书园》之数字时代(二七)》有1个想法

  1. 貌似说互联网的traffic 大部分都是robots 占了大多数, 尤其是爬取各种网页的程序

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*