批量生产的机器人账号，数字世界的数字假象

文/陈根

计算机技术的快速发展让人类步入智媒时代，无处不在的智能手机和社交媒体让人们接受信息从未像现在这样快速便捷，但这也令我们生活在数据的洪流中。国际数据公司IDC的数据显示，到2025年联网设备的数量预计将增长到420亿台。因此，我们正在迅速进入“超数据”时代。

宏观的数据具体表现在我们的生活里，来自于每个人每天的日常行为：查天气、查股票、查地图导航、购物、聊天、刷微信朋友圈、转发、点赞等。与此同时，独属于数字世界的数字假象，也在吞噬我们的互联网社交生活。

打开手机，我们在社交媒体上收到的评论与转发，在问答平台上看到的点赞和收藏，微博时常莫名的关注，直播营销好看的数据，这些与我们展开互动的陌生ID和互联网呈现给我们的数字现象，背后的控制者很可能不是人类。

新浪微博里首个突破一亿粉丝的女艺人，我们不会真的相信是有一亿个人关注了她；百分百好评的商品，消费者也会对其持有怀疑。事实上，批量生产的机器人账号，流量造假的媒介狂欢，早已在社交网络上泛滥成灾。

这是数据的时代，也是数据虚假的时代。

僵尸账号和攻击目的

互联网的普及和发展令以Facebook、微博为代表的社交网络(SNS)成为新的互联网信息载体。然而，相关的安全技术、法规政策及安全意识的滞后，使得社交网络的安全问题日益突显，在社交网络面临的众多安全威胁中，僵尸账号成为重要的威胁之一。

传统的僵尸账户是指恶意用户在P2P网络中建立多个伪造身份，利用节点之间的相互关系绕过信誉机制系统。而随着人工智能的发展，从创建应用软件、官方网站或内容传播平台，到生产具有实质性内容的图像、视频或文字，通过或真或假或自动地与用户交互，僵尸账号已经越来越“真实”。此前曾有研究表明，连人工智能都可以被用来生成复杂的点评信息，而这些虚假的点评不仅机器无法检测出来，就连人类读者也分辨不出来。

此外，僵尸网络的规模之庞大更可能超乎我们的想像。早在2017年，就有研究人员报告了其偶然发现了一个Twitter僵尸网络，其中包含超过35万个自动化帐户。这是一个具有难以想象比例的网络，它自2013年诞生以来就一直未被发现。研究人员称这个网络为“星球大战僵尸网络”，并表示其僵尸网络的潜在影响以及跟踪和监测的方式长期存在严重的问题。

无独有偶，同年，来自美国马里兰州的网络安全公司ZeroFOX公布了一份研究报告，揭开了Twitter平台大规模垃圾色情邮件僵尸网络的冰山一角。根据报告，被ZeroFOX定点追踪、被称为“SIREN”的Twitter僵尸网络，包含超过90000个伪造的账号，总计发布了超过850万条包含恶意链接的推文。这些内容仅在调查结束前的数周之内，就产生了超过3000万次的推特用户点击。

事实上，社交网络包含大量的好友关系，并且用户之间依赖于信任关系取得访问其隐私信息的权限，这天然为利用社交网络好友关系，发动僵尸账号攻击提供了可行性。对于这些批量生产的机器人账号，攻击者可以廉价地获得并且对社交网络进行渗透，以实现访问无权限资源、恶意扩张网络和广告营销的攻击目的。

从访问无权限资源的攻击目的看，社交网站具有极强交互性的特点，攻击者可以利用虚拟人际关系网，通过与其有一定关系的好友账号进行间接渗透攻击，获取目标用户的个人隐私信息、社交关系网，还可以通过好友用户发私信或邮件的方式进行钓鱼攻击。

而恶意网络扩张则是利用网络爬虫技术，创建大量网络中的信任列表，或恶意提升搜索引擎排名。此外，网络爬虫恶意攻击网络系统的行为，会大量占用网络带宽，造成网络拥堵，使服务器无法处理用户正常访问请求，甚至导致死机。《2019年上半年我国互联网网络安全态势》显示，2019年上半年，计算机恶意程序传播次数日均达约998万次。

以广告营销为攻击目的时，恶意的僵尸账户则用这种攻击方式达到提高知名度、信誉度或制造垃圾信息的目的。事实上，如果最终目标仅仅是引诱点击诈骗链接，那么僵尸账户的危害，并不会比传统的垃圾邮件恶劣多少。然而，如果把僵尸账户栖息的社交平台也算进来，最终产生的影响力显然要远远超过大多数人的预期。

从僵尸账号到流量造假

这是数据的时代，也是数据虚假的时代。批量生产的机器人账号，源源不断炮制出无孔不入的数字假象，在当下至少造成了两种影响：流量造假和舆论影响。

在流量造假方面，从品牌的角度来看，如今的互联网已经变身一个“唯流量”时代。流量在哪里，关注点即在哪里，大家就认为市场在哪里。

传统媒体时代，主要的流量造假者大多来自传统媒体，报纸夸大发行量、广电对于收视听率的调查样本进行污染的情况时有发生。另一个共谋者就是报纸与广电媒体的广告代理公司。通过在发行量与收视听率上做文章，以提升广告价格，达到宣传效益。

互联网时代，上述情况变得更为复杂。门户网站崛起伊始的网络广告价格较为低廉，因此在流量造假上的动机就不足。而后来BBS等社区崛起，网络社交的威力初现，用户规模以及上网时间增长迅速。因此流量造假就有了更为强烈的需求驱动，点击率等指标被注水成为常态。

到了移动互联网时代，电商等新消费形态逐渐普及，对于转化率等数据第一次有了网络采集与对照的可能，因此流量造假的现象开始出现在实效领域，刷单等已经是公开的行业惯例。于是，流量作为网络文化的重要指标之一，在流量经济时代，流量劫持、流量造假等问题开始挑战传统法律。

基于僵尸账号的流量造假、流量劫持，不仅损害消费者权益，破坏商业模式，还会损害数据信息价值，造成大数据产业“劣币驱逐良币”。此外，为了追求自身的利益最大化的流量造假，也违背了诚信的原则。而当数据造假成为一种产业，每个参与其中的人都因自身获利而或多或少助长了造假现象的持续蔓延。

然而，尽管社交平台和法律机构对于SNS僵尸账号始终保持着高度关注，但对于僵尸账号却依旧没有赶尽杀绝。事实上，流量造假的存在有着极为清晰和强烈的市场需求驱动。流量造假的本质在于提高媒介资源的价格，但围绕媒介资源的定价基准，考虑到不同阶段会有不同的媒介市场格局与入局玩家。但是只要媒介资源参与到商品交换中议价的基准不变，这种流量造假或许就会一直存在下去。

从国内流行的短视频与文字社交应用，到Instagram、Snapchat、Facebook甚至Steam，这些带有社交元素的数字平台，离不开“热度变现”这个本质。再加上随着社交网络产品潮流的迭代，微博、Twitter甚至Instagram这些相对“传统”的社交网络平台都面临活跃度下降、新用户增长乏力的困境，哪怕是为了维持基本的平台活跃度拿出更好的报表写进财报，给那些徒有场面的僵尸网络账号留一条生路，也算是不得已为之的无奈之举。

于是，在流量造假根植于社交网络平台的商业路径中，理不清也难理清。

从僵尸账号到舆论影响

在影响舆论方面，2018年麻省理工学院的研究团队，通过对Twitter舆论事件话题下的发言进行归纳分析，得出一个惊人的结论：只要保证充足的活跃度，哪怕实际数量还不到参与用户总数的1%，Twitter上的机器人账号，依旧能够影响舆论的风向走势。

这项研究的样本舆论事件，正是2016年的美国总统大选。通过对收集到的77563个用户样本展开分析，麻省理工学院的研究者筛选出了7702个不会改变立场的顽固用户。随后经过进一步筛选，总共锁定了396个僵尸账户——260个支持特朗普，136个支持希拉里，加在一起不到用户样本总数的5%。

尽管占比不高，但凭借远超真人用户的活跃度，这400个僵尸账户扮演的“意见领袖”，成功将双方候选人的观点推向极端化，为两边吸引了数量可观的真实支持者，最终实现了微妙的“平分秋色”。

换言之，无论是不是SNS网红，无论在社交平台上的公众形象如何，只要投入足够的资本来发动SNS僵尸网络营造声势，最终的赢家，很可能和公众期望的结果大相径庭——美国总统大选如此，那些资本驱动的SNS营销造势活动，同样如此。

当然，在当下舆论形成和监督机制正在翻新，水军操纵舆情的力量也越来越弱。所以，尽管僵尸账号的痕迹越来越隐蔽，但在长期与僵尸账号的斗争中，网民也变得越来越理性和成熟。更多网民也不再盲目轻信，反而会带有怀疑地去看待舆论观点。同时，网民的庞大基数也让社交软件上的观点越来越多元化，僵尸账号带来的水军也越来越难以左右舆论走向。

无论是僵尸账号的攻击目的还是基于僵尸账户的流量造假，僵尸账号都已渗透在我们的网络生活中。这是数据的时代，也是数据虚假的时代，而分辨这一切的虚假与真实，我们还有很长的路要走。

免责声明：该自媒体文章由实名作者自行发布（文字、图片、视频等版权内容由作者自行担责），且仅为作者个人观点，不代表秒送号（Miaosong.cn）立场，未经作者书面授权，禁止转载。［投诉 · 举报作者与内容］

批量生产的机器人账号，数字世界的数字假象

相关阅读

发表回复