“刷量”“买粉”“伪创作”
数据造假成“套路” 最终受伤的是谁
一篇自媒体文章不仅引起了公众对旅游社区平台马蜂窝点评内容抄袭的质疑,也捅开了互联网行业数据造假的“马蜂窝”。
在对“是否存在内容抄袭或数据造假”的质疑讳莫如深数天后,马蜂窝联合创始人兼CEO陈罡承认,其“在餐饮等点评数据方面存在部分问题,但远没有外界所表述的那么夸大”。然而,业内人士指出,互联网领域的数据造假远比想象的更严重,而且造假套路也呈现“道高一尺魔高一丈”的趋势。
从最早的电商刷单、刷好评,到之后的微信公众号买粉、刷阅读量,再到网络直播平台买流量、App机器人用户充数据,各类数据造假的手段不断翻新,而真实数据成为难以获知的“高度机密”。
难道没有机制可以识别、约束这些“套路”吗?事实上,一些平台企业和投资机构早已尝试通过反爬虫 、第三方数据调查等技术手段预防和应对数据造假,但是效果并不好。另外,部分投资机构出于种种考虑,默认一些互联网企业的数据造假行为,甚至与之合谋。技术难题也随之成为更加复杂的人性谜题。
进步最快的是造假的方式
在“马蜂窝事件”中,备受质疑的一个数据造假“套路”是,不少用户在其他平台的旅行攻略、点评内容,被搬运到马蜂窝上。实际上,此类做法并不新鲜。
今年7月,生活社区小红书通过官方微博指责大众点评大量抄袭其用户的内容。具体做法是批量建立虚假账号,抄袭及搬运用户在小红书发布的原创内容。据小红书估计,抄袭的数量在百万条量级。
一些用户专门为小红书平台创作的内容被“copy”后,依然留着原本内容的影子。小红书用户“詹小猪Coco”曾于6月6日发视频庆祝小红书创立纪念日,“copy”后,文案竟变成了“祝点评生日快乐”,但视频中用户说的仍然是“小红书”,而且6月6日也不是大众点评的“生日”。
当时,大众点评方面对此回应称,这是因为新上线试运营的推荐栏目在未经授权的情况下对相关内容进行了违规转载,已第一时间完成所有内容排查与全部清理下线,并通过技术手段确保该类问题不再出现。
段民(化名)从2002年开始从事数据挖掘工作,是国内最早一批大数据行业应用的开拓者。他告诉中国青年报
相关新闻
◎版权作品,未经华夏经济网书面授权,严禁转载,违者将被追究法律责任。
Copyright 2015-2019. 华夏经济网 www.huaxiajingji.com All rights reserved.
违法和不良信息举报邮箱:jubao@huaxiajingji.com 执行主编:慧文
京ICP备11009072号-3 未经过本站允许,请勿将本站内容传播或复制