不靠谱的数据有哪些?
普通人对数据都有敬畏感,特别是来自貌似官方权威的数据,更是能够给普通人带来自然的说服力。越是这样,我们越要提醒大家,有些人会利用普通人过于信赖貌似专业的数据心理,来欺骗大家。
那么利用不靠谱数据误导我们的常见手段有哪些呢?
1。滥用平均数制造虚假繁荣
我所在的高校领导曾经在一次报告中说全校老师年薪收入已经达到人均十万,结果很多老师就嘀咕,我哪里有十万年薪?我是被平均了好不好?
说到工资这个事情,大家都已经很清楚了,要分析一个单位大多数人的平均收入,用平均数计算工资是不科学的,用中位数或者众数相对来说更接近真相。
比如按上表,七个员工平均年薪是(5+5+5+6+8+16+25)万=70万7=10万
按中位数,应该是6万。(对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。)
按众数,应该是5万。(一组数字中出现频率最高的数字)。
你看,选择不同的平均工资计算方式,大家的感受会完全不同。
2。用有限取样数据推导出不客观的结论
2。15年1月底,国家工商总局公布定向监测结抽检报告说淘宝正品率仅37。25%,其中:①抽查的淘宝、京东、天猫、1号店等,正品率为58。7%,淘宝最低,仅37。25%;②手机行业正品率仅28。57%,小米手机正品率40%,三星手机正品率0%;③雅戈尔、only、雅诗兰黛、史丹利等品牌正品率低。
这个抽样报告引起很多人质疑,原因何在?我们不妨先看看一组抽样调查数据。
淘宝有假货是事实,但是用于说明淘宝假货率高的调查样本也太少了。如果多买一件三星,恰好是正品,马上正品率就上升到33%,这显然不是一个有说服力的调研样本。所以引起争议也非常正常。
3。用以偏概全的数据混淆视听
以偏概全这种事情也经常可以看到,就是拿出一部分数据来论证观点,故意回避其它数据成分。
比如2015年人保部通过了公务员整体加薪方案,本来加薪是一件可以讨论的事情,为了让公务员也和普通人一样交社保拿社保保障金退休,是社会的进步。
但是在解释为什么要对公务员加薪时,有的专家大谈公务员基本工资已经十年没有变化,不加薪似乎对不起公务员。
但事实是2004年到2014年是考公务员热的十年,大家之所以参加国考,不就是看中公务员工作稳定还收入高。这个收入绝不仅仅只包括公务员的基本工资,还应当包括公务员的福利收入,隐形收入(比如有的单位可以优惠购房,对口子女上学),甚至还有灰色收入。
如果只比较基本工资,这是不公平的。
4。只选择对自己有利的数据
很多文章的数据看起来非常有道理,但都有一个特点,那就是选择性提供对自己观点有利的数据,隐瞒不支持自己观点的数据,这样让他的文章看起来非常有说服力。
比如一些文章会告诉我们中国13亿总人口中还有3000万人口没有脱贫,也就是说中国还有3000万个穷人。但人口只有3亿多的美国也存在3500万贫困人口,这不是恰好说明了我们国家制度的优越性?
但是这些人却没有告诉你美国的贫困人口收入线在2010年规定是单身年收入是10991美元以下,两口之家年收入在14051美元以下,三口之家年收入在17163美元以下,四口之家年收入在22314美元以下。
我们国家规定的贫困线标准是年纯收入1500元人民币,实际上比联合国规定的贫困线标准日收入1。25美元以下还低。
所以这样只比贫困人数规模和占比,不对比贫困线标准的数据显然是有问题的。
在房地产行业,类似的游戏也非常多。比如新闻里需要说明房价在上涨时,他们会说上季度某地中心城区房屋价格上涨了百分之多少,需要认证房价在调控下趋于稳定时,他们会说上季度某地区房屋价格开始出现滑落。