麦苗 发表于 2009-9-25 00:01

推荐一本书——数据造假曝光宝典:统计数字会撒谎

统计只有被合理使用,才真正有意义,而不是替那些错误结论提供伪证。
推荐一本好书,[美]达莱尔·哈夫 所著
数据造假曝光宝典:统计数字会撒谎

“平均工资水平”有多少可信性?长春白领月薪1500?标准太低数据存疑、平均工资越高越令人恐惧……类似于这样的质疑越来越多。统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却被利用并成为恶意夸大和迷惑他人的工具。可就是缺乏一本在这方面的“数据打假”手册,本书正是这样一本经典统计畅销书,在数据王国美国经历了50多年的锤炼和检验依然长期在美国各大书店销售,不仅赢得专业人士的赞誉,而且更为很多普通大众所喜爱。本书用风趣的插图和通俗的语言把高深的统计学写得像“故事书”一样精彩,作者重说明、轻证明,重文字描述、轻理论推导,并结合活生生的案例,语言轻松诙谐,揭露了大量至今仍被销售员、专家、记者或者广告撰稿人频频使用的“行骗工具”:有偏的样本、精心挑选的平均数、滥用一维图形、遗漏某些重要的数据、混淆因果关系等。

http://book.qq.com/s/book/0/16/16303/index.shtml

无极紫晶 发表于 2009-9-25 01:16

1# 麦苗

明天,哦,不,应该是今天就去买。谢谢!不过你已经看过了,就抽空把一些精彩片段拿来共享吧!

潮水 发表于 2009-9-25 08:39

通过一个极端的例子可以马上看到如何形成有偏的样本。假设你向同胞发放问卷,问卷中包含这样一个问题:"你乐意回答调查问卷吗?"整理所有的答案,你很有可能得到下面的结论:"一个选自总体、典型的横截面"中,压倒多数的人选择了"乐意"。为了具有说服力,你还可以详细列出这个比例,直至最后一位小数。事实上,大多数持否定意见的人,已经随手将你的问卷丢进最近的纸篓中,从样本中自动除名了。哪怕最初的样本中,10个里面有9个会当这种"投手",在宣布你的结果时,你仍然会遵从惯例,忽略他们。
    确实值得一看,这些情况就发生在我们身边!

谷子 发表于 2009-9-25 09:14

能造出让人信服的假数据也是件不容易的事情~比如论文、课题~都应该存在这种现象吧!
中要大众能信服,假数据就发挥了其重要作用。

麦苗 发表于 2009-9-25 15:29

2# 无极紫晶


哈,没有看完,下面是阅读链接,但是有了好东西就要分享不是?一起看吧!

樵夫 发表于 2009-9-25 21:10

1# 麦苗

不是还有一个经典的例子吗:
你的住房面积是10平方米,邻居的是90平方米,后来邻居搬了新家,住房面积变为190平方米
问:你的住房面积增加了吗?
答:没有改变
统计局:错,你的平均住房面积增加了50平方米:lol

小点点 发表于 2009-9-25 22:56

看了以上的举例说明,我懂了统计学(在学统计学时我很痛苦){:1_294:}{:1_278:}

麦苗 发表于 2009-9-25 23:03

7# 小点点


聪明!赞一下!

麦苗 发表于 2009-9-25 23:21

第13节:精心挑选的平均数(2)


  在希望数值较大时,我使用的10000英镑是均值,也就是附近居民收入的算术平均数。你只要将所有家庭的收入加起来并除以家庭总户数便可得到这种算术平均数。数值相对较小的是中位数,它告诉我们一半家庭的年收入超过2000英镑,另一半家庭的年收入不及2000英镑。我还可以利用众数--所有家庭收入序列中出现次数最多的那个收入。例如,附近的居民中年收入为3000英镑的家庭数是最多的,那么收入的众数就是一年3000英镑。
  在这个例子中,不合适的"平均数"实际上是毫无意义的,只要碰到关于收入的数据,这种情况就经常出现。还有一个因素会让我们困惑不已--某种条件下,各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们。

  比方说,当你看到某个原始部落男性的平均身高为5英尺时,你对这些人的外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数或者众数,因为此时各种平均数的数值大致相等。(当然,如果你正在为非洲人赶制一批制服,那么就需要比平均数更多的信息,你要用到全距和标准差,这些我们将在下一章进行介绍。)

  在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形的曲线,均值、中位数和众数都落在相同的点上。

  在描述人类身高时,用哪种平均数无关紧要,但在描述他们的钱袋时,却并不是那么回事儿了。如果把某个城市所有家庭的年收入都列出来,你会发现,这些数从很小的值变动到很大的数,也许有20000英镑左右,甚至还能看到少数巨额收入。年收入低于5000英镑所占的比例超过了95%,在收入曲线上朝左边拖出了一条长长的尾巴。这种分布不再像钟形一样对称,而是有偏的,它的形状类似于孩子玩的滑梯,梯子一侧是陡斜地升到顶部,而滑道一侧则缓慢向下倾斜。均值与中位数相差甚远,这样一来,比较去年的"平均数"(均值)与今年的"平均数"(中位数),这种比较的有效性就不言而喻了。


难怪一说到俺这的平均工资和俺们的工资,就产生疑惑,是不是用众数更合适?:lol

柳莹依 发表于 2009-9-25 23:23

我们正处于一个工资被增长,房子被加大,幸福指数被加高,情绪被稳定的情形之中.好书一本,不过有一句话,思想者往往是最痛苦的人.所以不想痛苦的话....

麦苗 发表于 2009-9-26 15:04

10# 柳莹依


哈,柳版的话总是很有意思。

男儿当自强 发表于 2009-10-24 07:37

本帖最后由 男儿当自强 于 2009-10-24 07:39 编辑

10# 柳莹依
很有道理的一句话。不但是感控专家,还是思想者:P 。只是别太痛苦了:lol
页: [1]
查看完整版本: 推荐一本书——数据造假曝光宝典:统计数字会撒谎