战争中的统计学
从很高的楼上看到的, 卫报有一个关于二战中德国人坦克数目估计的故事, 情报人员提供的数目都十分不准确并且有些自相矛盾, 在1943年, 盟国的统计学家们试图从俘获的德国坦克的序列号上面推出德国人每个月生产的坦克的数目。 不过这篇文章的数字来自于其中特别成功的例子:Mark V型坦克, 因为他的序列号与其生产的数目密切相关。 战后的得到的数字证实, 统计学家的估计的数目与实际的数目相无几, 而情报人员估计的都是实际数目的五到六倍。
简化一下实际上是一个这样的问题, 德国人坦克的数目是1, 2, 3 … N,其中 N是我们想要知道的德国人的坦克的总数, 假设盟国俘获了5辆坦克, 序列号分别是20, 31, 43, 78 和92,其中最大的号92我们用M来表示, 而样本数5我们用S来表示。 现在统计学家的任务就是用S,M去估计N的数目。
其实这是一个很多统计的课本里面讲估计函数(Estimators)都会提到的一个试验, 就是用已知样本的数据, 通过这个函数去估计未知的样本数据。 二战时候统计学家的任务是要找出一个最佳的估计函数去估计德国人生产的坦克的数目。 评价的标准是
- 无偏差:偏差(bias)是预测值与实际值之间的差距。 估计出来的数目就应该是德国人生产的坦克的数目。 我们希望没有偏差。
- 最小方差:方差(viriance)是一组数据中所有数与这组数据平均值之差的平方的平均值, 方差越大,这组数据的波动程度就越大。 我们希望这个估计函数得到一组结果的方差尽量小。
这个估计有个名字, 叫做最小方差无偏估计( minimum-variance unbiased estimator )。 数学家们也没有什么好办法, 所以他们只能做实验, 从想出来的一堆函数中挑一个好的出来。 比如, 在一天他们一起想了这么多估计函数。
- sum of all the values
- sum of all the squared values
- product of all the values
- fU+1.5fs, fU +3fs
- x4+2s, x4*2
- max
- max + min, max + min –1
- max + var, max+var/2, max+range/2
- max +(std dev)3
- mean + median, mean*median
- max + mean, max + median
- mean*2, mean*3, median*2, median*3
- max + average of difference
- mean + 2(std dev), mean +3(std dev)
- mean+2(std dev/), mean + s2
- median+1.5s, median + 2s, median+3s
- max + std dev, max + 2(std dev)
- max + variance, max+var/2
- max + range, max+range/2
- max*(n+1)/n
- range+s, range*2
- 2sqrt(mean2+s2)
- max+s3
- mean2/n
然后做实验从这么多里面挑几个比较好的出来, 然后再做做图, 发现实际的数目都是在那个最大的序列号M上做一点修正就可以了, 于是就可以得出最后的公式, 比较准确的预测出德国人生产的坦克的数目。 在预测其他型号, 比如德国人有意在序列号上玩花样的型号的时候, 这个公式当然就没有那么准确了。
当然, 事情肯定不会像卫报的标题“统计公式怎样帮盟国赢得了二战”那样吓人, 不就是猜出了几个战斗力并不很强的型号的坦克的数量吗, 虽然战后证实数字很准确, 但是当时军队里面的将军们信不信都不一定。
这个故事告诉我们, 写耸人听闻的标题是所有的报纸网站编辑的拿手好戏。
另外一个比较有意思的是看到有人试图用随机事件生成器预测世界的未来, 虽然遭到很多非议。 也许这个世界真是随机的, 但是也许太多的随机事件就会导致一个注定的结果, 或者模式?
More in this book:Bayesian statistical inference and parameter estimation. [PDF,405KB]
7 Responses to “战争中的统计学”
|
Comment by Siwei September 13th, 2006 at 9:40 am |
赫赫 有点意思 |
|
Comment by cathayan September 13th, 2006 at 10:23 am |
我觉得这个故事是告诉我们,分序列号不能学德国人啊 这里说到的Mark v型,不是一战的东西,应该是二战里比较厉害的那几种,战斗力可不差 |
|
Comment by magoi-> September 13th, 2006 at 11:10 am |
interesting. |
|
Comment by crazyanswer September 13th, 2006 at 11:15 am |
又是随机。。 |
|
Comment by biantaishabi September 13th, 2006 at 11:30 am |
to wq 休假中, 勿扰! to cathayan |
|
Comment by xyb September 20th, 2006 at 1:44 am |
好厉害,喜欢看btsb的科普小故事,很有趣。 |
|
Comment by biantaishabi September 20th, 2006 at 11:14 pm |
我就最喜欢xyb了, 总是来鼓励我! |