战争中的统计学

Filed at 2:07 am under 科学家们研究的东西 by biantaishabi

很高的楼上看到的, 卫报有一个关于二战中德国人坦克数目估计的故事, 情报人员提供的数目都十分不准确并且有些自相矛盾, 在1943年, 盟国的统计学家们试图从俘获的德国坦克的序列号上面推出德国人每个月生产的坦克的数目。 不过这篇文章的数字来自于其中特别成功的例子:Mark V型坦克, 因为他的序列号与其生产的数目密切相关。 战后的得到的数字证实, 统计学家的估计的数目与实际的数目相无几, 而情报人员估计的都是实际数目的五到六倍。

简化一下实际上是一个这样的问题, 德国人坦克的数目是1, 2, 3N,其中 N是我们想要知道的德国人的坦克的总数, 假设盟国俘获了5辆坦克, 序列号分别是20, 31, 43, 7892,其中最大的号92我们用M来表示, 而样本数5我们用S来表示。 现在统计学家的任务就是用SM去估计N的数目。

其实这是一个很多统计的课本里面讲估计函数(Estimators)都会提到的一个试验, 就是用已知样本的数据, 通过这个函数去估计未知的样本数据。 二战时候统计学家的任务是要找出一个最佳的估计函数去估计德国人生产的坦克的数目。 评价的标准是

这个估计有个名字, 叫做最小方差无偏估计( minimum-variance unbiased estimator )。 数学家们也没有什么好办法, 所以他们只能做实验, 从想出来的一堆函数中挑一个好的出来。 比如, 在一天他们一起想了这么多估计函数。

  1. sum of all the values
  2. sum of all the squared values
  3. product of all the values
  4. fU+1.5fs, fU +3fs
  5. x4+2s, x4*2
  6. max
  7. max + min, max + min –1
  8. max + var, max+var/2, max+range/2
  9. max +(std dev)3
  10. mean + median, mean*median
  11. max + mean, max + median
  12. mean*2, mean*3, median*2, median*3
  13. max + average of difference
  14. mean + 2(std dev), mean +3(std dev)
  15. mean+2(std dev/), mean + s2
  16. median+1.5s, median + 2s, median+3s
  17. max + std dev, max + 2(std dev)
  18. max + variance, max+var/2
  19. max + range, max+range/2
  20. max*(n+1)/n
  21. range+s, range*2
  22. 2sqrt(mean2+s2)
  23. max+s3
  24. mean2/n

然后做实验从这么多里面挑几个比较好的出来, 然后再做做图, 发现实际的数目都是在那个最大的序列号M上做一点修正就可以了, 于是就可以得出最后的公式, 比较准确的预测出德国人生产的坦克的数目。 在预测其他型号, 比如德国人有意在序列号上玩花样的型号的时候, 这个公式当然就没有那么准确了。

当然, 事情肯定不会像卫报的标题“统计公式怎样帮盟国赢得了二战”那样吓人, 不就是猜出了几个战斗力并不很强的型号的坦克的数量吗, 虽然战后证实数字很准确, 但是当时军队里面的将军们信不信都不一定。

这个故事告诉我们, 写耸人听闻的标题是所有的报纸网站编辑的拿手好戏。

另外一个比较有意思的是看到有人试图用随机事件生成器预测世界的未来, 虽然遭到很多非议。 也许这个世界真是随机的, 但是也许太多的随机事件就会导致一个注定的结果, 或者模式?

More in this bookBayesian statistical inference and parameter estimation. [PDF,405KB]

7 Responses to “战争中的统计学”


Comment by
Siwei
September 13th, 2006
at 9:40 am

赫赫 有点意思


Comment by
cathayan
September 13th, 2006
at 10:23 am

我觉得这个故事是告诉我们,分序列号不能学德国人啊

这里说到的Mark v型,不是一战的东西,应该是二战里比较厉害的那几种,战斗力可不差


Comment by
magoi->
September 13th, 2006
at 11:10 am

interesting.


Comment by
crazyanswer
September 13th, 2006
at 11:15 am

又是随机。。
呵呵,你丫也不去实验室搞研究,在家写科学小八卦。


Comment by
biantaishabi
September 13th, 2006
at 11:30 am

to wq

休假中, 勿扰!
我昨天去了福冈, 今天还要骑去下关, 然后去山口。一起去吧

to cathayan
查了一下, 原来五型就是豹式, 四型就是虎式, 确实是挺强啊。 我还以为是傻比型号呢。


Comment by
xyb
September 20th, 2006
at 1:44 am

好厉害,喜欢看btsb的科普小故事,很有趣。


Comment by
biantaishabi
September 20th, 2006
at 11:14 pm

我就最喜欢xyb了, 总是来鼓励我!

Leave a Reply