网络上一大争论是预期寿命能不能表现一个国家的平均寿命,同样平均死亡年龄到底是不是一个更好的指标。
首先我们看一下这两个数值是怎么计算出来的。
平均死亡年龄计算很简单,当年死亡的人年龄平均一下就得到了。
预期寿命是这样算的,首先得知道每个年龄段在上一年的人口,然后计算有多少人活到了下一年,两个数除一下得到这个比例就是条件生存概率,这样得到的是每一个年龄段的条件生存概率的一个序列。然后开始用这个概率的序列来计算一个人活到每个岁数的绝对概率,接下来用这个概率和年龄相乘再加和得到这个人在这一年的期望值,这个就是预期寿命。
我们看个例子。
假设生命分两期,第一期寿命1,第二期寿命为2,
假如去年这世界上40%的人活在寿命1,60%的人活在寿命2,方便起见假设去年有100人,也就是去年1岁的40人,2岁的60人。现在统计下发现今年2岁的有30人,也就是去年的1岁的挂了10个,去年2岁的今年全挂掉,
根据以上数字平均死亡年龄为:(2x60+1x10)÷70=13/7 大概是1.85岁
下面计算预期寿命
0岁到1岁条件生存概率为100%
1到2岁是75%
2岁到3岁是0%
接下来计算绝对生存概率:
活到3岁:100%*75%*0=0
活到2岁:100%*75%=0.75
活到1岁:100%×25%=0.25
所以这个人的预期寿命等于0*3+2×0.75+1×0.25=1.75
那哪一个更可以表现这个国家的人的寿命呢?
我们来看下平均死亡年龄算法的问题,这个计算方法与人口结构有很大关系。比如刚才的例子,把1岁和2岁的人口比例从4:6调整成6:4,也就是说1岁的60人中15人在一岁死亡,2岁的40个全挂。这时平均死亡年龄就变成(15*1+40*2)/55=1.73
可见即使每个年龄段的死亡概率相同,仅仅因为人口在各年龄的分布不同就可以产生差异。对于寿命指标来说,更多的是通过寿命来了解一个国家的医疗,健康状况,或者用来预测人口变动趋势,因此平均死亡年龄这个数值的波动太大,因此应用场景较少,有时会用来研究突发的公共卫生事件以及对劳动力市场短期冲击。
预期寿命就不受人口结构影响,但这种算法的问题是由于数据的取得是跨越了不同年龄段而来,这些人是在不同年份出生,而人类出生年代对应的医疗营养状况将极大地影响这个出生年份的人的未来寿命,但现有数据是片段性的,比如2000年出生的人最大的年龄也只有25岁,这个出生年份的人数据只有25年的。因此预期寿命其实是将不同寿命概率的人群夹杂在一起,对于研究当下的医疗健康水平是有意义的,但是具体到某一个年龄段的人并不能得出这些人未来可能的寿命是多少。而且正因为不受人口结构影响,老龄化等等对寿命的冲击在这个数据里完全不影响,在制定健康医疗政策时需要加入人口结构数据。
最完美的自然是获得某一个出生年龄段的人追踪所有人从出生到最后一个人死亡,然后计算这个年龄段的平均死亡年龄,但同样这些人跨越了不同的时间,对应的医疗状况各不相同,因此这样得到的数据虽然是精确的的该出生年龄的平均寿命,但无法说明现在的医疗水平。
因此权衡利弊,这就是为什么现在多采用预期寿命作为衡量指标。
PS:,说个题外话,我看到有的自媒体说教授让学生去统计墓碑平均死亡寿命。这个方法把不同年份的死亡人口加总在一起就更偏颇了,因为越是医疗状况好,人口死亡的数量相对其他年份就会更低,反而使得平均死亡年龄更低。