张学文
广义集合概念使“客观事物”概念清楚了一层.广义集合连同分布函数概念又超脱过细的学科分类,它们具有“相对普适性”、“相对确切性”和“形式的相对具体性”[7].这使它们比“客观事物”概念更容易进入各个自然(社会)科学领域.
概率分布是概率论中的重要概念,也是新定义的分布函数的特例.分布函数是统计物理学中的重要概念,也是新定义的分布函数的特例.所以分布函数早就在这些领域广泛应用了.
把一般事物整理为广义集合,这为发现分布函数理清了思路.发现一个函数就是找到一种客观规律.我们经常去用一个数学公式模拟一批数据.有一些公式就具有分布函数的含义.某些电脑软件直接从原始资料换算出分布函数(频率分布图),一些计数器设有计算“百分比”的“功能键”.这是分布函数概念得到广泛应用的一种反映.计算不同成分占的百分比就是求分布函数.分布函数的应用领域和百分比一样宽.
系统科学研究“群体”的规律.广义集合和分布函数都是描述群体的工具.它们应当在系统科学中找到广泛的应用领域.分布函数在每个时刻必须有确定值.但是不同时刻的分布函数如果有变化就引出了分布函数的演化问题.史定华[8]提出“密度演化方程”、“密度演化理论”.“密度演化”也就是分布函数的演化.流体力学中研究可压缩流体的密度的变化,它也就是物质的空间分布函数的演化.物质的质量守恒规律就表现为分布函数的演化问题.
分布函数使客观事物的内在关系定量化了,它也是理论联系实际的桥梁和工具.
20世纪后期,复杂性研究受到了广泛注意.在复杂性研究中基本概念的定量化是重要一环.复杂程度的定义就是使复杂性定量化的一种努力.这样的复杂程度由于与信息熵和热力学熵联系着,所以过去的信息熵概念和热力学熵概念的应用都是复杂程度概念的应用.另外,复杂程度概念的明朗化不仅为信息科学、热力学、复杂性研究找到了一个共同的基点.也使它在更大范围的准确应用提供了方便.
复杂程度概念定义在客观事物上,体现了它的客观性和物质性.针对不同层次的物质可以计算出不同的复杂程度.对这些不同的复杂程度的分析本身就是复杂程度概念的应用.
过去,很多人都利用各种数据计算各种含义的平均值,并且做了很多分析.如果对比平均值的计算公式(略)和复杂程度公式(5),可以发现用相同数据(计算复杂程度用的数据实际比计算平均值还少)也可以计算出复杂程度.这也表明复杂程度的应用领域与平均值的应用领域一样的宽.是的,明确了复杂程度概念和计算公式,等着人们做的工作很多.笔者曾[9]用它分析过一些气象学问题.
统计学广泛应用于各个领域.它经常利用大量的观测数据计算频率分布直方图(圆饼图,分布表)或者对应的经验公式.如果工作更深入,还可以检验这个图、表或者公式是否符合某某概率分布的理论公式.
概率论和统计学中经常用到的理论概率分布公式大约有10多个.正态分布、均匀分布、负指数分布、Gamma 等等都是例子.很显然,知道实际数据符合某某理论概率分布我们的知识就深入了一个层次.但是人们也会追问为什么这些数据应当符合某某概率分布而不是别的.遗憾的是现在的概率论没有就此给出统一的说明.
前面已经指出最复杂原理(最大熵原理)可以推求理论的分布函数(概率分布).我们又指出概率分布是分布函数的特例,因而有理由期望常用的概率分布函数可以统一地利用最复杂原理推导出来.
前面给出过斩乱麻的例子,它说明总长度不变的情况(约束条件)下利用最复杂原理应当得到的分布函数是负指数函数.现在仍然依据最复杂原理,配合上不同的约束条件(利用拉哥朗日方法),就得到各种不同的概率分布函数.表7给出了一部分结果.
表7 不同的约束条件配合最复杂原理就得到不同的概率分布函数
|
概率分布函数的名称 |
要求的约束条件 |
1 |
正态分布 |
变量的标准差为固定值 |
2 |
负指数分布 |
变量的平均值为固定值 |
3 |
均匀分布 |
变量出现于给定的区间 |
4 |
幂分布 |
变量的几何平均值为固定值 |
5 |
Gamma分布 |
变量的几何平均值和代数平均值都是固定值 |
6 |
Beta分布 |
变量的对数和(1-变量)的对数为固定值 |
7 |
对数正态分布 |
变量的对数的标准差为固定值 |
8 |
极值分布 |
变量的平均值和变量指数的平均值为固定值 |
如果再利用关于变量的函数的概率分布的理论关系,我们还可以再推导出另外一些概率分布.于是关于常用的概率分布知识就变成一个系统性的知识了[10,11,12].
气象学研究包围着地球的大气的规律性.把广义集合、分布函数、复杂程度概念用于气象领域时可以把很多模糊的气象问题具体化,这也为引用最复杂原理做了技术准备.把①同一时刻包围着地球的全体空气、②某些气象现象和③当地的气象观测数据,分别看作是广义集合,用实际资料分析它(们)的某些属性(标志,例如温度,压力,降水量)具有不同值的情况各有多少,就可以得到对应的分布函数以及它(们)对应的复杂程度.分析这些成果就是很大的任务.用最复杂原理解释它们或者进而(配合其他理论)推测预言大气的短时或者长期变化,是更重要的任务.笔者曾经把这个气象理论的新园地称为“熵气象学”[13].
全球大气是统一的流体.如果把同一时刻的全球大气看作是一个广义集合(总体、群体),把每克(g)空气看作是个体,可以问不同温度(或者不同压力、风矢量、高度、湿度等气象变量)的空气各有多少(g).这个问题的答案构成了大气科学中的分布函数.过去的气象学没有注意这类问题.有了广义集合和分布函数概念以后,这类问题就非常自然地提出来了.利用全球的气象观测数据可以计算这种(些)分布函数.在《熵气象学》[5]中就汇集了一些结果.表8 给出一部分例子.
表8 全球大气的某些重要分布函数
|
标志(属性) |
分布函数的含义 |
分布函数(公式) |
1 |
空气的温度(全球下同) |
不同温度的空气各有多少 |
接近均匀分布(一元) |
2 |
空气的压力 |
不同压力的空气各有多少 |
均匀分布(一元) |
3 |
空气的位能 |
不同位能的空气各有多少 |
负指数分布(一元) |
4 |
空气的湿度 |
不同湿度的空气各有多少 |
负指数(一元) |
5 |
风速的绝对值 |
不同风速的空气各有多少 |
Gamma分布(一元) |
6 |
热能,位能,动能之和 |
不同能量的空气各有多少 |
Gamma分布 (一元) |
7 |
空气的角动量 |
不同角动量的空气各有多少 |
幂分布(一元) |
8 |
空气的温度和压力 |
不同温度压力的空气各有多少 |
?(二元分布函数) |
9 |
热能,位能,动能 |
不同热能,位能,动能的空气各有多少 |
?(三元分布函数) |
10 |
空气位置(经度、纬度、高度) |
不同位置的空气各有多少? |
?(三元分布函数) |
表8已得到了很多大气分布函数的具体公式.这丰富了对大气特征的认识,也说明尽管大气总是在不断地变化着,但是不同时刻的大气的分布函数却是相同的(指几天尺度).发现大气分布函数具有稳定性本身就表示找到了某些守恒性(规律性).
一片云或者一场雨仅存在于大气中的某些地区某些时段.它们也是一类广义集合.针对一场雨可以问:不同的雨量各占了多大的面积,这个问题符合分布函数模型.表9是某些重要事例.
表9 某些大气现象的分布函数特点
|
标志(属性) |
分布函数的含义 |
分布函数(公式) |
1 |
云滴的半径 |
稳定的层云中不同大小的云滴各有多少 |
瑞利分布 |
2 |
雨滴的半径 |
一场雨中不同大小的雨滴各有多少 |
负指数分布 |
3 |
冰雹的半径 |
一场冰雹过程中不同大小的冰雹各有多少 |
负指数分布 |
4 |
降水量 |
一场降水过程中不同雨量的占有的面积各有多少 |
负指数分布 |
5 |
降水强度 |
一场降水过程中不同强度的降雨各占多少时间 |
负指数分布 |
表中的结果都是经过大量的观测数据分析计算而得到的.不同的过程其分布函数中的参数值可以不同,但是公式类型是相同的.为什么会是这样?用最复杂原理可以解释一部分.
根据同一地点的温度(某气象要素)进行长时间的定时观测数据可以推算不同的温度(气象要素)的出现概率.它是分布函数概念的一种变态.这种概率分布在工程设计中很有用.
表10 某地的一些气象要素的概率分布函数
|
气象要素名称 |
概率分布的含义 |
概率分布(公式) |
1 |
温度 |
不同温度的出现概率 |
正态分布为主 |
2 |
气压 |
不同气压的出现概率 |
正态分布 |
3 |
日降水量 |
不同日降水量的出现概率 |
负指数分布 |
4 |
年降水量 |
不同年降水量的出现概率 |
Gamma分布 |
5 |
月平均相对湿度 |
不同湿度的出现概率 |
Beta分布 |
表10给了一些例子.对于不同的地点,该概率分布中的参数值是不同的.
利用气象资料可以得到某种气象要素的概率分布函数,有了概率分布函数就可以利用公式(9)计算它的信息熵.信息熵就代表着当地天气变化的复杂程度.所以分析信息熵就是描述气候复杂性的定量工具.
与复杂程度项联系的信息概念也是计量天气预告的质量优劣的最好指标[14].气象业务主管部门长期对此没有认识.
做好气象预告是气象人员的重要使命.气象预告过程的本质是把已经知道的(过去和现在)气象资料经过某种“运算”而得到未来时刻的气象预告信息.有人为寻找好的运算方法而消耗了毕生的精力.
利用信息知识可以得出结论[15]:使信息增殖的方法是不可能存在. 即气象资料(现在和过去)所含有的关于未来时刻(例如一到十天)的信息如果小于或者等于a(这个值可以计算),那么使信息大于a的运算(预告、变换)方法是不存在的,因而不可能找到一种使气象信息增殖的方法.
“巧妇难成无米之炊、工程师造不出永动机和预告员创造不了“信息”,这三者包含着同样深奥的哲理[16]”.忽视信息规律对气象预告的约束造成了大量的浪费.
为什么大气中存在表8、9、10揭示的规律性?利用最复杂原理和适当的约束条件就可以推导出大气就应当如此.把一场降雨过程理解为有限的雨水被最任意、随机地(复杂程度最大)地洒到一定的面积上,其数学模型就与斩乱麻模型类似,于是不同雨量所占的面积符合负指数分布(表9 )也就十分自然合理了.又如一个特殊变量(位温)的分布函数服从Gamma分布,这是为什么?从表(7)中知道变量的算术平均值和几何平均值如果是固定值(常数),系统再具有随机性,根据最复杂原理,变量只可能是Gamma分布.从气象知识判断,位温的全球的算术平均值和几何平均值为固定值是很合理的约束条件.这样就用最复杂原理解释了该变量为什么服从这种分布[17].
不同的体重的学生各有多少?这是分布函数问题.面对全球大气,我们问:不同位置(经度、纬度、高度)的空气各有多少?这就是求单位体积内大气质量(密度)在空间中的分布问题.所以大气密度的空间分布也是一种分布函数.由于大气应当符合最复杂原理,笔者就利用它推出了一个大气密度方程[18].这个方程应当用到气象预告中.