时间:2023-09-07 09:19:01
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇测度论在统计学中的应用,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
目前在一些高校培养研究生教育过程中侧重知识的传授而忽视学术道德素质的培养,这就使得研究生缺乏学术规范意识造成一些不容忽视、甚至较为严重的学术不正、学术道德失范、学术腐败的现象.这些现象存在于学术活动的各个环节,表现形式多种多样,性质也不尽相同,如学风浮躁、急功近利、粗制滥造、弄虚作假、剽窃抄袭、学术交易、滥用他人成果、学术评审不公等.研究生学术造假的客观原因主要是指毕业压力、就业压力和功利目的.的数量或质量不达标,不能获取奖学金,不能毕业.那些想要按时毕业,却又不愿意踏踏实实静下心来做研究的学生,往往心存侥幸,把别人的文章进行简单拼凑,甚至直接照搬照抄别人的研究成果,企图蒙混过关.为了获取奖学金和各种奖励、荣誉,有些学生也选择造假.对研究生来说,奖学金的评审和表彰奖励的评定,也是与的数量和质量密切相关的.因而,一些研究生东拼西凑,盲目追求论文的数量.国内有些期刊,只需交纳版面费而不需严格的审稿流程就能,也助长了学生的这种做法.
概率论与数理统计专业研究生教学改革措施:
1控制招生规模,改善办学条件
在招生时,要充分评估本校现有软硬件资源,考虑资源的承受能力,严格控制招生数量.高校应当加大对教学基础设施的建设投入,改善办学条件.尽快建立与研究型大学相匹配的研究生教学大楼、实验大楼,为研究生的教学和学习提供有力的物质保障.此外,高校还应当加强导师队伍的建设.因为导师的质量直接决定了研究生的质量.学校要把好导师遴选的质量关,做好导师的岗前培训和考核,建立一支能体现本学科特色的学术梯队、学术团队,对有突出贡献的导师实施物质奖励,对那些不负责、考核不合格的导师实施严厉的处罚措施,必要时可以废除导师终生制.
2更新课程内容,突出前沿性
教材建设必须突出概率论与数理统计学科的特点.按应用程度不同,可把学科分为基础学科和应用学科两大类.对于基础学科的教材应注重理论基础,在理论的难点上能激发学生的想象力和创造性思维能力,概率统计专业研究生必须具备扎实的理论基础;而对于应用学科的教材应注重理论和实践相结合能力的培养,诱发学生的实践兴趣,指导学生的实践操作,启发学生在实践中发现问题,解决问题,提高创新能力.例如《随机过程》教材可选用应坚刚和金蒙伟编著的建立在测度论基础上的教材《随机过程基础》,《高等数理统计》可选用茆诗松等编著的教材《高等数理统计》.必须指出的是,这些教材内容也比较陈旧,缺少一些新的前沿研究动态.所以教师在授课时,应一方面对经典内容加以精选,减少重复;另一方面要运用新的研究成果对经典内容进行创新处理,引导学生进入科研的前沿阵地.数理统计学教材应强化计算机运用统计软件的能力,将数据的收集、分析、综合的概念贯穿始终.
3推行研究型教学方法,开展学术讨论班
研究型教学是以研究、讨论为基本特征的一种教学活动.这种教学模式是在教师的指导下进行,以学生自主学习和课堂讨论为前提,以教学中的重点、难点内容、有争议的学术问题或学术前沿热点问题为研究内容,通过学生查阅资料、独立钻研展开课堂讨论和交流,从而激发学生的学习热情,调动学生的创新欲望,而达到教学目的的一种教学方法.这种教学方法可充分调动研究生课堂学习兴趣,发挥学习的主观能动性.研究生学习的目的是创新.高远辽阔的思维空间、自由轻松的学术环境和开放活跃的思维状态是创新的理想条件.而讨论班就是在一种宽松随意的氛围下对学术热点问题各抒己见,使思想在碰撞中产生火花,从他人的见解中获得启发、拓展研究思路.导师可以将研究生按照不同的研究方向分成若干个研究小组,小组内不定期进行学术讨论活动,而且不同研究方向的研究生也可以相互交流借鉴,取长补短.这样不仅能使不同研究领域的思想和方法得以相互借鉴,提高研究水平,而且能避免工作的重复和人力资源的浪费.学生在认真阅读文献的基础上,对所读文献进行归纳、总结、提炼、整理并写出读书报告,然后在讨论班上讲解,师生之间展开互动讨论.这样可以营造浓厚的学术氛围,培养学生提出问题、分析问题和解决问题的能力,从而提高研究生的科研能力.
4深化课程体系,开设交叉学科课程
概率统计专业研究生的知识不应局限于自己或导师研究课题的一个狭窄范围,而应当对本学科的历史、现状及发展趋势,对本学科和相关学科比如基础数学、应用数学、运筹学、计算数学及应用领域的关系有比较清楚的认识,改变孤立的知识系统和专而不博的知识结构.具体到课程设置上就应该减少专业必修课,增加与专业相关的选修课,进一步拓宽研究生视野,培养基础宽厚、能适应社会各种需要的高层次人才.例如概率论与数理统计专业研究生必修课程可设《泛函分析》、《测度论》、《随机过程》、《高等数理统计》.此外,现代社会需要的是具有综合素质的复合型人才,因此需要通过多学科的教学,实现跨学科、跨学院的课程设置,使学生掌握各方面的知识和技能,以更好的适应社会和未来工作的需要.例如可设置如下交叉课程:计量经济学、金融工程,金融统计学,生物统计学,遗传统计学,计算统计学,模式识别,机器学习、数据挖掘,可靠性工程,物流供应链网络,计算机网络等.
关键词:数学方法;情报学;数学思想;数学模型
1、 引言
数学方法的运用是现代科学研究的主要特征之一,学术界甚至出现了这样一种倾向:以数学方法的运用程度作为科学研究研究水平的评判标准。情报学由定性研究走向定量研究,数学方法越来越多地被引入情报学研究。[1]
由国防科工委情报所八室编科技文献出版社1988年12月出版的《情报数学》是中国最早论述情报科学技术和数学之间的结合部的一本专著。[2]
数学这是所有学科中的基础的学科,如果哪门学科没有加入数学很难说其已经建成了真正的科学。因此,数学方法对于图书馆学情报学理论、方法、实践领域以及所拓展的研究方向,都发挥着不可替代的作用。[3]
2、 数学方法在情报学中的应用
2.1计量学
计量学是情报学领域最为常用的数学方法之一。1934- 1960年是文献计量学的奠定时期。这一时期的研究比较注重理论研究与规律的发现。献计量学中大量的规律和定律都是在这段时间内提出的, 其中包括文献计量学中著名的三大定律中的布拉德福定律和齐普夫定律。在此阶段, 除了对文献计量学的基本规律进行了研究以外,还对其他规律进行研究。例如文献的引用规律、文献的增长规律及文献的老化规律。之后,又有许多文献计量学的概念、规律和方法被提出。从科学引文索引的发行以来, 从实际应用的角度计量学分成两种类型类型: 评价类和关联类。
计量学很好地利用了数学的思维方式,即运用数和量来发现事物的规律和联系。
2.2集合理论
假如一个系统可以划分成N种类别,并且各个类别之间的关系可以被清楚地表达出来,那么这个系统就能很方便地建立起一个集合模型,例如集合论在的主题词系统中的应用。
情报集合是一个集合,由许多条情报组成。也就是说一条条情报便是集合中的元素。实际上每条情报也是一个集合,它是由一个个概念词组合而成。为著录和查询情报而编制的主题词索引也组成一个主题词集合。主题词集合与对应的情报集合存在着一定的对应关系,即存在一个映射F,能够完成主题词集合到情报集合的映射。
2.3模糊数学
模糊数学又被叫作Fuzzy 数学,是用于研究和处理模糊性现象的一套数学理论和方法。它是模糊拓扑、模糊测度论等数学领域的统称,是在模糊集合、模糊逻辑基础之上发展起来的一种数学工具,用来研究现实世界中许多界限不明确以及存在模糊性 的问题的。
情报学领域存在大量模糊现象,仅靠随机数学和明确数学方法很难解决所有问题。模糊数学的引入提供了很好的视角。情报学领域经常采用的模糊数学的方法包括模糊算法,模糊匹配,模糊评价法,模糊聚类,模糊推理,模糊加权等。模糊数学在情报学中的应用,如信息检索的动态模糊聚类现象,可以使用模糊数学理论和方法描述作出模糊判断。模糊数学在该领域迅速地应用,显示出独特功能。如建立网络信息聚类的模糊模型。
2.4概率论与统计学
统计学是一门相对综合的科学,主要是通过搜集、整理、分析等技术手段达到推断所测对象的本质,甚至能预测对象未来的科学,在此过程中运用大量的数学及其它学科的专业知识,它的使用范围极广泛,几乎覆盖了社会科学和自然科学的各个领域。统计学在情报学领域的应用跟计量学有时候不太好区分,但是两者的应用领域还是比较明显的。统计学在医学情报学这个大的情报学分支上应用相对较多,而且也已经相当成熟。在处理情报的过程中的遇到的事件大多为随机事件,比如情报用户需求,情报的分布情况等。对于研究这种类型的问题,常采用数理统计方法。情报数理统计分析包括多种分析方法,例如情报分布统计分析,情报用户需求的统计分析,情报统计分析与预测,建立情报检索概率模型等。一般可将概率论和数理统计方法结合来进行处理,目的是可以看出变动的趋势,并且可以计算出各种可能出现的结果的比例和分布。例如情报分布情况的概率统计模型,情报检索系统的概率统计模型等。[4]
2.5线性代数
向量常常用来描绘与多个因素有关的一个问题,而矩阵描述的是与多个因素有关的一组问题, 其中最特殊的问题是线性代数中的线性方程组问题。
情报学中对于类概念词(包括主题词、关键词、标引词、类名等)的组配规则, 它们之间存在的多维性及它们因整体所显示的某种线性空间的性质的重视, 是矩阵理论与向量理论运用到情报工作中的前提条件。因为情报工作中亦存在着多维概念空间, 或者说存在着需要通过多个因素的量进行描述的问题, 这为线性代数应用于情报工作创造了最为坚实的基础。矩阵和向量在情报学中的应用主要是在计算机检索, 线性代数方法既是计算机检索系统模拟方法之一, 也是计算机扩检和缩检的手段之一。 情报检索系统采用的矩阵向量模型改进了传统检索的思路, 检索速度更快, 检索效率更高。线性代数方法还用于解释和预见情报活动中的实际具体问题,如著名的普莱斯指数增长模型,引文检索系统中的矩阵向量。[5]
3、 数学方法在情报学应用的发展趋势
首先,新的理论成果与新的方法渗透到情报学的研究工作中。数学方法作为一种研究方法适应各种科学研究的特点,最重要的是数学中的各种理论方法不断吸收自然科学研究中的新成果来完善自身。[6]
其次,定性和定量方法相结合。定性方法和定量方法相结合的研究方法日益成为情报学研究方法的主流,数学方法能够有效地把两种方法有机地结合起来。由定量分析上升至有相对数量依据的定性判断,最终形成具有足够根据的科学结论。
第三,利用计算机辅助建模及模型求解是发展的新趋势。情报系统涉及的因素、变量经常是众多的,有时计算量之大超出人的能力。计算机计算速度快、信息储存量大、计算结果准确的特点,特别是专业性软件的开发与应用可帮助研究者处理复杂问题。(作者单位:吉林大学管理学院)
参考文献:
[1]刘达. 情报学的新领域——情报计量学[J]. 情报学刊,1981,04:48-51.
[2]张芝兰. 《情报数学》[J]. 图书情报工作,1989,05:30.
[3]赖茂生. 数字化时代的情报学[J]. 图书情报工作,2007,04:25-29.
[4]马喜武. 数学方法在图书情报学中的应用[J]. 吉林农业科技学院学报,2007,04:63-64.
关键词:统计测度;统计学;大数据;数据科学;
作者简介:李金昌,男,50岁,浙江义乌人。浙江财经大学校长,统计学教授,博士生导师。研究方向为经济统计学,统计理论与方法,抽样技术,政府统计等。
最近两年,统计学界对大数据问题所进行的理论探讨逐渐增多,视角也各有千秋,引起了一些共鸣。围绕大数据问题,由统计学、计算机科学、人工智能、数学等学科共同支撑的数据科学开始形成。但大数据毕竟是一个新课题,因此远未达到对其有一个系统完整的认识,仍然需要从不同的方面加以研究,其中有一个重要但又容易被忽视的问题,即统计测度问题,值得去探讨。
一、什么是统计测度
汉语上,测度是指猜测、揣度、估计。数学上,测度是一个函数,它对一个给定集合的某些子集指定一个数,这个数可以比作大小、体积、概率等等。通俗地说,测度把每个集合映射到非负实数来规定这个集合的大小:空集的测度是0;集合变大时测度至少不会减小(因为要加上变大的部分的测度,而它是非负的)。
除了数学角度的测度论,查阅国内文献资料,带有测度这个词汇的文献不少,但专门针对统计测度(或测度)内涵的讨论几乎没有。一些对社会经济现象进行分析测度的文献,例如新型工业化进程测度、货币流动性测度、全面小康社会发展进程测度、收入分配公平性测度、技术效率测度、人力资本测度、金融风险测度、产业关联测度等等,所做的测度都是再测度,均不对测度本身进行讨论。查阅国外文献资料(关键词:measurement),也同样存在这样的问题,只能收集到一些比较零散的表述。LudwikFinkelstein(1975)[1]认为,在我们对事物或现象进行描述时,测度可以被定义为对现实世界中某一现象的个体属性或特征进行量化的过程。JamesT.Townsend和F.GregoryAshby(1984)[2]认为,如果按照极端的观点,那么统计分析中的基本测度理论的含义仍然是存在争议的。LudwikFinkelstein(2003)[3]指出,测度在那些原来尚未得到卓有成效或广泛应用的领域,也已取得了明显的进步,社会、政治、经济和行为科学正在更大程度地利用定量技术;测度是现代思维的一种实际有效的工具,是我们借以描述世界的一种方法。GiovanniBattistaRossi(2007)[4]认为,用以表示测度结果的,是数字或者数字符号。LucaMari(2013)[5]认为,测度的基础特征是被公认为世界上获取并正式表达信息的基本方法,这让它成为一种跨学科的工具。LudwikFinkelstein(2014)[6]指出,在自然科学技术中,测度的重要性不可否认,它是科学调查和发现必不可少的工具,它可将宇宙中的复杂现象用精确、简洁和普遍的数学语言来描述。
那么,到底什么是统计测度呢?目前没有一个统一的定义。本文认为,统计测度具有不同于测度的意义,并且大大超越数学上的界定,即它具有数学定义的一般属性,但又不受制于函数表现形式,因为统计测度所要面对的是现实世界,实际问题要比理论上可以定义的问题复杂得多。按照我们的理解,统计测度就是用一定的符号和数字,用一定的形式和载体,对所研究的现象或事物的特征进行量化反映,表现为可用于统计分析的数据的过程。它应该具有这样一些属性:以实际现象为测度对象,测度结果具有实际意义;以量化为目的,把信息转化为数量,提供人们容易理解的定量结论;个体特征的测度符合形成总体定量结论的要求,同时能够体现个体差异。可以发现,统计测度需要借用数学工具,但更重要的是对具体测度现象本质特征的认识和掌握。
统计测度可以从若干不同角度进行分类。邱东教授(2012)[7]曾在“宏观测度的边界悖律及其意义”一文中,从边界的角度对宏观测度进行了分类:一是因事物本身可测度性而形成的边界,即本体论意义上的测度边界;再一是由人的认知能力而形成的边界,即认识论意义上的测度边界;第三则是由统计相关性偏好和投入约束而形成的边界,即操作意义上的测度边界。这三条测度边界,应该以本体论意义的测度边界最大,认识论意义的测度边界次之,而操作意义的测度边界最小。这样的分类,对于我们正确理解统计测度的内涵很有帮助。受此启发,笔者认为统计测度还可以有如下分类:
1.从测度的实现形式看,可以分为原始测度和再测度。原始测度也可以称为直接测度,它通过对测度对象进行直接测度来获取数据,例如清点库存物品数量、丈量作物播种面积、观察培育细菌数目、检测药物成分等获得的数据,以及各种登记、记录的原始数据等等。再测度也称为间接测度,它以其他已知的测度数据为基础去计算、推算或预测所需的未知数据,例如根据GDP和人口数测度人均GDP、根据人口普查分年龄人口数据测度老龄化系数和社会负担系数、根据相关指标数据测度CPI的变化等等。复杂的再测度则需要借助相应的统计模型作为工具,因为它实际上是对相关变量之间的关系进行定量反映。从两者关系上看,原始测度是基础,是根本,没有科学的原始测度就不会有可靠的再测度;再测度则是测度功能提升的必然要求,以解决原始测度不能解决的问题。
2.从测度的计量方式看,可以分为自然测度、物理测度、化学测度、时间测度和价值测度。自然测度是利用现象的自然属性所进行的一种统计测度,例如人口规模、企业数量等的测度,采用自然计量单位;物理测度是利用现象的物理属性所进行的一种统计测度,例如公路长度、作物播种面积、天然气产量等的测度,采用物理计量单位;化学测度是利用现象的化学属性所进行的一种统计测度,例如医学、生物学中化学合成物的成分结构测度,采用百分数、千分数或特定标识为计量单位;时间测度是利用现象的时间属性所进行的一种统计测度,例如劳动用工、闲暇时间等测度,采用时间计量单位;价值测度是利用现象的价值属性所进行的一种统计测度,例如劳动报酬、经济活动成果等测度,采用货币计量单位。在这些测度计量方式中,价值测度因最具有综合功能而应用最为广泛。
3.从测度的方法看,可以分为计数测度、测量测度、实验测度、定义测度和模型测度。计数测度是一种通过观测计数来获得数据的方法,最为简单,一般用于自然测度或时间测度;测量测度是一种根据物理或化学规制对现象进行测量、测算来获得数据的方法,一般用于物理测度或化学测度;实验测度是一种按照科学实验原理、通过观察实验对象在既定条件下的反应来获得数据的方法,一般与测量测度相结合,用于获取科学研究数据;定义测度也可以称之为指标测度,是一种通过探究现象的本质特征和活动规律、归纳出表现其数量特征的范畴、给出统计指标定义(包括内容、口径、计算方法和表现形式等)来获取数据的方法,最常用于价值测度,也用于其他形式的测度。可以说,定义测度方法应用最为广泛,但也最为困难。模型测度是一种根据现象与现象之间的内在联系关系、或者现象自身的发展变化规律,通过建立一定的方程模型来获取数据的方法。前面三种统计测度方法基本上都属于直接测度,定义测度既可能是直接测度、也可能是间接测度,而模型测度都属于间接测度方法。
4.从测度的维度看,可以分为单一测度与多维测度。单一测度是指采用单一的方式方法对所研究现象或事物进行单一角度的测度,获得单一的数据。多维测度是指对所研究现象或事物进行多角度的测度,测度过程中可能需要采用多种测度方法和计量方式,例如多指标综合评价就需要借助统计指标体系对评价对象进行多角度的测度。显然,单一测度是多维测度的基础。
二、统计测度是统计学的立足之本
首先,从统计学的发展历史看,是统计测度使统计学破茧而出。为什么主流观点认为政治算术是统计学的起源而不是国势学?正是因为威廉·配第首次采用统计测度的方式进行了国家实力的统计分析和有关推算,得出了令人信服的结论。威廉·配第在1693年出版的《政治算术》[8]中写道“因为和只使用比较级或最高级的词汇以及单纯作思维的论证相反,我却采用了这样的方法(作为我很久以来就想建立的政治算术的一个范例),即用数字、重量和尺度的词汇来表达我自己想说的问题,只进行能诉诸人们的感官的论证和考察在性质上有可见的根据的原因”,这一观点在统计学的发展过程中产生了非常重要的影响。他的这段话虽然没有出现测度一词,但却道出了测度的本质,即让事物变得明白、变得有根据,因为“数字、重量和尺度”就是测度、就是根据,用“数字、重量和尺度的词汇来表达想说的问题”就是一种测度的思想,尽管测度的方式方法还很简单。相反,国势学虽然提出了归纳法这一统计学的基本方法并首创了统计学一词,但由于没有采用统计测度的方式进行国势问题的研究而难以修成正果。正如邱东教授[7]所说:“在配第之前,统计学的研究对象虽然是国家的态势,但它在方法论上只是定性言说。一个国家的财富总量在本体论意义上是可以测度的。然而只是到了配第时期,人类才想到了要测度它,并发明了如何测度的基本方法。政治算术,即开创期的经济统计学,实现了从无到有的转变,大大扩展了宏观测度的认识论边界,因而才具有了统计学范式创新的革命性意义。”同样,格朗特的《关于死亡表的自然观察和政治观察》也是人口统计测度方面的经典之作,无论是原始测度还是再测度,都给后人留下了宝贵的财富。之后,统计学就是沿着如何更加科学、准确测度世界这一主线而发展的。笔者曾在“从政治算术到大数据分析”一文[9],对数据的变化与统计分析方法的发展进行了粗浅的归纳,其主题实际上就是统计测度问题。
其次,从统计学的研究对象上看,统计测度是体现统计学数量性特征的前提条件。统计学的研究对象是现象的数量方面,或者说统计学是关于如何收集和分析数据的科学。统计数据从何而来?从统计测度中来。数据不同于数字,数字是统计测度的符号,数据是统计测度的结果,这也正是统计学区别于数学之处。所以说,数据的本质问题就是统计测度问题,故此统计测度是统计学的基本问题。这里重点讨论两个问题:一是统计测度与统计指标的关系,二是统计测度面临的新问题。关于第一个问题,本文认为统计测度与统计指标是一个事物的两个方面,这个事物就是数据。统计指标法是统计学的基本方法之一,尽管前面对统计测度从方式方法上进行了分类,但从广义上说所有统计测度都是定义测度,都表现为指标。也就是说,任何统计测度———不论是直接测度还是间接测度,最终目的是获得能够让人明白的数据,而表现数据的最主要形式就是统计指标,其他表现数据的形式都是派生出来的。所以,统计测度就是根据所设定的统计指标去获得所需的数据。关于第二个问题,与后文所要论及的大数据有关,就是定性测度问题。在统计学中,数据可以分为两类———定性数据与定量数据,其中定性数据又包括定类数据与定序数据两种,它们属于非结构化或半结构化数据。相应地,统计测度也可分为定性测度与定量测度。很显然,只有定性测度与定量测度方法得到同步发展,统计学才能更加完善。总体上看,定量数据的统计测度已经比较完善,但定性数据的统计测度还有很多问题尚待解决,难点就在于测度的切入点———如何提取有效的信息、如何最终转化为统计指标。尽管关于定性数据分析的论著已经不少,但还没有从理论方法上建立起定性数据统计测度的体系,因此统计学在这方面的任务依然很重。
第三,从统计学的永恒主题看,通过科学的数据分析、得出有效的结论是其不变的追求,而数据分析过程就是综合的统计测度过程。获得数据的目的是为了发现隐含其中的有价值的信息,即发现数据背后的数据,让数据再生数据,从而满足人们认识事物、掌握规律、科学决策的需要。除了总量、结构等基本信息外,更重要的是通过数据分析来呈现现象的变化规律与相互关系。不难发现,这种数据分析的过程,就是不断进行各种统计测度的过程,所以最终的统计分析结果实际上就是各环节、各方面的各种类型的统计测度的叠加结果,或者说是统计测度不断放大的过程。大量针对社会经济现象进行分析研究的文献(不论是否冠以“测度”两字),只要有数据分析,都是如此。可以说,统计测度贯穿于统计数据分析的全过程。但是,为什么很多统计数据分析并没有得出有效的结论呢?本文认为原因就出在统计测度上,尤其是没有首先解决好原始统计测度问题。应该说,围绕数据分析已经建立起一整套比较完整的统计方法体系,很多方法也都身经百战、行之有效,但一旦原始统计测度有问题、数据不准确或不真实,那么任何方法都只是摆设。仔细研读很多所谓的实证分析文献,其重点均在于构建什么样的模型或运用什么样的方法,虽然有的文献也必须要讨论选择什么样的变量(指标)这个问题,但并不是系统地从测度的角度进行阐述,因此所用的模型越来越复杂,但所得的结论却离实际情况越来越远。学界总是有这样一种观念:变量越多、符号越新奇、模型越复杂的文章才越有水平,似乎这样分析所得的结论才越可靠。殊不知,不以科学可靠的原始统计测度为基础,任何数据分析都会成为无源之水、无本之木,所得的结论也只是更精确的错误而已。本文认为,任何脱离科学统计测度的统计分析都是毫无意义的,充其量是一种数字游戏而已。应该树立这样一种观念:科学的统计数据分析首先取决于科学的统计测度,而不是首先取决于什么样的分析模型,虽然模型也很重要。这也再一次证明,统计测度问题是统计学的根本问题。其实,归根结底看,在统计数据分析过程中,每一步分析都以前一步的测度为原始测度,每一步所用的方法都是统计测度方法,因此所有的统计分析方法都是统计测度方法。甚至可以说,统计学方法体系就是统计测度方法体系。
当然,在实际的统计分析中,统计测度往往遇到一些困难,即有些指标数据由于各种原因无法获得,这就不得不采用替代这种途径。例如,绿色GDP核算的概念已经提出很多年,但为什么还没有哪个国家真正公布绿色GDP数据,原因就是自然资源价值、生态环境价值等的统计测度目前还面临着很大的困难,其背后存在着一系列有待进一步研究和解决的理论与实践问题,因此不少学者进行了替代测度的探讨。这一方面说明统计测度的重要性,另一方面说明统计测度替代的无奈性。但是,替代测度必须遵守相应的规则与逻辑,要经得起推敲。有的文献明明知道有关变量无法测度、有关数据无法获得,却随意地、不符合逻辑地进行所谓的替代,结果是最后的结论不知替代成什么样了,很难理解它的意义。关于替代测度的有效性问题,邱东教授[7]已有精辟的论述,在此不再展开讨论。
三、统计测度是数据科学的基础
笼统地讲,数据科学就是以大数据为研究对象的科学,需要多学科交叉融合、共同支撑。由于大数据是快速增长的复杂数据,因此大数据分析仅有统计思维与统计分析方法是不够的,还需要强大的数据处理能力与计算能力。只有把统计思维、统计方法与计算技术结合起来,才有可能真正挖掘出大数据中的有价值信息。本文认为统计思维、统计方法与计算技术相结合的基础就是科学的统计测度。
首先,大数据技术不能自行解决其计算和分析应从何处着手的问题。现代信息技术与互联网、物联网技术的快速发展,使人类进入大数据时代,也有人说进入到数联网时代,这意味着我们一方面被各种越来越多、越来越复杂的数据所包围,另一方面又被数据中巨大的信息价值所吸引,想从中挖掘出可供决策之用的信息。如何挖掘大数据?人们已经进行了艰苦的探索,发展了很多专门的方法技术,并已尝到了不少甜头,但远未达到充分利用大数据中有效信息的目的,因为已有的大数据分析研究主要集中于计算机科学与技术、软件工程、计算数学等领域,重点是计算能力与算法研究,而很少从统计学的角度进行有针对的探讨,还没有真正进入数据分析的深层。这里面实际上忽略了最基础的统计测度问题。如果说,计算技术的发展能够解决数据储存与计算的能力问题,算法模型的改进能够解决大数据分析的综合能力问题,那么它们仍然不能解决对谁进行计算与分析的问题,也即从何处着手的问题。无论是传统的结构型数据,还是现在的包含大量非结构型数据的大数据,要对它们进行分析都必须找到正确的切入口,即分析的基本元素是什么,或者说需要测度什么。当然,还有如何测度的问题。然后,才能进行分组、综合和构建模型,否则大数据分析不会达到人们的预期。
其次,大数据之所以催生数据科学,就是为了通过多学科交叉融合来共同解决大数据分析中存在的问题,其中包括统计测度问题,这一点对于非结构化数据尤为突出。实际上,大数据的本质就是非结构化数据,一是体量大、比重高(超过95%),二是变化快、形式多,三是内容杂、不确定。通过各种社交网络、自媒体、富媒体,以及人机对话和机器感应记录等产生的各种非结构化数据,例如各种文字、各种表情符号、各种声音、各种图像,到底表示什么?综合在一起能体现什么规律?如何综合各种信息?存在着大量有待研究的问题。其实,文字的长短、用词、表达形式(叙述式、议论式、散文式、诗歌式,等)甚至字体大小与颜色,表情类型与偏好,声音高低、频率与情绪,图像颜色等等,都是有特定意义的,即在特定环境条件下的反应。所以,一句话或一段声音的意义并非文字本身的意思,一个表情符号的意义并非符号表征的意思,一个图像的意义并非图像内容与色彩本身的意思,因为背后有太多的未知。人们浏览检索各种信息的习惯、收看与回复邮件等信息的习惯、参与信息网络的习惯、购物习惯与支付习惯等等,也是如此。更何况,同样的网络词汇在不同的时间代表着不同的语义。这背后隐藏着的是人们的行为与社会关系,既具有个性又具有共性,极其复杂。所以对这样的数据进行分析,首先绝非是计算问题,也不是用什么模型问题,而首先是从何处着手、如何选取关键词、如何选定关联词、可以用什么样的指标来综合、可以用什么样的表式来表现等问题,一句话就是统计测度问题。非结构化数据的统计测度将主要是定义测度,这些问题不解决,分析模型也是难以构建的,或者难以得出令人信服的结论。
例如,关于《红楼梦》前80回与后40回是否同一作者的争论,韦博成[10]进行了综合性的比较研究并提出了自己的观点,他指出已有美国威斯康辛大学华裔学者陈炳藻教授(1980)[11]、我国华东师范大学陈大康教授(1987年)[12]和复旦大学李贤平教授(1987年)[13]等学者从统计学的角度进行过专门的研究,但却得出了不同的结论:陈炳藻教授认为前80回与后40回均是曹雪芹所著;陈大康教授认为前80回与后40回为不同人所著;李贤平教授认为前80回是曹雪芹根据《石头记》增删而成,后40回是曹雪芹亲友搜集整理原稿加工补写而成。此外,还有其他一些学者进行过类似的研究,也有一些不同的结论。为什么都通过提取关联词和统计的方法却得出不同的结论?原因就在于用以分析的关联词不同,即统计测度的切入点不同,当然也有统计方法上的差异,但前者是根本。至少存在几个统计测度上的问题:提取单一维度的关联词还是多维度的关联词?提取什么类型的关联词(例如:关联词是名词、形容词还是动词;是花卉、树木、饮食、医药还是诗词)?这些关联词可以综合为什么样的指标?等等。由此可见,原始统计测度代表着数据分析的方向。
相比《红楼梦》,大数据分析要复杂得多、困难得多。所以,数据科学除了需要数学、统计学、计算机科学与技术、人工智能等学科的交叉融合外,还需要与行为科学、语言学、社会学、经济学等学科相结合,以便能很好地解决作为数据分析之前提的统计测度问题。
第三,数据科学将进一步拓展统计测度的边界,并提出更高的要求。伴随着人类认识世界的范围的不断拓展,统计测度的范围也不断扩大,从自然现象统计测度到人口现象、经济现象统计测度,再到社会现象、环境现象、政治现象等统计测度,几乎已经渗透到了所有可以想象到的领域。相应地,统计数据分析也从少量数据的分析进入到了大数据分析。大数据的复杂性、不确定性和涌现性(王元卓等,2013)[14],意味着统计测度的内容大大增加,原来一些不能测度的数据被纳入到了统计测度的范围,按照邱东教授的说法就是统计测度的边界大大扩展了。统计测度边界的扩大,必须以统计测度能力的提升为前提,即要求统计学借助现代信息技术进一步提升处理和分析数据的能力———对大数据“化繁为简”、“变厚为薄”的能力,这就必须以科学准确的大数据统计测度为前提,既改变统计思维,又创新统计分析方法,其中就包括统计测度思维、统计测度方法与统计测度标准。面对大量繁杂的数据,如果没有更好的统计测度思路与方法,包括个体标志定义方法、最小数据细胞分组与聚类方法、关联词含义的时间影响计量方法、定性测度指标筛选方法、再测度路径与方法、大数据统计测度评价标准等,那么统计学在数据科学发展过程中就难以发挥应有的作用,数据科学也将裹足不前。这就是统计学迈向数据科学的重要挑战之一。
综上所述,统计测度的基础性问题从统计学延伸到了数据科学,是两者的共同基础,并且对于数据科学而言显得更为重要。大数据的复杂性、不确定性和涌现性导致了统计测度的难度猛增,亟需建立面向大数据分析的统计测度理论与方法。要通过研究大数据的复杂性、不确定性和涌现性特征的基本因素,以及这些因素之间的内在联系、外在指标和测度方法,进而研究基于先进计算技术的大数据度量模型,构建寻找面向计算的数据内核或者数据边界的基本方法。总之,建立有效易行的数据表示方法,即科学的统计测度方法,是数据科学必须解决的基础问题之一。
四、创新与完善大数据统计测度方法
如前所述,统计学研究对象已经从结构化数据延伸到了包括非结构化数据在内的一切数据,统计测度边界得到了大大的扩展。按照邱东教授[7]曾经引用过的海德格尔的话:“界限并不表示某一事物的发展到此为止,而是像希腊人所认知的那样,界限是某种事物开始展现的地方”,预示着统计学在数据科学发展阶段的新起点已经展现在我们面前。新的统计测度边界催生统计测度方法的创新,统计测度方法的创新促进统计测度边界的拓展,两者相辅相成,共同推动统计学与数据科学的发展。为此,我们要系统梳理统计测度方法的发展历程,面对大数据提出的新挑战,大胆探索统计测度的新思路、新理论和新方法,为数据科学奠定坚实的统计学基础。为此提出如下几点建议:
首先,要紧密结合现象的本质去探求更科学的统计测度方法。本质决定一切,既然统计测度的目的是获得客观反映现象本质的数据,那么深入到现象本质、认识和掌握现象的本质,是科学统计测度的关键,也是探求新的统计方法的出发点。换句话说,科学的统计测度方法能够体现出数据的真正意义。例如,要探求社交网络数据的统计分析和测度方法,就必须了解社交网络的产生背景、构成要素、表现形式与基本特征,既要研究它的共性问题,又要研究它的个性问题与差异性,同时还要研究它的变化趋势。只有这样,才能掌握社交网络数据的构成要件或元素,才能建立起科学的、能有效体现社交网络数据意义的统计测度方法。再如,要分析研究电子商务数据,也必须先弄清楚什么是电子商务,尤其是弄清楚它与传统的商业模式有什么不同(包括物流、资金流与信息流)、有哪些新生事物(包括时空特征、法律监管)等等,否则统计测度无从下手或者抓不住要害。同时,作为一个新的研究领域,数据科学的理论基础将与计算机科学、统计学、人工智能、数学、社会科学等有关,离不开对相关学科领域知识与研究方法的借鉴,因此对相关领域的知识与研究方法的学习十分重要。否则,就会严重扭曲统计测度方法,胡乱设置测度标志,这需要引起高度关注。
其次,要紧密结合大数据的特点去创新统计测度方法。大数据的特点是复杂性、不确定性和涌现性并存,构成了多维的数据空间,里面蕴藏着丰富的信息资源,这是传统的统计数据不可比拟的。那么该从何处进入这样的数据空间?怎么进去?又怎么出来?这归根结底还是统计测度方法问题。因此,在开展大数据分析之前,首先要研究大数据的基础性问题,包括大数据的内在机理(包括大数据的演化与传播机制、生命周期),数据科学与社会学、经济学、行为科学等之间的互动机制,以及大数据的结构与效能的规律性等等,为创新统计测度方法提供导向。本文认为,再复杂的数据也有共性,再不确定的数据也有规律,再涌现的数据也有轨迹。网络大数据背后的网络平均路径长度、度分布、聚集系数、核数、介数等具有共性的特征与参数,是开展复杂网络数据分析的基础(李国杰、程学旗,2012)[15];大数据在时空维度上的分布形式、内在结构、动态变化和相关联的规律,是找到大数据分析切入口、进而简化大数据表征的前提;大数据的涌现性轨迹(包括模式涌现性、行为涌现性和智慧涌现性),是研究更多的社会网络模型和理解网络瓦解失效原因,理解人们网络行为涌现特征(例如人们发邮件数量的时间分布特征),以及探求大量自发个体语义融合连接形成有特定意义的通用语义之过程的路径(靳小龙等,2013)[16]。也就是说,这些共性、规律和轨迹就是统计测度的主要依据,也是重点内容。发展和创新能够准确发现大数据的共性、规律和轨迹的定量方法,其实就是发展和创新大数据统计测度方法。
第三,要紧密结合现代信息技术以完善统计测度方法。复杂、多变和不断涌现的大数据,不仅需要借助现代信息技术(包括硬件与软件)来解决极其复杂的分析计算问题,也需要利用现代信息技术来解决其繁杂多样的统计测度问题。对于大数据,不论是原始统计测度还是再测度,其复杂性或难度都不是传统的结构化数据所能相提并论的,哪怕是基本的关联词计数、分类与汇总,其工作量之大也超乎想象,不借用现代信息技术几乎是不可能完成的。而事实上,有些统计测度的内容与方法本身也是以数据处理能力的提升为前提的。可以说,脱离现代信息技术,人们难以承受大数据的统计测度与分析任务;要把统计测度思想变为可实现的统计测度方法,必须借助现代信息技术。为此,要充分利用各种信息技术和手段,把统计测度与数据清洗相结合、与数据分析模型相结合、与计算方法相结合,努力建立融自动搜索统计测度、动态演化统计测度和自主优选统计测度为一体的大数据统计测度方法体系。
一组精要的数学符号,一个简单的数学公式,一条言简深邃的数学定理,一种精彩绝伦的数学构想……,无不闪现着这些数学巨人们思想深处那汩汩不息的美感之源所散发出的激情与脉动,其升腾出的美的氤氲,笼罩着一种思维上的灵逸和深远,带给人们一丝迷醉其中的淡淡情愫。拉丁格言说得好:“美是真理的光辉。”如果将这句话投射在数学领域中,我想,大量的事例都可印证其简约的表述之下所蕴涵的深远意境。但从更广泛的意义看,美又何尝不是一种力量,一种蓄以待发的、存乎自然与人最深处的追求本真的力量,一种属性固有与理性追求的完美统一。不难体会到,数学的美——一种独特的、兼具震撼力的美,本质上包含了两个侧面的含义:主观意义上的数学美与客观意义上的数学美,即数学美既是一种人的能动的主观感受与思维表达,又是内蕴于客观世界的现实存在。从这两个侧面出发,以一种全面、深刻、辩证的数学美学认识为基础,站在哲学平台上,对数学美的本质做进一步的剖析与探讨工作,既有理论的完善意义,又具有数学美育实践的指导与促进意义。鉴于此,笔者拙笔写下了这篇断想。
1数学美的存在性——客观世界的反映
在客观世界纷繁芜杂的各种变化与现象中,时刻贯穿、孕育着各种各样的美。美是杂乱中的秩序,是变化中的规律。美是客观世界的本质属性,是引领整个客观世界向前发展的内在动力。数学美作为科学美的重要方面,就是对自然界中客观存在的秩序与规律从数与形的角度给予反映和揭示。具体来说,对于美的存在性,我们可以从两个方面来认识与考察。
首先,客观世界中处处渗透与体现着数学美,数学美是对客观世界内在规律的反映。对于数学美与客观世界之间的相互联系,其实早在古希腊时期,毕达哥拉斯学派就开始着手研究。毕氏学派在研究音乐乐理的谐音与天体运行的轨道时,发现二者在数量关系上都满足整数比,从而就此得出结论“宇宙间万物的总规律,其本质就是数的严整性和和谐性”,“美是和谐与比例”。在这样的认识基础上,毕氏学派试图从数和数的比例中求得美和美的形式,并终于从五角星形中发现了“黄金分割”,进而得到黄金比。这是数学美学认识史上的一大突破。从古希腊到现在,黄金比在各种造型艺术中都有着重要的美学价值。现代科学研究甚至表明,黄金比在现代最优化理论中也有着应用价值,如优选法中的0.618法。即使在现代医学保健领域中,都可以处处感受到它的存在与神奇。最令人惊奇的是,很多生物的形体比例也是等于黄金比。难道它们都懂得优选法,自觉采用黄金比?不!这只能证明美学家的断言:“美是一切事物生存和发展的本质特征。”
其次,溯源于客观世界的数学理论内部也充满着数学美。这种美本质上间接地表征了客观世界的固有规律。徐利治教授曾说过:“作为科学语言的数学、具有一般语言文学与艺术所共有的美的特点,即数学在其内容结构和方法上也都具有自身的某种美……如数学概念的简单性、统一性,结构系统的协调性、对称性,数学命题与数学模型的概括性、典型性和普遍性,还有数学中的奇异美等。”古代哲学家、数学家普洛克拉斯甚至断言:“哪里有数,哪里就有美。”的确,数学中美的例子可谓俯拾即是。例如,皮亚诺算术公理系统,就是逻辑结构简单美的典范;希尔伯特以非构造方法成功解决了代数不变量理论中的戈丹问题,体现数学方法的简单美;代数中的共扼根式、共扼复数、对称多项式、对称矩阵等。几何中的轴对称、中心对称、镜面对称等,都表现了数学中的对称美;运算、变换、函数,这三个分别隶属代数、几何、分析等不同数学分支的重要概念。在集合论建立之后,便可以统一于映射的概念,这体现了数学中的统一美……。近代科学家开普勒更是一针见血地指出:“数学是这个世界之美的原型。”言简意赅、意蕴深远的一句话,给人以深刻的思想启迪。
2数学美的独特性——内隐而深邃的理智美与理性精神
英国著名哲学家、数学家罗素曾经这样描述过数学的美:“数学,如果正确地看它,不但拥有真理,而且也具有至高的美,正象雕刻的美,是一种冷而严肃的美、这种美不是投合我们天性的微弱的方面,这种美没有绘画或音乐那些华丽的装饰,它可以纯净到崇高的地步,能够达到严格的只有最伟大的艺术才能显示的那种完满的境地。”罗素的这番精彩论述以“冷而严肃”“纯净”“崇高”“严格”“完满的境地”等字眼来形容数学的美,辞藻华丽且思想深刻,将数学美的与众不同淋漓尽致地展现在人们面前,再进一步看,正如前面所论述的数学美的本质包含了两个侧面(主观意义和客观意义)。因此,从主观与客观及其相互联系统一的角度来研究数学美的独特性,必然会有助于我们更好地去理解与认识数学美的内在本质。
第一,数学的美是内在的美、隐蔽的美、深邃的美,美在数学思想内部,数学美是客观规律的反映,但这种反映不是像照镜子那样直接反映,而是人的能动反映,是自然社会化的结果,是人的本质力量对象化的结果。它所反映的不单纯是客观事物,而是融合了人的思维创造。因此,要领悟数学美必须透过,“抽象、枯燥”的符号、公式及定理等洞察其内部的数学思想:比如爱因斯坦创立的相对论可谓内容丰富之极,但如果用式子表示的话,却极其简单:
E=mc[2],P=mv(E为能量,P为动量,m为质量,c为真空中的光速)并非所有人都能意识到其中的美。其实,这两个公式代表了爱因斯坦对人类贡献的精华,它们深刻地揭示了微观、宏面、宇观的无数质能变化现象的规律,但式子却非常简单。其用字之少,内容之丰富,充分体现了数学的简单美。再比如,数学家们把等式
e[πi]+1=0
视为最优美的公式,美在哪里?其实,这个式子将算术中的"1""0",代数中的"i",几何中的“π”,分析中的"e"神奇地统一在了一起,即它们相会于天桥:e[iθ]=cosθ+isinθ(在该式中令θ=π就可得到上式),它沟通了三角函数与指数函数之间的内在联系,充分体现了数学的统一美。
第二,从价值追求的角度看,数学美实质上体现了人的审美精神,这种精神说到底是一种理性的精神,恰恰是这种精神,“使得人类的思想得以运用到非常完善至美的程度”,即“完满的境地”;正是这种精神,“从一定程度上影响人类的物质、道德和社会生活,以试图回答有关人类自身提出的一些问题”;正是这种精神,“使得人们能尽可能地去理解、了解、控制自然,掌握客观世界的规律”;正是这种精神,“使人们有可能去探求和确立已经获得的知识的最深刻的、最完美的学科内涵”,并使之“纯净到崇高的地步”。这是笔者从罗素的论述中感悟到的数学美的精神层面的独特内涵。
3数学美的驱动性——个人创新与数学发展的内部动力
对于数学美的追求历来是科学家进行发现与创新的重要内部驱动力。阿达玛与彭加勒都曾从心理学角度阐释美与发明创造之间的关系。他们认为,创造的本质就是做出选择,就是要抛弃不合适的方案,保留合适的方案,而支配这种选择的正是科学美感。正如阿达玛所说的:“科学美感,这种特殊的美感,是我们必须信任的向导,”因为,“唯有美感能预示将来的研究结果是否会富有成果。”数学史的研究表明,希腊几何学家之所以研究椭圆,可以说除了美感之外,再没有什么其他动力了。著名物理学家麦克斯韦在没有任何实验依据的情况之下,仅从数学美的考虑出发,将实验得出的电磁理论方程重新改写,以求得方程形式上的对称优美。令人惊异的是,改写的方程竞被后来的实验证实了,而且利用方程还可推导出一系列令人陶醉的结果,电磁理论决定性的一步就这样跨出了。这不能不让人相信美的确具有如此巨大的推动力与支配力。诚如爱因斯坦所言:“照亮我的道路,并且不断地给我新的勇气去愉快地正视生活的理想,是善、美和真。”事实上,爱因斯坦所提出的科学思想,有很多是出于美学而不是逻辑的考虑。他对实验和理论不相符的忧虑,甚至远远不及对基本原理的不简洁、不和谐所引起的忧虑,而这正是刺激他的思想的源泉。
从广泛的意义上看,对数学美的追求也在不断推动整个数学向前发展,数学发展的历史不啻是一部追求数学美的前进史。比如,在数学发展的历史长河中,数学家们坚持不懈地追求数学的统一性,从而相继诞生出三部数学巨著:欧几里德的《几何原本》,罗素与怀德海合著的《数学原理》,布尔巴基学派的《数学原本》。再如,出于逻辑简单性的考虑,数学家们很早就对欧氏平行公理的自明性和独立性产生怀疑,经过几个世纪的研究,最终导致非欧几何的建立。此外,对于奇异性的追求也同样推动了数学发展,对此,哥德尔不完备定理的提出可以说是一个极好的例子,纽曼和耐格尔曾把这一定理称为“数学与逻辑学发展史中的里程碑”。著名物理学家惠勒则更认为:“即使到了公元5000年,如果宇宙仍然存在,知识也仍然放射出光芒的话,人们就将仍把哥德尔的工作……看成一切知识的中心。”
综上所述,无论是对个人的创新,还是对数学科学的整体发展,数学美的推动作用都是毋庸质疑的。从本质上说,对于统一性、简单性、奇异性的追求过程就是个人与群体认识不断深化和发展的过程。正如郑额信教授所说:“无论是对于统一性、简单性、奇异性或抽象性的追求,事实上都体现了数学家的这样一种特性:他们永不满足于已取得的成果,而总是希望能获得更深刻、更全面、更正确的认识。因此,他们总是希望能将复杂的东西予以简单化,将分散、零乱的东西予以统一,也总是希望能开拓新的研究领域……正是在这样的过程中,数学家们感受到了数学的美,而这事实上也就是认识不断得到发展和深化的过程。”
4数学美的甄别性——评价数学理论的重要标准之一
古往今来的很多数学家、科学家都将数学美视作衡量自己或他人研究成果的重要评价尺度之一。数学美犹如一个筛子,数学家们利用这个筛子对理论中的各种因素做总体上的甄别与评判,剔除丑陋保留美好,力图最终获得“美”与“真”的完美统一。著名数学家冯·诺伊曼就曾说过:“我认为数学家无论是选择题材还是判断成功的标准,主要都是美学的。”庞卡莱则更明确地说:“数学家们非常重视他们的方法和理论是否优美,这并非华而不实的作风……一个解答、一个证明的和谐、对称以及恰到好处的平衡……能使我们对整体以及细节都能有清楚的认识和理解,这正是产生伟大成果的地方。”
数学家与科学家们之所以如此看重数学美,就是因为数学美的甄别性在一定程度上为该理论的发展前景作出了预测,同时也在一定程度上为科学家们的工作指明了方向。如众所知,概率论的产生始于17世纪,在当时,由于人们对概率概念所存有的不同理解,所以建立的理论体系也不完全一样。在这些理论体系中,最迷人的是前苏联数学家柯尔莫哥洛夫建立在公理集合论上的测度论的概率论。以数学美的标准来评价,柯氏的理论体系,无疑极大地显示了数学的简单美与统一美,不仅对论述无限随机实验序列或一般的随机过程给出了足够的逻辑基础,而且应用于统计学也很方便。历史的发展充分地证明了,在这些理论中,惟有柯氏的概率论不断得到进一步发展,而且后来还产生了不少新的分支。正如Nobel物理学奖获得者狄拉克所言:“一种理论如果是正确的,它就应该是美的,一种美的理论有普适性,它有能力预言、解释、提供范例,可用它来进行工作,因而数学美能激起人们的热情,对它的追求就好像是一种信仰行为……数学美是对理论具有决定取舍作用的一个准则。”
5数学美的层次性——主观客观彼此交融的重要特征之一
根据前面的分析,数学美的本质体现在两个侧面,即它既是一种客观世界的本质属性,又是人对于这种本质属性的主观认识与感受,且二者之间是辩证的融合。站在这样的一种辨证的数学美的本质观(数学的主观美、客观美及其你中有我、我中有你)平台上,笔者认为,从客体作用于主体的角度考察,客观世界存在的各种数学美的外部呈现与反映体现出典型的层次性特征。从本质上说,这种美的层次性特征既表达了客体美对人的感官、思维的冲击上的层次差异性,又体现了个体对数学美的主观认识上的阶段性与发展性。张猷宙和木振武两位教授可谓对这一课题做了独特而深入的研究,他们结合数学美育,从主观认识与客观反映之间辨证联系的角度出发,提出了数学美的四个层次:美观、美好、美妙、完美,并以此为基点,探究优化课堂教学的策略与构想。在此,笔者相信,对该课题的研究将会是继续深入、不断完善的。
一组精要的数学符号,一个简单的数学公式,一条言简深邃的数学定理,一种精彩绝伦的数学构想……,无不闪现着这些数学巨人们思想深处那汩汩不息的美感之源所散发出的激情与脉动,其升腾出的美的氤氲,笼罩着一种思维上的灵逸和深远,带给人们一丝迷醉其中的淡淡情愫。拉丁格言说得好:“美是真理的光辉。”如果将这句话投射在数学领域中,我想,大量的事例都可印证其简约的表述之下所蕴涵的深远意境。但从更广泛的意义看,美又何尝不是一种力量,一种蓄以待发的、存乎自然与人最深处的追求本真的力量,一种属性固有与理性追求的完美统一。不难体会到,数学的美——一种独特的、兼具震撼力的美,本质上包含了两个侧面的含义:主观意义上的数学美与客观意义上的数学美,即数学美既是一种人的能动的主观感受与思维表达,又是内蕴于客观世界的现实存在。从这两个侧面出发,以一种全面、深刻、辩证的数学美学认识为基础,站在哲学平台上,对数学美的本质做进一步的剖析与探讨工作,既有理论的完善意义,又具有数学美育实践的指导与促进意义。鉴于此,笔者拙笔写下了这篇断想。
1 数学美的存在性——客观世界的反映
在客观世界纷繁芜杂的各种变化与现象中,时刻贯穿、孕育着各种各样的美。美是杂乱中的秩序,是变化中的规律。美是客观世界的本质属性,是引领整个客观世界向前发展的内在动力。数学美作为科学美的重要方面,就是对自然界中客观存在的秩序与规律从数与形的角度给予反映和揭示。具体来说,对于美的存在性,我们可以从两个方面来认识与考察。
首先,客观世界中处处渗透与体现着数学美,数学美是对客观世界内在规律的反映。对于数学美与客观世界之间的相互联系,其实早在古希腊时期,毕达哥拉斯学派就开始着手研究。毕氏学派在研究音乐乐理的谐音与天体运行的轨道时,发现二者在数量关系上都满足整数比,从而就此得出结论“宇宙间万物的总规律,其本质就是数的严整性和和谐性”,“美是和谐与比例”。在这样的认识基础上,毕氏学派试图从数和数的比例中求得美和美的形式,并终于从五角星形中发现了“黄金分割”,进而得到黄金比。这是数学美学认识史上的一大突破。从古希腊到现在,黄金比在各种造型艺术中都有着重要的美学价值。现代科学研究甚至表明,黄金比在现代最优化理论中也有着应用价值,如优选法中的0.618法。即使在现代医学保健领域中,都可以处处感受到它的存在与神奇。最令人惊奇的是,很多生物的形体比例也是等于黄金比。难道它们都懂得优选法,自觉采用黄金比?不!这只能证明美学家的断言:“美是一切事物生存和发展的本质特征。”
其次,溯源于客观世界的数学理论内部也充满着数学美。这种美本质上间接地表征了客观世界的固有规律。徐利治教授曾说过:“作为科学语言的数学、具有一般语言文学与艺术所共有的美的特点,即数学在其内容结构和方法上也都具有自身的某种美……如数学概念的简单性、统一性,结构系统的协调性、对称性,数学命题与数学模型的概括性、典型性和普遍性,还有数学中的奇异美等。”古代哲学家、数学家普洛克拉斯甚至断言:“哪里有数,哪里就有美。”的确,数学中美的例子可谓俯拾即是。例如,皮亚诺算术公理系统,就是逻辑结构简单美的典范;希尔伯特以非构造方法成功解决了代数不变量理论中的戈丹问题,体现数学方法的简单美;代数中的共扼根式、共扼复数、对称多项式、对称矩阵等。几何中的轴对称、中心对称、镜面对称等,都表现了数学中的对称美;运算、变换、函数,这三个分别隶属代数、几何、分析等不同数学分支的重要概念。在集合论建立之后,便可以统一于映射的概念,这体现了数学中的统一美……。近代科学家开普勒更是一针见血地指出:“数学是这个世界之美的原型。”言简意赅、意蕴深远的一句话,给人以深刻的思想启迪。
2
数学美的独特性——内隐而深邃的理智美与理性精神
英国著名哲学家、数学家罗素曾经这样描述过数学的美:“数学,如果正确地看它,不但拥有真理,而且也具有至高的美,正象雕刻的美,是一种冷而严肃的美、这种美不是投合我们天性的微弱的方面,这种美没有绘画或音乐那些华丽的装饰,它可以纯净到崇高的地步,能够达到严格的只有最伟大的艺术才能显示的那种完满的境地。”罗素的这番精彩论述以“冷而严肃”“纯净”“崇高”“严格”“完满的境地”等字眼来形容数学的美,辞藻华丽且思想深刻,将数学美的与众不同淋漓尽致地展现在人们面前,再进一步看,正如前面所论述的数学美的本质包含了两个侧面(主观意义和客观意义)。因此,从主观与客观及其相互联系统一的角度来研究数学美的独特性,必然会有助于我们更好地去理解与认识数学美的内在本质。
第一,数学的美是内在的美、隐蔽的美、深邃的美,美在数学思想内部,数学美是客观规律的反映,但这种反映不是像照镜子那样直接反映,而是人的能动反映,是自然社会化的结果,是人的本质力量对象化的结果。它所反映的不单纯是客观事物,而是融合了人的思维创造。因此,要领悟数学美必须透过,“抽象、枯燥”的符号、公式及定理等洞察其内部的数学思想:比如爱因斯坦创立的相对论可谓内容丰富之极,但如果用式子表示的话,却极其简单:
E=mc[2],P=mv(E为能量,P为动量,m为质量,c为真空中的光速)并非所有人都能意识到其中的美。其实,这两个公式代表了爱因斯坦对人类贡献的精华,它们深刻地揭示了微观、宏面、宇观的无数质能变化现象的规律,但式子却非常简单。其用字之少,内容之丰富,充分体现了数学的简单美。再比如,数学家们把等式
e[πi]+1=0
视为最优美的公式,美在哪里?其实,这个式子将算术中的"1""0",代数中的"i",几何中的“π”,分析中的"e"神奇地统一在了一起,即它们相会于天桥:e[iθ]=cosθ+isinθ(在该式中令θ=π就可得到上式),它沟通了三角函数与指数函数之间的内在联系,充分体现了数学的统一美。
第二,从价值追求的角度看,数学美实质上体现了人的审美精神,这种精神说到底是一种理性的精神,恰恰是这种精神,“使得人类的思想得以运用到非常完善至美的程度”,即“完满的境地”;正是这种精神,“从一定程度上影响人类的物质、道德和社会生活,以试图回答有关人类自身提出的一些问题”;正是这种精神,“使得人们能尽可能地去理解、了解、控制自然,掌握客观世界的规律”;正是这种精神,“使人们有可能去探求和确立已经获得的知识的最深刻的、最完美的学科内涵”,并使之“纯净到崇高的地步”。这是笔者从罗素的论述中感悟到的数学美的精神层面的独特内涵。
3 数学美的驱动性——个人创新与数学发展的内部动力
对于数学美的追求历来是科学家进行发现与创新的重要内部驱动力。阿达玛与彭加勒都曾从心理学角度阐释美与发明创造之间的关系。他们认为,创造的本质就是做出选择,就是要抛弃不合适的方案,保留合适的方案,而支配这种选择的正是科学美感。正如阿达玛所说的:“科学美感,这种特殊的美感,是我们必须信任的向导,”因为,“唯有美感能预示将来的研究结果是否会富有成果。”数学史的研究表明,希腊几何学家之所以研究椭圆,可以说除了美感之外,再没有什么其他动力了。著名物理学家麦克斯韦在没有任何实验依据的情况之下,仅从数学美的考虑出发,将实验得出的电磁理论方程重新改写,以求得方程形式上的对称优美。令人惊异的是,改写的方程竞被后来的实验证实了,而且利用方程还可推导出一系列令人陶醉的结果,电磁理论决定性的一步就这样跨出了。这不能不让人相信美的确具有如此巨大的推动力与支配力。诚如爱因斯坦所言:“照亮我的道路,并且不断地给我新的勇气去愉快地正视生活的理想,是善、美和真。”事实上,爱因斯坦所提出的科学思想,有很多是出于美学而不是逻辑的考虑。他对实验和理论不相符的忧虑,甚至远远不及对基本原理的不简洁、不和谐所引起的忧虑,而这正是刺激他的思想的源泉。
从广泛的意义上看,对数学美的追求也在不断推动整个数学向前发展,数学发展的历史不啻是一部追求数学美的前进史。比如,在数学发展的历史长河中,数学家们坚持不懈地追求数学的统一性,从而相继诞生出三部数学巨著:欧几里德的《几何原本》,罗素与怀德海合著的《数学原理》,布尔巴基学派的《数学原本》。再如,出于逻辑简单性的考虑,数学家们很早就对欧氏平行公理的自明性和独立性产生怀疑,经过几个世纪的研究,最终导致非欧几何的建立。此外,对于奇异性的追求也同样推动了数学发展,对此,哥德尔不完备定理的提出可以说是一个极好的例子,纽曼和耐格尔曾把这一定理称为“数学与逻辑学发展史中的里程碑”。著名物理学家惠勒则更认为:“即使到了公元5000年,如果宇宙仍然存在,知识也仍然放射出光芒的话,人们就将仍把哥德尔的工作……看成一切知识的中心。”
综上所述,无论是对个人的创新,还是对数学科学的整体发展,数学美的推动作用都是毋庸质疑的。从本质上说,对于统一性、简单性、奇异性的追求过程就是个人与群体认识不断深化和发展的过程。正如郑额信教授所说:“无论是对于统一性、简单性、奇异性或抽象性的追求,事实上都体现了数学家的这样一种特性:他们永不满足于已取得的成果,而总是希望能获得更深刻、更全面、更正确的认识。因此,他们总是希望能将复杂的东西予以简单化,将分散、零乱的东西予以统一,也总是希望能开拓新的研究领域……正是在这样的过程中,数学家们感受到了数学的美,而这事实上也就是认识不断得到发展和深化的过程。”
4 数学美的甄别性——评价数学理论的重要标准之一
古往今来的很多数学家、科学家都将数学美视作衡量自己或他人研究成果的重要评价尺度之一。数学美犹如一个筛子,数学家们利用这个筛子对理论中的各种因素做总体上的甄别与评判,剔除丑陋保留美好,力图最终获得“美”与“真”的完美统一。著名数学家冯·诺伊曼就曾说过:“我认为数学家无论是选择题材还是判断成功的标准,主要都是美学的。”庞卡莱则更明确地说:“数学家们非常重视他们的方法和理论是否优美,这并非华而不实的作风……一个解答、一个证明的和谐、对称以及恰到好处的平衡……能使我们对整体以及细节都能有清楚的认识和理解,这正是产生伟大成果的地方。”
数学家与科学家们之所以如此看重数学美,就是因为数学美的甄别性在一定程度上为该理论的发展前景作出了预测,同时也在一定程度上为科学家们的工作指明了方向。如众所知,概率论的产生始于17世纪,在当时,由于人们对概率概念所存有的不同理解,所以建立的理论体系也不完全一样。在这些理论体系中,最迷人的是前苏联数学家柯尔莫哥洛夫建立在公理集合论上的测度论的概率论。以数学美的标准来评价,柯氏的理论体系,无疑极大地显示了数学的简单美与统一美,不仅对论述无限随机实验序列或一般的随机过程给出了足够的逻辑基础,而且应用于统计学也很方便。历史的发展充分地证明了,在这些理论中,惟有柯氏的概率论不断得到进一步发展,而且后来还产生了不少新的分支。正如Nobel物理学奖获得者狄拉克所言:“一种理论如果是正确的,它就应该是美的,一种美的理论有普适性,它有能力预言、解释、提供范例,可用它来进行工作,因而数学美能激起人们的热情,对它的追求就好像是一种信仰行为……数学美是对理论具有决定取舍作用的一个准则。”
5 数学美的层次性——主观客观彼此交融的重要特征之一
根据前面的分析,数学美的本质体现在两个侧面,即它既是一种客观世界的本质属性,又是人对于这种本质属性的主观认识与感受,且二者之间是辩证的融合。站在这样的一种辨证的数学美的本质观(数学的主观美、客观美及其你中有我、我中有你)平台上,笔者认为,从客体作用于主体的角度考察,客观世界存在的各种数学美的外部呈现与反映体现出典型的层次性特征。从本质上说,这种美的层次性特征既表达了客体美对人的感官、思维的冲击上的层次差异性,又体现了个体对数学美的主观认识上的阶段性与发展性。张猷宙和木振武两位教授可谓对这一课题做了独特而深入的研究,他们结合数学美育,从主观认识与客观反映之间辨证联系的角度出发,提出了数学美的四个层次:美观、美好、美妙、完美,并以此为基点,探究优化课堂教学的策略与构想。在此,笔者相信,对该课题的研究将会是继续深入、不断完善的。