数学基础
二十世纪六十年代,产生了模糊数学这门新兴学科。模糊数学的产生
现代数学是建立在集合论的基础上。集合论的重要意义就一个侧面看,在与它把数学的抽象能力延伸到人类认识过程的深处。一组对象确定一组属性,人们可以通过说明属性来说明概念(内涵),也可以通过指明对象来说明它。符合概念的那些对象的全体叫做这个概念的外延,外延其实就是集合。从这个意义上讲,集合可以表现概念,而集合论中的关系和运算又可以表现判断和推理,一切现实的理论系统都一可能纳入集合描述的数学框架。
但是,数学的发展也是阶段性的。经典集合论只能把自己的表现力限制在那些有明确外延的概念和事物上,它明确地限定:每个集合都必须由明确的元素构成,元素对集合的隶属关系必须是明确的,决不能模棱两可。对于那些外延不分明的概念和事物,经典集合论是暂时不去反映的,属于待发展的范畴。
在较长时间里,精确数学及随机数学在描述自然界多种事物的运动规律中,获得显著效果。但是,在客观世界中还普遍存在着大量的模糊现象。以前人们回避它,但是,由于现代科技所面对的系统日益复杂,模糊性总是伴随着复杂性出现。
各门学科,尤其是人文、社会学科及其它“软科学”的数学化、定量化趋向把模糊性的数学处理问题推向中心地位。更重要的是,随着电子计算机、控制论、系统科学的迅速发展,要使计算机能像人脑那样对复杂事物具有识别能力,就必须研究和处理模糊性。
我们研究人类系统的行为,或者处理可与人类系统行为相比拟的复杂系统,如航天系统、人脑系统、社会系统等,参数和变量甚多,各种因素相互交错,系统很复杂,它的模糊性也很明显。从认识方面说,模糊性是指概念外延的不确定性,从而造成判断的不确定性。
在日常生活中,经常遇到许多模糊事物,没有分明的数量界限,要使用一些模糊的词句来形容、描述。比如,比较年轻、高个、大胖子、好、漂亮、善、热、远……。在人们的工作经验中,往往也有许多模糊的东西。例如,要确定一炉钢水是否已经炼好,除了要知道钢水的温度、成分比例和冶炼时间等精确信息外,还需要参考钢水颜色、沸腾情况等模糊信息。因此,除了很早就有涉及误差的计算数学之外,还需要模糊数学。
人与计算机相比,一般来说,人脑具有处理模糊信息的能力,善于判断和处理模糊现象。但计算机对模糊现象识别能力较差,为了提高计算机识别模糊现象的能力,就需要把人们常用的模糊语言设计成机器能接受的指令和程序,以便机器能像人脑那样简洁灵活的做出相应的判断,从而提高自动识别和控制模糊现象的效率。这样,就需要寻找一种描述和加工模糊信息的数学工具,这就推动数学家深入研究模糊数学。所以,模糊数学的产生是有其科学技术与数学发展的必然性。
模糊数学的研究内容
1965年,美国控制论专家、数学家查德发表了论文《模糊集合》,标志着模糊数学这门学科的诞生。
模糊数学的研究内容主要有以下三个方面:
第一,研究模糊数学的理论,以及它和精确数学、随机数学的关系。察德以精确数学集合论为基础,并考虑到对数学的集合概念进行修改和推广。他提出用“模糊集合”作为表现模糊事物的数学模型。并在“模糊集合”上逐步建立运算、变换规律,开展有关的理论研究,就有可能构造出研究现实世界中的大量模糊的数学基础,能够对看来相当复杂的模糊系统进行定量的描述和处理的数学方法。
在模糊集合中,给定范围内元素对它的隶属关系不一定只有“是”或“否”两种情况,而是用介于0和1之间的实数来表示隶属程度,还存在中间过渡状态。比如“老人”是个模糊概念,70岁的肯定属于老人,它的从属程度是 1,40岁的人肯定不算老人,它的从属程度为 0,按照查德给出的公式,55岁属于“老”的程度为0.5,即“半老”,60岁属于“老”的程度0.8。查德认为,指明各个元素的隶属集合,就等于指定了一个集合。当隶属于0和1之间值时,就是模糊集合。
第二,研究模糊语言学和模糊逻辑。人类自然语言具有模糊性,人们经常接受模糊语言与模糊信息,并能做出正确的识别和判断。
为了实现用自然语言跟计算机进行直接对话,就必须把人类的语言和思维过程提炼成数学模型,才能给计算机输入指令,建立和是的模糊数学模型,这是运用数学方法的关键。查德采用模糊集合理论来建立模糊语言的数学模型,使人类语言数量化、形式化。
如果我们把合乎语法的标准句子的从属函数值定为1,那么,其他文法稍有错误,但尚能表达相仿的思想的句子,就可以用以0到1之间的连续数来表征它从属于“正确句子”的隶属程度。这样,就把模糊语言进行定量描述,并定出一套运算、变换规则。目前,模糊语言还很不成熟,语言学家正在深入研究。
人们的思维活动常常要求概念的确定性和精确性,采用形式逻辑的排中律,既非真既假,然后进行判断和推理,得出结论。现有的计算机都是建立在二值逻辑基础上的,它在处理客观事物的确定性方面,发挥了巨大的作用,但是却不具备处理事物和概念的不确定性或模糊性的能力。
为了使计算机能够模拟人脑高级智能的特点,就必须把计算机转到多值逻辑基础上,研究模糊逻辑。目前,模糊罗基还很不成熟,尚需继续研究。
第三,研究模糊数学的应用。模糊数学是以不确定性的事物为其研究对象的。模糊集合的出现是数学适应描述复杂事物的需要,查德的功绩在于用模糊集合的理论找到解决模糊性对象加以确切化,从而使研究确定性对象的数学与不确定性对象的数学沟通起来,过去精确数学、随机数学描述感到不足之处,就能得到弥补。在模糊数学中,目前已有模糊拓扑学、模糊群论、模糊图论、模糊概率、模糊语言学、模糊逻辑学等分支。
模糊数学的应用
模糊数学是一门新兴学科,它已初步应用于模糊控制、模糊识别、模糊聚类分析、模糊决策、模糊评判、系统理论、信息检索、医学、生物学等各个方面。在气象、结构力学、控制、心理学等方面已有具体的研究成果。然而模糊数学最重要的应用领域是计算机职能,不少人认为它与新一代计算机的研制有密切的联系。
目前,世界上发达国家正积极研究、试制具有智能化的模糊计算机,1986年日本山川烈博士首次试制成功模糊推理机,它的推理速度是1000万次/秒。1988年,我国汪培庄教授指导的几位博士也研制成功一台模糊推理机——分立元件样机,它的推理速度为1500万次/秒。这表明我国在突破模糊信息处理难关方面迈出了重要的一步。
模糊数学还远没有成熟,对它也还存在着不同的意见和看法,有待实践去检验。 数学中的皇冠——数论
人类从学会计数开始就一直和自然数打交道了,后来由于实践的需要,数的概念进一步扩充,自然数被叫做正整数,而把它们的相反数叫做负整数,介于正整数和负整数中间的中性数叫做0。它们和起来叫做整数。
对于整数可以施行加、减、乘、除四种运算,叫做四则运算。其中加法、减法和乘法这三种运算,在整数范围内可以毫无阻碍地进行。也就是说,任意两个或两个以上的整数相加、相减、相乘的时候,它们的和、差、积仍然是一个整数。但整数之间的除法在整数范围内并不一定能够无阻碍地进行。
人们在对整数进行运算的应用和研究中,逐步熟悉了整数的特性。比如,整数可分为两大类—奇数和偶数(通常被称为单数、双数)等。利用整数的一些基本性质,可以进一步探索许多有趣和复杂的数学规律,正是这些特性的魅力,吸引了古往今来许多的数学家不断地研究和探索。
数论这门学科最初是从研究整数开始的,所以叫做整数论。后来整数论又进一步发展,就叫做数论了。确切的说,数论就是一门研究整数性质的学科。
数论的发展简况
自古以来,数学家对于整数性质的研究一直十分重视,但是直到十九世纪,这些研究成果还只是孤立地记载在各个时期的算术著作中,也就是说还没有形成完整统一的学科。
自我国古代,许多著名的数学著作中都关于数论内容的论述,比如求最大公约数、勾股数组、某些不定方程整数解的问题等等。在国外,古希腊时代的数学家对于数论中一个最基本的问题——整除性问题就有系统的研究,关于质数、和数、约数、倍数等一系列概念也已经被提出来应用了。后来的各个时代的数学家也都对整数性质的研究做出过重大的贡献,使数论的基本理论逐步得到完善。
在整数性质的研究中,人们发现质数是构成正整数的基本“材料”,要深入研究整数的性质就必须研究质数的性质。因此关于质数性质的有关问题,一直受到数学家的关注。
到了十八世纪末,历代数学家积累的关于整数性质零散的知识已经十分丰富了,把它们整理加工成为一门系统的学科的条件已经完全成熟了。德国数学家高斯集中前人的大成,写了一本书叫做《算术探讨》,1800年寄给了法国科学院,但是法国科学院拒绝了高斯的这部杰作,高斯只好在1801年自己发表了这部著作。这部书开始了现代数论的新纪元。
在《算术探讨》中,高斯把过去研究整数性质所用的符号标准化了,把当时现存的定理系统化并进行了推广,把要研究的问题和意志的方法进行了分类,还引进了新的方法。
数论的基本内容
数论形成了一门独立的学科后,随着数学其他分支的发展,研究数论的方法也在不断发展。如果按照研究方法来说,可以分成初等数论、解析数论、代数数论和几何数论四个部分。
初等数论是数论中不求助于其他数学学科的帮助,只依靠初等的方法来研究整数性质的分支。比如中国古代有名的“中国剩余定理”,就是初等数论中很重要的内容。
解析数论是使用数学分析作为工具来解决数论问题的分支。数学分析是以函数作为研究对象的、在极限概念的基础上建立起来的数学学科。用数学分析来解决数论问题是由欧拉奠基的,俄国数学家车比雪夫等也对它的发展做出过贡献。解析数论是解决数论中艰深问题的强有力的工具。比如,对于“质数有无限多个”这个命题,欧拉给出了解析方法的证明,其中利用了数学分析中有关无穷级数的若干知识。二十世纪三十年代,苏联数学家维诺格拉多夫创造性的提出了“三角和方法”,这个方法对于解决某些数论难题有着重要的作用。我国数学家陈景润在解决“哥德巴赫猜想”问题中也使用的是解析数论的方法。
代数数论是把整数的概念推广到代数整数的一个分支。数学家把整数概念推广到一般代数数域上去,相应地也建立了素整数、可除性等概念。
几何数论是由德国数学家、物理学家闵可夫斯基等人开创和奠基的。几何数论研究的基本对象是“空间格网”。什么是空间格网呢?在给定的直角坐标系上,坐标全是整数的点,叫做整点;全部整点构成的组就叫做空间格网。空间格网对几何学和结晶学有着重大的意义。由于几何数论涉及的问题比较复杂,必须具有相当的数学基础才能深入研究。
数论是一门高度抽象的数学学科,长期以来,它的发展处于纯理论的研究状态,它对数学理论的发展起到了积极的作用。但对于大多数人来讲并不清楚它的实际意义。
由于近代计算机科学和应用数学的发展,数论得到了广泛的应用。比如在计算方法、代数编码、组合论等方面都广泛使用了初等数论范围内的许多研究成果;又文献报道,现在有些国家应用“孙子定理”来进行测距,用原根和指数来计算离散傅立叶变换等。此外,数论的许多比较深刻的研究成果也在近似分析、差集合、快速变换等方面得到了应用。特别是现在由于计算机的发展,用离散量的计算去逼近连续量而达到所要求的精度已成为可能。
数论在数学中的地位是独特的,高斯曾经说过“数学是科学的皇后,数论是数学中的皇冠”。因此,数学家都喜欢把数论中一些悬而未决的疑难问题,叫做“皇冠上的明珠”,以鼓励人们去“摘取”。下面简要列出几颗“明珠”:费尔马大定理、孪生素数问题、歌德巴赫猜想、圆内整点问题、完全数问题……
在我国近代,数论也是发展最早的数学分支之一。从二十世纪三十年代开始,在解析数论、刁藩都方程、一致分布等方面都有过重要的贡献,出现了华罗庚、闵嗣鹤、柯召等第一流的数论专家。其中华罗庚教授在三角和估值、堆砌素数论方面的研究是享有盛名的。1949年以后,数论的研究的得到了更大的发展。特别是在“筛法”和“歌德巴赫猜想”方面的研究,已取得世界领先的优秀成绩。
特别是陈景润在1966年证明“歌德巴赫猜想”的“一个大偶数可以表示为一个素数和一个不超过两个素数的乘积之和”以后,在国际数学引起了强烈的反响,盛赞陈景润的论文是解析数学的名作,是筛法的光辉顶点。至今,这仍是“歌德巴赫猜想”的最好结果。 不量尺寸的几何—拓扑学
拓扑学的由来
几何拓扑学是十九世纪形成的一门数学分支,它属于几何学的范畴。有关拓扑学的一些内容早在十八世纪就出现了。那时候发现一些孤立的问题,后来在拓扑学的形成中占着重要的地位。
在数学上,关于哥尼斯堡七桥问题、多面体的欧拉定理、四色问题等都是拓扑学发展史的重要问题。
哥尼斯堡(今俄罗斯加里宁格勒)是东普鲁士的首都,普莱格尔河横贯其中。十八世纪在这条河上建有七座桥,将河中间的两个岛和河岸联结起来。人们闲暇时经常在这上边散步,一天有人提出:能不能每座桥都只走一遍,最后又回到原来的位置。这个问题看起来很简单有很有趣的问题吸引了大家,很多人在尝试各种各样的走法,但谁也没有做到。看来要得到一个明确、理想的答案还不那么容易。
1736年,有人带着这个问题找到了当时的大数学家欧拉,欧拉经过一番思考,很快就用一种独特的方法给出了解答。欧拉把这个问题首先简化,他把两座小岛和河的两岸分别看作四个点,而把七座桥看作这四个点之间的连线。那么这个问题就简化成,能不能用一笔就把这个图形画出来。经过进一步的分析,欧拉得出结论——不可能每座桥都走一遍,最后回到原来的位置。并且给出了所有能够一笔画出来的图形所应具有的条件。这是拓扑学的“先声”。
在拓扑学的发展历史中,还有一个著名而且重要的关于多面体的定理也和欧拉有关。这个定理内容是:如果一个凸多面体的顶点数是v、棱数是e、面数是f,那么它们总有这样的关系:f+v-e=2。
根据多面体的欧拉定理,可以得出这样一个有趣的事实:只存在五种正多面体。它们是正四面体、正六面体、正八面体、正十二面体、正二十面体。
著名的“四色问题”也是与拓扑学发展有关的问题。四色问题又称四色猜想,是世界近代三大数学难题之一。
四色猜想的提出来自英国。1852年,毕业于伦敦大学的弗南西斯.格思里来到一家科研单位搞地图着色工作时,发现了一种有趣的现象:“看来,每幅地图都可以用四种颜色着色,使得有共同边界的国家都被着上不同的颜色。”
1872年,英国当时最著名的数学家凯利正式向伦敦数学学会提出了这个问题,于是四色猜想成了世界数学界关注的问题。世界上许多一流的数学家都纷纷参加了四色猜想的大会战。1878~1880年两年间,著名律师兼数学家肯普和泰勒两人分别提交了证明四色猜想的论文,宣布证明了四色定理。但后来数学家赫伍德以自己的精确计算指出肯普的证明是错误的。不久,泰勒的证明也被人们否定了。于是,人们开始认识到,这个貌似容易的题目,其实是一个可与费马猜想相媲美的难题。
进入20世纪以来,科学家们对四色猜想的证明基本上是按照肯普的想法在进行。电子计算机问世以后,由于演算速度迅速提高,加之人机对话的出现,大大加快了对四色猜想证明的进程。1976年,美国数学家阿佩尔与哈肯在美国伊利诺斯大学的两台不同的电子计算机上,用了1200个小时,作了100亿判断,终于完成了四色定理的证明。不过不少数学家并不满足于计算机取得的成就,他们认为应该有一种简捷明快的书面证明方法。
上面的几个例子所讲的都是一些和几何图形有关的问题,但这些问题又与传统的几何学不同,而是一些新的几何概念。这些就是“拓扑学”的先声。
什么是拓扑学?
拓扑学的英文名是Topology,直译是地志学,也就是和研究地形、地貌相类似的有关学科。我国早期曾经翻译成“形势几何学”、“连续几何学”、“一对一的连续变换群下的几何学”,但是,这几种译名都不大好理解,1956年统一的《数学名词》把它确定为拓扑学,这是按音译过来的。
拓扑学是几何学的一个分支,但是这种几何学又和通常的平面几何、立体几何不同。通常的平面几何或立体几何研究的对象是点、线、面之间的位置关系以及它们的度量性质。拓扑学对于研究对象的长短、大小、面积、体积等度量性质和数量关系都无关。
举例来说,在通常的平面几何里,把平面上的一个图形搬到另一个图形上,如果完全重合,那么这两个图形叫做全等形。但是,在拓扑学里所研究的图形,在运动中无论它的大小或者形状都发生变化。在拓扑学里没有不能弯曲的元素,每一个图形的大小、形状都可以改变。例如,前面讲的欧拉在解决哥尼斯堡七桥问题的时候,他画的图形就不考虑它的大小、形状,仅考虑点和线的个数。这些就是拓扑学思考问题的出发点。
拓扑性质有那些呢?首先我们介绍拓扑等价,这是比较容易理解的一个拓扑性质。
在拓扑学里不讨论两个图形全等的概念,但是讨论拓扑等价的概念。比如,尽管圆和方形、三角形的形状、大小不同,在拓扑变换下,它们都是等价图形。左图的三样东西就是拓扑等价的,换句话讲,就是从拓扑学的角度看,它们是完全一样的。
在一个球面上任选一些点用不相交的线把它们连接起来,这样球面就被这些线分成许多块。在拓扑变换下,点、线、块的数目仍和原来的数目一样,这就是拓扑等价。一般地说,对于任意形状的闭曲面,只要不把曲面撕裂或割破,他的变换就是拓扑变幻,就存在拓扑等价。
应该指出,环面不具有这个性质。比如像左图那样,把环面切开,它不至于分成许多块,只是变成一个弯曲的圆桶形,对于这种情况,我们就说球面不能拓扑的变成环面。所以球面和环面在拓扑学中是不同的曲面。
直线上的点和线的结合关系、顺序关系,在拓扑变换下不变,这是拓扑性质。在拓扑学中曲线和曲面的闭合性质也是拓扑性质。
我们通常讲的平面、曲面通常有两个面,就像一张纸有两个面一样。但德国数学家莫比乌斯(1790~1868)在1858年发现了莫比乌斯曲面。这种曲面就不能用不同的颜色来涂满两个侧面。
拓扑变换的不变性、不变量还有很多,这里不在介绍。
拓扑学建立后,由于其它数学学科的发展需要,它也得到了迅速的发展。特别是黎曼创立黎曼几何以后,他把拓扑学概念作为分析函数论的基础,更加促进了拓扑学的进展。
二十世纪以来,集合论被引进了拓扑学,为拓扑学开拓了新的面貌。拓扑学的研究就变成了关于任意点集的对应的概念。拓扑学中一些需要精确化描述的问题都可以应用集合来论述。
因为大量自然现象具有连续性,所以拓扑学具有广泛联系各种实际事物的可能性。通过拓扑学的研究,可以阐明空间的集合结构,从而掌握空间之间的函数关系。本世纪三十年代以后,数学家对拓扑学的研究更加深入,提出了许多全新的概念。比如,一致性结构概念、抽象距概念和近似空间概念等等。有一门数学分支叫做微分几何,是用微分工具来研究取线、曲面等在一点附近的弯曲情况,而拓扑学是研究曲面的全局联系的情况,因此,这两门学科应该存在某种本质的联系。1945年,美籍中国数学家陈省身建立了代数拓扑和微分几何的联系,并推进了整体几何学的发展。
拓扑学发展到今天,在理论上已经十分明显分成了两个分支。一个分支是偏重于用分析的方法来研究的,叫做点集拓扑学,或者叫做分析拓扑学。另一个分支是偏重于用代数方法来研究的,叫做代数拓扑。现在,这两个分支又有统一的趋势。
拓扑学在泛函分析、李群论、微分几何、微分方程额其他许多数学分支中都有广泛的应用。 实变函数论的产生
微积分产生于十七世纪,到了十八世纪末十九世纪初,微积分学已经基本上成熟了。数学家广泛地研究并建立起它的许多分支,是它很快就形成了数学中的一大部门,也就是数学分析。
也正是在那个时候,数学家逐渐发现分析基础本身还存在着学多问题。比如,什么是函数这个看上去简单而且十分重要的问题,数学界并没有形成一致的见解。以至长期争论者问题的这样和那样的解答,这样和那样的数学结果,弄不清究竟谁是正确的。又如,对于什么是连续性和连续函数的性质是什么,数学界也没有足够清晰的理解。
十九世纪初,曾经有人试图证明任何连续函数除个别点外总是可微的。后来,德国数学家维尔斯特拉斯提出了一个由级数定义的函数,这个函数是连续函数,但是维尔斯特拉斯证明了这个函数在任何点上都没有导数。这个证明使许多数学家大为吃惊。
由于发现了某些函数的奇特性质,数学家对函数的研究更加深入了。人们又陆续发现了有些函数是连续的但处处不可微,有的函数的有限导数并不黎曼可积;还发现了连续但是不分段单调的函数等等。这些都促使数学家考虑,我们要处理的函数,仅仅依靠直观观察和猜测是不行的,必须深入研究各种函数的性质。比如,连续函数必定可积,但是具有什么性质的不连续函数也可积呢?如果改变积分的定义,可积分条件又是什么样的?连续函数不一定可导,那么可导的充分必要条件由是什么样的?……
上面这些函数性质问题的研究,逐渐产生了新的理论,并形成了一门新的学科,这就是实变函数。
实变函数的内容
以实数作为自变量的函数就做实变函数,以实变函数作为研究对象的数学分支就叫做实变函数论。它是微积分学的进一步发展,它的基础是点集论。什么是点集论呢?点集论是专门研究点所成的集合的性质的理论。也可以说实变函数论是在点集论的基础上研究分析数学中的一些最基本的概念和性质的。比如,点集函数、序列、极限、连续性、可微性、积分等。实变函数论还要研究实变函数的分类问题、结构问题。
实变函数论的内容包括实值函数的连续性质、微分理论、积分理论和测度论等。这里我们只对它的一些重要的基本概念作简要的介绍。
实变函数论的积分理论研究各种积分的推广方法和它们的运算规则。由于积分归根到底是数的运算,所以在进行积分的时候,必须给各种点集以一个数量的概念,这个概念叫做测度。
什么实测度呢?简单地说,一条线段的长度就是它的测度。测度的概念对于实变函数论十分重要。集合的测度这个概念实由法国数学家勒贝格提出来的。
为了推广积分概念,1893年,约当在他所写的《分析教程》中,提出了“约当容度”的概念并用来讨论积分。1898年,法国数学家波莱尔把容度的概念作了改进,并把它叫做测度。波莱尔的学生勒贝格后来发表《积分、长度、面积》的论文,提出了“勒贝格测度”、“勒贝格积分”的概念。勒贝格还在他的论文《积分和圆函数的研究》中,证明了有界函数黎曼可积的充分必要条件是不连续点构成一个零测度集,这就完全解决了黎曼可积性的问题。
勒贝格积分可以推广到无界函数的情形,这个时候所得积分是绝对收敛的,后来由推广到积分可以不是绝对收敛的。从这些就可以看出,勒贝格积分比起由柯西给出后来又由黎曼发扬的老积分定义广大多了。也可以看出,实变函数论所研究的是更为广泛的函数类。
自从维尔斯特拉斯证明连续函数必定可以表示成一致收敛的多项式级数,人们就认清连续函数必定可以解析地表达出来,连续函数也必定可以用多项式来逼近。这样,在实变函数论的领域里又出现了逼近论的理论。
什么是逼近理论呢?举例来说,如果能把 A类函数表示成 B类函数的极限,就说 A类函数能以 B类函数来逼近。如果已经掌握了 B类函数的某些性质,那么往往可以由此推出 A类函数的相应性质。逼近论就是研究那一类函数可以用另一类函数来逼近、逼近的方法、逼近的程度和在逼近中出现的各种情况。
和逼近理论密切相关的有正交级数理论,三角级数就是一种正交级数。和逼近理论相关的还有一种理论,就是从某一类已知函数出发构造出新的函数类型的理论,这种理论叫做函数构造论。
总之,实变函数论和古典数学分析不同,它是一种比较高深精细的理论,是数学的一个重要分支,它的应用广泛,它在数学各个分支的应用是现代数学的特征。
实变函数论不仅应用广泛,是某些数学分支的基本工具,而且它的观念和方法以及它在各个数学分支的应用,对形成近代数学的一般拓扑学和泛涵分析两个重要分支有着极为重要的影响。 概率论和数理统计
在自然界和现实生活中,一些事物都是相互联系和不断发展的。在它们彼此间的联系和发展中,根据它们是否有必然的因果联系,可以分成截然不同的两大类:一类是确定性的现象。这类现象是在一定条件下,必定会导致某种确定的结果。举例来说,在标准大气压下,水加热到100摄氏度,就必然会沸腾。事物间的这种联系是属于必然性的。通常的自然科学各学科就是专门研究和认识这种必然性的,寻求这类必然现象的因果关系,把握它们之间的数量规律。
另一类是不确定性的现象。这类现象是在一定条件下,它的结果是不确定的。举例来说,同一个工人在同一台机床上加工同一种零件若干个,它们的尺寸总会有一点差异。又如,在同样条件下,进行小麦品种的人工催芽试验,各棵种子的发芽情况也不尽相同,有强弱和早晚的分别等等。为什么在相同的情况下,会出现这种不确定的结果呢?这是因为,我们说的“相同条件”是指一些主要条件来说的,除了这些主要条件外,还会有许多次要条件和偶然因素又是人们无法事先一一能够掌握的。正因为这样,我们在这一类现象中,就无法用必然性的因果关系,对个别现象的结果事先做出确定的答案。事物间的这种关系是属于偶然性的,这种现象叫做偶然现象,或者叫做随机现象。
在自然界,在生产、生活中,随机现象十分普遍,也就是说随机现象是大量存在的。比如:每期体育彩票的中奖号码、同一条生产线上生产的灯泡的寿命等,都是随机现象。因此,我们说:随机现象就是:在同样条件下,多次进行同一试验或调查同一现象,所的结果不完全一样,而且无法准确地预测下一次所得结果的现象。随机现象这种结果的不确定性,是由于一些次要的、偶然的因素影响所造成的。
随机现象从表面上看,似乎是杂乱无章的、没有什么规律的现象。但实践证明,如果同类的随机现象大量重复出现,它的总体就呈现出一定的规律性。大量同类随机现象所呈现的这种规律性,随着我们观察的次数的增多而愈加明显。比如掷硬币,每一次投掷很难判断是那一面朝上,但是如果多次重复的掷这枚硬币,就会越来越清楚的发现它们朝上的次数大体相同。
我们把这种由大量同类随机现象所呈现出来的集体规律性,叫做统计规律性。概率论和数理统计就是研究大量同类随机现象的统计规律性的数学学科。
概率论的产生和发展
概率论产生于十七世纪,本来是又保险事业的发展而产生的,但是来自于赌博者的请求,却是数学家们思考概率论中问题的源泉。
早在1654年,有一个赌徒梅累向当时的数学家帕斯卡提出一个使他苦恼了很久的问题:“两个赌徒相约赌若干局,谁先赢 m局就算赢,全部赌本就归谁。但是当其中一个人赢了 a (a<m)局,另一个人赢了 b(b<m)局的时候,赌博中止。问:赌本应该如何分法才合理?”后者曾在1642年发明了世界上第一台机械加法计算机。
三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯企图自己解决这一问题,结果写成了《论机会游戏的计算》一书,这就是最早的概率论著作。
近几十年来,随着科技的蓬勃发展,概率论大量应用到国民经济、工农业生产及各学科领域。许多兴起的应用数学,如信息论、对策论、排队论、控制论等,都是以概率论作为基础的。
概率论和数理统计是一门随机数学分支,它们是密切联系的同类学科。但是应该指出,概率论、数理统计、统计方法又都各有它们自己所包含的不同内容。
概率论——是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性作出一种客观的科学判断,对这种出现的可能性大小做出数量上的描述;比较这些可能性的大小、研究它们之间的联系,从而形成一整套数学理论和方法。
数理统计——是应用概率的理论来研究大量随机现象的规律性;对通过科学安排的一定数量的实验所得到的统计方法给出严格的理论证明;并判定各种方法应用的条件以及方法、公式、结论的可靠程度和局限性。使我们能从一组样本来判定是否能以相当大的概率来保证某一判断是正确的,并可以控制发生错误的概率。
统计方法——是一上提供的方法在各种具体问题中的应用,它不去注意这些方法的的理论根据、数学论证。
应该指出,概率统计在研究方法上有它的特殊性,和其它数学学科的主要不同点有:
第一,由于随机现象的统计规律是一种集体规律,必须在大量同类随机现象中才能呈现出来,所以,观察、试验、调查就是概率统计这门学科研究方法的基石。但是,作为数学学科的一个分支,它依然具有本学科的定义、公理、定理的,这些定义、公理、定理是来源于自然界的随机规律,但这些定义、公理、定理是确定的,不存在任何随机性。
第二,在研究概率统计中,使用的是“由部分推断全体”的统计推断方法。这是因为它研究的对象——随机现象的范围是很大的,在进行试验、观测的时候,不可能也不必要全部进行。但是由这一部分资料所得出的一些结论,要全体范围内推断这些结论的可靠性。
第三,随机现象的随机性,是指试验、调查之前来说的。而真正得出结果后,对于每一次试验,它只可能得到这些不确定结果中的某一种确定结果。我们在研究这一现象时,应当注意在试验前能不能对这一现象找出它本身的内在规律。
概率论的内容
概率论作为一门数学分支,它所研究的内容一般包括随机事件的概率、统计独立性和更深层次上的规律性。
概率是随机事件发生的可能性的数量指标。在独立随机事件中,如果某一事件在全部事件中出现的频率,在更大的范围内比较明显的稳定在某一固定常数附近。就可以认为这个事件发生的概率为这个常数。对于任何事件的概率值一定介于 0和 1之间。
有一类随机事件,它具有两个特点:第一,只有有限个可能的结果;第二,各个结果发生的可能性相同。具有这两个特点的随机现象叫做“古典概型”。
在客观世界中,存在大量的随机现象,随机现象产生的结果构成了随机事件。如果用变量来描述随机现象的各个结果,就叫做随机变量。
随机变量有有限和无限的区分,一般又根据变量的取值情况分成离散型随机变量和非离散型随机变量。一切可能的取值能够按一定次序一一列举,这样的随机变量叫做离散型随机变量;如果可能的取值充满了一个区间,无法按次序一一列举,这种随机变量就叫做非离散型随机变量。
在离散型随机变量的概率分布中,比较简单而应用广泛的是二项式分布。如果随机变量是连续的,都有一个分布曲线,实践和理论都证明:有一种特殊而常用的分布,它的分布曲线是有规律的,这就是正态分布。正态分布曲线取决于这个随机变量的一些表征数,其中最重要的是平均值和差异度。平均值也叫数学期望,差异度也就是标准方差。
数理统计的内容
数理统计包括抽样、适线问题、假设检验、方差分析、相关分析等内容。抽样检验是要通过对子样的调查,来推断总体的情况。究竟抽样多少,这是十分重要的问题,因此,在抽样检查中就产生了“小样理论”,这是在子样很小的情况下,进行分析判断的理论。
适线问题也叫曲线拟和。有些问题需要根据积累的经验数据来求出理论分布曲线,从而使整个问题得到了解。但根据什么原则求理论曲线?如何比较同一问题中求出的几种不同曲线?选配好曲线,有如何判断它们的误差?……就属于数理统计中的适线问题的讨论范围。
假设检验是只在用数理统计方法检验产品的时候,先作出假设,在根据抽样的结果在一定可靠程度上对原假设做出判断。
方差分析也叫做离差分析,就是用方差的概念去分析由少数试验就可以做出的判断。
由于随机现象在人类的实际活动中大量存在,概率统计随着现代工农业、近代科技的发展而不断发展,因而形成了许多重要分支。如:随机过程、信息论、极限理论、试验设计、多元分析等。 复 变 函 数 论
复数的概念起源于求方程的根,在二次、三次代数方程的求根中就出现了负数开平方的情况。在很长时间里,人们对这类数不能理解。但随着数学的发展,这类数的重要性就日益显现出来。复数的一般形式是:a+bi,其中i是虚数单位。
以复数作为自变量的函数就叫做复变函数,而与之相关的理论就是复变函数论。解析函数是复变函数中一类具有解析性质的函数,复变函数论主要就研究复数域上的解析函数,因此通常也称复变函数论为解析函数论。
复变函数论的发展简况
复变函数论产生于十八世纪。1774年,欧拉在他的一篇论文中考虑了由复变函数的积分导出的两个方程。而比他更早时,法国数学家达朗贝尔在他的关于流体力学的论文中,就已经得到了它们。因此,后来人们提到这两个方程,把它们叫做“达朗贝尔-欧拉方程”。到了十九世纪,上述两个方程在柯西和黎曼研究流体力学时,作了更详细的研究,所以这两个方程也被叫做“柯西-黎曼条件”。
复变函数论的全面发展是在十九世纪,就像微积分的直接扩展统治了十八世纪的数学那样,复变函数这个新的分支统治了十九世纪的数学。当时的数学家公认复变函数论是最丰饶的数学分支,并且称为这个世纪的数学享受,也有人称赞它是抽象科学中最和谐的理论之一。
为复变函数论的创建做了最早期工作的是欧拉、达朗贝尔,法国的拉普拉斯也随后研究过复变函数的积分,他们都是创建这门学科的先驱。
后来为这门学科的发展作了大量奠基工作的要算是柯西、黎曼和德国数学家维尔斯特拉斯。二十世纪初,复变函数论又有了很大的进展,维尔斯特拉斯的学生,瑞典数学家列夫勒、法国数学家彭加勒、阿达玛等都作了大量的研究工作,开拓了复变函数论更广阔的研究领域,为这门学科的发展做出了贡献。
复变函数论在应用方面,涉及的面很广,有很多复杂的计算都是用它来解决的。比如物理学上有很多不同的稳定平面场,所谓场就是每点对应有物理量的一个区域,对它们的计算就是通过复变函数来解决的。
比如俄国的茹柯夫斯基在设计飞机的时候,就用复变函数论解决了飞机机翼的结构问题,他在运用复变函数论解决流体力学和航空力学方面的问题上也做出了贡献。
复变函数论不但在其他学科得到了广泛的应用,而且在数学领域的许多分支也都应用了它的理论。它已经深入到微分方程、积分方程、概率论和数论等学科,对它们的发展很有影响。
复变函数论的内容
复变函数论主要包括单值解析函数理论、黎曼曲面理论、几何函数论、留数理论、广义解析函数等方面的内容。
如果当函数的变量取某一定值的时候,函数就有一个唯一确定的值,那么这个函数解就叫做单值解析函数,多项式就是这样的函数。
复变函数也研究多值函数,黎曼曲面理论是研究多值函数的主要工具。由许多层面安放在一起而构成的一种曲面叫做黎曼曲面。利用这种曲面,可以使多值函数的单值枝和枝点概念在几何上有非常直观的表示和说明。对于某一个多值函数,如果能作出它的黎曼曲面,那么,函数在离曼曲面上就变成单值函数。
黎曼曲面理论是复变函数域和几何间的一座桥梁,能够使我们把比较深奥的函数的解析性质和几何联系起来。近来,关于黎曼曲面的研究还对另一门数学分支拓扑学有比较大的影响,逐渐地趋向于讨论它的拓扑性质。
复变函数论中用几何方法来说明、解决问题的内容,一般叫做几何函数论,复变函数可以通过共形映象理论为它的性质提供几何说明。导数处处不是零的解析函数所实现的映像就都是共形映象,共形映像也叫做保角变换。共形映象在流体力学、空气动力学、弹性理论、静电场理论等方面都得到了广泛的应用。
留数理论是复变函数论中一个重要的理论。留数也叫做残数,它的定义比较复杂。应用留数理论对于复变函数积分的计算比起线积分计算方便。计算实变函数定积分,可以化为复变函数沿闭回路曲线的积分后,再用留数基本定理化为被积分函数在闭合回路曲线内部孤立奇点上求留数的计算,当奇点是极点的时候,计算更加简洁。
把单值解析函数的一些条件适当地改变和补充,以满足实际研究工作的需要,这种经过改变的解析函数叫做广义解析函数。广义解析函数所代表的几何图形的变化叫做拟保角变换。解析函数的一些基本性质,只要稍加改变后,同样适用于广义解析函数。
广义解析函数的应用范围很广泛,不但应用在流体力学的研究方面,而且象薄壳理论这样的固体力学部门也在应用。因此,近年来这方面的理论发展十分迅速。
从柯西算起,复变函数论已有170多年的历史了。它以其完美的理论与精湛的技巧成为数学的一个重要组成部分。它曾经推动过一些学科的发展,并且常常作为一个有力的工具被应用在实际问题中,它的基础内容已成为理工科很多专业的必修课程。现在,复变函数论中仍然有不少尚待研究的课题,所以它将继续向前发展,并将取得更多应用。 泛 函 分 析
泛函分析是研究拓扑线性空间到拓扑线性空间之间满足各种拓扑和代数条件的映射的分支学科。它是20世纪30年代形成的。从变分法、微分方程、积分方程、函数论以及量子物理等的研究中发展起来的,它运用几何学、代数学的观点和方法研究分析学的课题,可看作无限维的分析学。
泛函分析的产生
十九世纪以来,数学的发展进入了一个新的阶段。这就是,由于对欧几里得第五公设的研究,引出了非欧几何这门新的学科;对于代数方程求解的一般思考,最后建立并发展了群论;对数学分析的研究又建立了集合论。这些新的理论都为用统一的观点把古典分析的基本概念和方法一般化准备了条件。
本世纪初,瑞典数学家弗列特荷姆和法国数学家阿达玛发表的著作中,出现了把分析学一般化的萌芽。随后,希尔伯特和海令哲来创了“希尔伯特空间”的研究。到了二十年代,在数学界已经逐渐形成了一般分析学,也就是泛函分析的基本概念。
由于分析学中许多新部门的形成,揭示出分析、代数、集合的许多概念和方法常常存在相似的地方。比如,代数方程求根和微分方程求解都可以应用逐次逼近法,并且解的存在和唯一性条件也极其相似。这种相似在积分方程论中表现得就更为突出了。泛函分析的产生正是和这种情况有关,有些乍看起来很不相干的东西,都存在着类似的地方。因此它启发人们从这些类似的东西中探寻一般的真正属于本质的东西。
非欧几何的确立拓广了人们对空间的认知,n维空间几何的产生允许我们把多变函数用几何学的语言解释成多维空间的影响。这样,就显示出了分析和几何之间的相似的地方,同时存在着把分析几何化的一种可能性。这种可能性要求把几何概念进一步推广,以至最后把欧氏空间扩充成无穷维数的空间。
这时候,函数概念被赋予了更为一般的意义,古典分析中的函数概念是指两个数集之间所建立的一种对应关系。现代数学的发展却是要求建立两个任意集合之间的某种对应关系。
这里我们先介绍一下算子的概念。算子也叫算符,在数学上,把无限维空间到无限维空间的变换叫做算子。
研究无限维线性空间上的泛函数和算子理论,就产生了一门新的分析数学,叫做泛函分析。在二十世纪三十年代,泛函分析就已经成为数学中一门独立的学科了。
泛函分析的特点和内容
泛函分析的特点是它不但把古典分析的基本概念和方法一般化了,而且还把这些概念和方法几何化了。比如,不同类型的函数可以看作是“函数空间”的点或矢量,这样最后得到了“抽象空间”这个一般的概念。它既包含了以前讨论过的几何对象,也包括了不同的函数空间。
泛函分析对于研究现代物理学是一个有力的工具。n维空间可以用来描述具有n个自由度的力学系统的运动,实际上需要有新的数学工具来描述具有无穷多自由度的力学系统。比如梁的震动问题就是无穷多自由度力学系统的例子。一般来说,从质点力学过渡到连续介质力学,就要由有穷自由度系统过渡到无穷自由度系统。现代物理学中的量子场理论就属于无穷自由度系统。
正如研究有穷自由度系统要求 n维空间的几何学和微积分学作为工具一样,研究无穷自由度的系统需要无穷维空间的几何学和分析学,这正是泛函分析的基本内容。因袭,泛函分析也可以通俗的叫做无穷维空间的几何学和微积分学。古典分析中的基本方法,也就是用线性的对象去逼近非线性的对象,完全可以运用到泛函分析这门学科中。
泛函分析是分析数学中最“年轻”的分支,它是古典分析观点的推广,它综合函数论、几何和代数的观点研究无穷维向量空间上的函数、算子、和极限理论。他在二十世纪四十到五十年代就已经成为一门理论完备、内容丰富的数学学科了。
半个多世纪来,泛函分析一方面以其他众多学科所提供的素材来提取自己研究的对象,和某些研究手段,并形成了自己的许多重要分支,例如算子谱理论、巴拿赫代数、拓扑线性空间理论、广义函数论等等;另一方面,它也强有力地推动着其他不少分析学科的发展。它在微分方程、概率论、函数论、连续介质力学、量子物理、计算数学、控制论、最优化理论等学科中都有重要的应用,还是建立群上调和分析理论的基本工具,也是研究无限个自由度物理系统的重要而自然的工具之一。今天,它的观点和方法已经渗入到不少工程技术性的学科之中,已成为近代分析的基础之一。
泛函分析在数学物理方程、概率论、计算数学、连续介质力学、量子物理学等学科有着广泛的应用。近十几年来,泛函分析在工程技术方面有获得更为有效的应用。它还渗透到数学内部的各个分支中去,起着重要的作用。 偏 微 分 方 程
偏微分方程的起源
如果一个微分方程中出现的未知函数只含一个自变量,这个方程叫做常微分方程,也简称微分方程;如果一个微分方程中出现多元函数的偏导数,或者说如果未知函数和几个变量有关,而且方程中出现未知函数对几个变量的导数,那么这种微分方程就是偏微分方程。
在科学技术日新月异的发展过程中,人们研究的许多问题用一个自变量的函数来描述已经显得不够了,不少问题有多个变量的函数来描述。比如,从物理角度来说,物理量有不同的性质,温度、密度等是用数值来描述的叫做纯量;速度、电场的引力等,不仅在数值上有不同,而且还具有方向,这些量叫做向量;物体在一点上的张力状态的描述出的量叫做张量,等等。这些量不仅和时间有关系,而且和空间坐标也有联系,这就要用多个变量的函数来表示。
应该指出,对于所有可能的物理现象用某些多个变量的函数表示,只能是理想化的,如介质的密度,实际上“在一点”的密度是不存在的。而我们把在一点的密度看作是物质的质量和体积的比当体积无限缩小的时候的极限,这就是理想化的。介质的温度也是这样。这样就产生了研究某些物理现象的理想了的多个变量的函数方程,这种方程就是偏微分方程。
微积分方程这门学科产生于十八世纪,欧拉在他的著作中最早提出了弦振动的二阶方程,随后不久,法国数学家达朗贝尔也在他的著作《论动力学》中提出了特殊的偏微分方程。这些著作当时没有引起多大注意。1746年,达朗贝尔在他的论文《张紧的弦振动时形成的曲线的研究》中,提议证明无穷多种和正弦曲线不同的曲线是振动的模式。这样就由对弦振动的研究开创了偏微分方程这门学科。
和欧拉同时代的瑞士数学家丹尼尔·贝努利也研究了数学物理方面的问题,提出了解弹性系振动问题的一般方法,对偏微分方程的发展起了比较大的影响。拉格朗日也讨论了一阶偏微分方程,丰富了这门学科的内容。
偏微分方程得到迅速发展是在十九世纪,那时候,数学物理问题的研究繁荣起来了,许多数学家都对数学物理问题的解决做出了贡献。这里应该提一提法国数学家傅立叶,他年轻的时候就是一个出色的数学学者。在从事热流动的研究中,写出了《热的解析理论》,在文章中他提出了三维空间的热方程,也就是一种偏微分方程。他的研究对偏微分方程的发展的影响是很大的。
偏微分方程的内容
偏微分方程是什么样的?它包括哪些内容?这里我们可从一个例子的研究加以介绍。
弦振动是一种机械运动,当然机械运动的基本定律是质点力学的 F=ma,但是弦并不是质点,所以质点力学的定律并不适用在弦振动的研究上。然而,如果我们把弦细细地分成若干个极小极小的小段,每一小段抽象地看作是一个质点,这样我们就可以应用质点力学的基本定律了。
弦是指又细又长的弹性物质,比如弦乐器所用的弦就是细长的、柔软的、带有弹性的。演奏的时候,弦总是绷紧着具有一种张力,这种张力大于弦的重量几万倍。当演奏的人用薄片拨动或者用弓在弦上拉动,虽然只因其所接触的一段弦振动,但是由于张力的作用,传播到使整个弦振动起来。
用微分的方法分析可得到弦上一点的位移是这一点所在的位置和时间为自变量的偏微分方程。偏方程又很多种类型,一般包括椭圆型偏微分方程、抛物型偏微分方程、双曲型偏微分方程。上述的例子是弦振动方程,它属于数学物理方程中的波动方程,也就是双曲型偏微分方程。
偏微分方程的解一般有无穷多个,但是解决具体的物理问题的时候,必须从中选取所需要的解,因此,还必须知道附加条件。因为偏微分方程是同一类现象的共同规律的表示式,仅仅知道这种共同规律还不足以掌握和了解具体问题的特殊性,所以就物理现象来说,各个具体问题的特殊性就在于研究对象所处的特定条件,就是初始条件和边界条件。
拿上面所举的弦振动的例子来说,对于同样的弦的弦乐器,如果一种是以薄片拨动弦,另一种是以弓在弦上拉动,那么它们发出的声音是不同的。原因就是由于“拨动”或“拉动”的那个“初始”时刻的振动情况不同,因此产生后来的振动情况也就不同。
天文学中也有类似情况,如果要通过计算预言天体的运动,必须要知道这些天体的质量,同时除了牛顿定律的一般公式外,还必须知道我们所研究的天体系统的初始状态,就是在某个起始时间,这些天体的分布以及它们的速度。在解决任何数学物理方程的时候,总会有类似的附加条件。
就弦振动来说,弦振动方程只表示弦的内点的力学规律,对弦的端点就不成立,所以在弦的两端必须给出边界条件,也就是考虑研究对象所处的边界上的物理状况。边界条件也叫做边值问题。
当然,客观实际中也还是有“没有初始条件的问题”,如定场问题(静电场、稳定浓度分布、稳定温度分布等),也有“没有边界条件的问题”,如着重研究不靠近两端的那段弦,就抽象的成为无边界的弦了。
在数学上,初始条件和边界条件叫做定解条件。偏微分方程本身是表达同一类物理现象的共性,是作为解决问题的依据;定解条件却反映出具体问题的个性,它提出了问题的具体情况。方程和定解条件合而为一体,就叫做定解问题。
求偏微分方程的定解问题可以先求出它的通解,然后再用定解条件确定出函数。但是一般来说,在实际中通解是不容易求出的,用定解条件确定函数更是比较困难的。
偏微分方程的解法还可以用分离系数法,也叫做傅立叶级数;还可以用分离变数法,也叫做傅立叶变换或傅立叶积分。分离系数法可以求解有界空间中的定解问题,分离变数法可以求解无界空间的定解问题;也可以用拉普拉斯变换法去求解一维空间的数学物理方程的定解。对方程实行拉普拉斯变换可以转化成常微分方程,而且初始条件也一并考虑到,解出常微分方程后进行反演就可以了。
应该指出,偏微分方程的定解虽然有以上各种解法,但是我们不能忽视由于某些原因有许多定解问题是不能严格解出的,只可以用近似方法求出满足实际需要的近似程度的近似解。
常用的方法有变分法和有限差分法。变分法是把定解问题转化成变分问题,再求变分问题的近似解;有限差分法是把定解问题转化成代数方程,然后用计算机进行计算;还有一种更有意义的模拟法,它用另一个物理的问题实验研究来代替所研究某个物理问题的定解。虽然物理现象本质不同,但是抽象地表示在数学上是同一个定解问题,如研究某个不规则形状的物体里的稳定温度分布问题,在数学上是拉普拉斯方程的边值问题,由于求解比较困难,可作相应的静电场或稳恒电流场实验研究,测定场中各处的电势,从而也解决了所研究的稳定温度场中的温度分布问题。
随着物理科学所研究的现象在广度和深度两方面的扩展,偏微分方程的应用范围更广泛。从数学自身的角度看,偏微分方程的求解促使数学在函数论、变分法、级数展开、常微分方程、代数、微分几何等各方面进行发展。从这个角度说,偏微分方程变成了数学的中心。 全息拓扑学理论和大脑思维的数学模型
毕 家 祥
E-mail: bjx@ihw.com.cn
摘要:本文试将全息原理和拓扑学方法结合在一起,建立起了一种全息拓扑理论的公理化体系,本文介绍了一种新的大脑思维的数学模型:全息空间,分析了全息空间中的各种拓扑相关关系,研究了全息拓扑结构的特性。本文指出在大脑思维中信息的编码方式具有以商空间的某种等价关系为基础的自然编码的特点,并按照全息拓扑理论的方法,进一步对大脑智能和人工智能存储,处理信息的过程和信息的多层次结构作了较为详细的分析和阐述。
关键词:全息空间;全息拓扑;延拓;聚类反应;自然编码;全息软件
§1. 引 言
思维的本质是什么?怎样去认识人类思维的规律性?机器能否具备思维功能,能否形成自己的独特的概念和意识?机器概念或意识是什么,将可能以什么样的形式出现?大脑是怎样对信息进行编码的?人工智能最终能否实现,其是否有不可逾越的障碍,在这一方面我们应该沿着什么方向、什么途径去探索……,这些问题涉及到一个十分困难的研究课题——人工智能。
智能¾¾即智力功能,其是人类大脑所具有的感知、认识、学习、理解、分析、综合、判断、推理、创造……等局部功能的总和与它们的有机综合的统称;因此,完善的智能中不能不包含有人类的情感、意识、意志等这种高级因素。
何为人工智能?人工智能就是利用设备或机器,用人工的方法,对人脑的思维活动过程进行模拟;当使得设备或机器的功能与脑功能大体等价时,这种设备或机器的功能就可以认为是具有某种程度的人工智能。人工智能应该以平均智力商为评定标准,并在与对比者(人)同等条件状况下进行全面地综合测试或进行某几种局部功能的单项测试;当测试结果不低于规定的智力商数时,应当承认该设备或机器具有某种程度或某种意义的人工智能。
人工智能问题是一个古老的但又是十分新颖的研究课题。近十多年来,各国研究人员在人工智能的研究上都已经获得巨大的进展,然而各种传统的或新颖的智能模型迄今还不能完全而圆满地对大脑思维活动的过程进行解释和模拟,人们还不十分了解信息在大脑中的底层结构和编码方法;其中特别是象人们的概念、意识、情感和创造性思维过程等,还根本无从着手;同时关于这一方面,在哲学上、自然科学上还有很大的争论,还不能得到哲学界和自然科学界的一致认同。为了进行这一方面的探讨,本文从信息系统内部整体结构和精细结构的互相关系,系统内各级子系统、子结构之间的互相作用,系统整体和局部区域的互相影响等几个问题出发,以整体相关性原理为基础,提出了全息空间模型。并研究了全息空间的结构和该结构在局部变化时对整体的影响,以及全息空间的结构上的延伸等问题。描述了全息空间的高层结构在局部空间连续变换时的整体不变性和定义域不变性。指出了在全息空间中可能隐含着未知的信息集合,即关于概念本身的延拓和扩展能否产生新的未知的结果——而这个新的结果又能否被旧的结构形式所蕴涵和容纳。……这些,当然是属于拓扑学范畴的东西,因此,本文把研究这一类问题的这种理论方法取名为“全息拓扑”分析法。
顾名思义,全息拓扑理论又可以称为“信息集合的整体结构的理论”,研究的对象是关于信息集合内部元素的有秩序组合在集合的整体上或新的层次上所表现出来的整体性的新的性质的问题。而这种整体性是一种高级层次上的整体性,新的性质也只有在这种高级层次上才能体现出来。思维是一个十分复杂的生理的和心理的过程,它牵涉面极为广泛;然而对于思维过程的规律性进行深入细致的了解和研究就更加复杂和困难。因此,能够正确地选择研究方法和选择适当的模型是十分重要的。
本文从研究信息的结构入手,首先建立了“特征信息”这一概念,然后通过特征信息在存储器中的有机组合而构成了一种连续的、统一的高级组织:“全息空间”。全息空间是信息空间的内在结构发生质变后的高级组织形式,它脱离了原信息空间中各个信息元素或子空间之间毫不相关,互相独立存在的那种初级随机组合形式,而使得整个信息空间内部的元素组成一个统一的有机的整体,并使得这个整体内部在高级层次上产生出新的重要的性质。根据这些性质,我们可以看到,全息空间模型的信息存储方式和结构形式与大脑存储信息的方式十分地相似,大脑存储和处理信息的方式在微观(细胞、神经元)上的整体性与非特异性和在宏观上的局部性与特异性同样地在全息空间中都有所体现。另外,还有一点重要的原因是:全息空间的简化模型有一定的规律性,它可以直接利用电子计算机来模拟;这将为我们在局部上更改和校正模型提供了极大的方便。
全息拓扑理论是专为研究大脑的思维规律和人工智能而建立的一种纯数学的理论体系,当然,它必然地会涉及生命科学和其他一些领域。利用全息拓扑理论,我们已经获得一些有益的和新颖的研究结果,对这方面感兴趣的研究者可参阅本文的第三部分。
本文将在下面分三大部分讨论与研究有关全息拓扑公理体系方面或人工智能方面的几个问题:
1.确立和讨论全息拓扑的公理体系;
2.讨论和分析全息拓扑理论的多层次拓扑相关特性;
3. 讨论和分析某些人工智能方面的问题,介绍一种自然界所特有的编码方法:自然编码方法;并分析了大脑中信息的多层次结构的特点和性质。
第一部分:全息空间的拓扑结构
§2. 全息空间的公理化体系
公理1 信息结构整体相关公理: 对于足够多个互相关联的特征信息元素,当元素、元素的性质、元素在存储器中的坐标这三者在存储器中互相确认,因而决定了信息存储器的空间结构以后,存储器的空间坐标能够决定任何一个孤立点上的元素的性质或者是任何一部分子空间的空间结构。
公理2 分割后的可测子空间同势公理: 当把全息空间进行任意次有限分割后,它的任意一个可测的被分割了的子空间与原来的整个空间同势并且有相同的空间测度。
公理3 线性组合的定义域不变性公理: 在全息空间中确定任意的一个区域D,那么在D的邻域内所有子空间的全体线性组合及其派生将依然被确定在原先的全息空间上。
§2.1 信息空间的基本构造
设E是一些特征信息的集合,e∈E,M是一个信息存储器,x 是M中的坐标或存储单元。如果用符号EÞM表示将E的元素装入到存储器M之中,我们称为把E中的元素赋予M,e i x j表示元素e i被存入存储单元x j 中,符号V表示一种从E到存储器M的连接关系,使M中的某些存储单元,都被存入一个特定的信息元素。那么,我们将:W=( E V M )½ ={( e i,x j )½ e i∈E, x j∈M,e ix j}定义为赋予了关于E的信息的信息空间。
定义2.1 在存储器M中的信息集合{e}的全体和M的坐标一起,合成为一个完整的结合体,叫一个信息空间;记作:W。
定义2.2 由定义2.1可知,未被赋予有信息的存储器本身由于不含有信息,故不能构成信息空间;同样,当信息集合{e}未能被赋予信息存储器时,信息集合本身由于没有空间结构,也不能叫作信息空间。
定义2.3 设A,B是两个特征信息集合,x (x) 是某个信息元素x在M中的坐标;并且元素a i∈A,b j∈B。如果A,B Þ M,使得W A=( A V M ),W B=( B V M );当:1 ) A Ì B,2 ) {x (a i)}Ì {x (b j) },3 ) 当且仅当在a i~b j时,有x (a i) ~x (b j ) 这三个条件被满足的时候,则称W A是W B的一个子空间,记作:W A Ì W B 。( i , j = 1, 2, …… )
定义2.4 设a 0∈W,点x (a 0)是其在W中的坐标,e >0;则对于W中所有到点x (a 0)的距离小于e 的点所作成的集合,称为以x (a 0)为中心,以e 为半径的x (a 0)的e -邻域,记作:N (x (a 0), e ) 。其占有的空间范围,称为是N (x (a 0), e )的空间测度,记作:m (x (a 0),e ) 。其内部包含的信息元素的数目多少,称为是N(x (a 0),e )的密度测度,记作:mD (x (a 0),e ) 。
定义2.5 W中所包含的信息元素的数目的多少叫信息空间的势,记作:À 0 。
定义2.6 若W中的元素是以某个点的e -邻域作成一个极小区域,并用这个区域的连续形式来确定的元素,而不是离散的点,则W中的元素的数目我们就称为连续势,记作:À 。
定义2.7 当两个信息空间 W A,W B之间有共同的部分或边界,并且在共同边界处不存在着任何间断时,它们就叫作连通的。
定义2.8 当且仅当W中的任意两个子空间之间都是连通的时候,W方为连通;否则,W为不连通或不完全连通。
下面,我们对这种随机的空间结构在概念上进行延伸,考察一下其中一种特殊的,真正有用的有序化了的空间结构形式:全息空间结构。
§2.2 全息空间的构造
假设构造一种信息空间,通过一定的关系,使整个空间有机地连通起来,并使得在W中的任何一个元素a均具有如下的性质:
(1) a∈A Ì W:;其中A是由a的一个小小邻域内的所有的元素作成的子空间;
(2) 除了A以外,其它的子空间A i ( i = 1, 2, … … ) 中也都包含有信息元素a,或隐含有a;当子空间A i的数目极多,以至于复盖了整个W时,使得元素a被整个空间的任何区域所隐含,或者使得a被所有不属于自身的其它元素所隐含。
这样,当a取遍了整个空间中的所有元素,而使得这些元素中的任何一个均可能具备有如上的性质时,可以进一步使得整个空间中的所有元素都被整个空间内的任何区域所隐含。当我们给定了某一个元素在空间中的坐标以后,坐标上元素的性质或特征也随之被确定;并且当每一个元素被信息空间承认并确定以后,其邻域的元素的性质或特征也同时被间接地确定下来。我们将这种空间各个部分均包含了所有信息及其结构、特征的空间,称为全息空间。在具有连续势的全息空间中的每一“点”上(极小区域,即以x(a 0)为中心,以e ( e ® 0 )为半径的x(a 0)的e -邻域里)都包含(或隐含)了整个空间的全部信息。这样,我们就引入了全息空间的概念。
定义2.9 若有一信息空间内部连通并且由其生成的商空间在结构关系上亦连通,并满足如下的条件:
(1) 在W中任何一个元素a的e -邻域(e ® 0)所构成的子空间W'中,包含(或隐含)有整个空间的全部信息元素;
(2) 当W中的足够多的信息元素的构成决定了空间的主要性质和其结构形式以后,空间坐标决定了每一个孤立点、子区域和子空间的性质和其上的空间结构。
满足以上两个性质的信息空间被称为全息空间,仍然记作:W。
定义2.10 元素在W中所复盖的区域和由全息空间的空间结构所涉及的范围的大小称为全息空间的空间测度,记作:m(W) 。
§2.3 全息空间的性质
根据上面所述的全息空间的定义,可以知道,信息元素的集合在全息空间中的形态和其位置的坐标是与它们自身的特性密切相关的,信息在存储器中的无序状态的随机堆集不能形成全息空间。由此,可以得出如下的定理:
定理2.1 全息空间中的一切元素之间都是互相相容的,所有互不相容的元素不属于同一个全息空间。
证明:当某个元素a被确定在W上以后,根据全息空间的定义,其必然要与邻近元素构成连通区域,并必然会与整个W空间连通,并且至少能够决定其邻域附近的空间结构。如果元素a与其邻域或邻域系中的某个元素x是不相容的,则元素之间的不相容状态必然会引起这两个元素附近的空间在结构上的相抵触,结构上的对立又引起空间断裂;这与定义要求空间连通不相符,故或者a或者x,两者之中必有一个不属于W。因此,本定理得证。
定理2.2 全息空间中的一切元素与它自身的空间坐标是相适应的,所有与坐标不相适应的元素不属于该全息空间或者不属于该坐标位置。
证明:根据定义2.9:在W空间被基本确定以后,空间坐标本身也有了结构。当某元素a被确定在坐标x(a)上以后,元素所决定的空间结构与坐标所决定的空间结构必须要相适应,否则会引起空间断裂,与定义要求不符;然而坐标的空间结构是由整个W空间所决定的,不可更改,能更改的只有是元素a了;故如果元素与其坐标不相适应,或者是因为元素a根本不属于W,或者是a不应该在该坐标位置上。证毕。
定理2.3 令W上具有连续势À,那么该W内的任意一个非空的子空间与W整体有相同的m(W)值;其中m(W)表示W的空间测度。
证明一 先从W自身的性质上证明其充分性:既然W存在,那么W内的元素则应含有特征信息P,元素之间应当满足由特征信息P所规定的互相依存的结构关系(或商空间关系);根据定义2.9可以知道,如果这种关系被破坏,W中的元素本身也必然会被破坏,W空间也就不存在了。现在假如无论怎样分割W,而不会破坏这种关系的话,元素自身也就不会受到破坏。这时,W空间必须满足如下两个条件:
(1) 非空;
(2) 连续。(元素是以连续形式分布着的。)
第一个条件“非空”是由这种关系的存在而自然满足的,0空间根据定义不属于W;第二个条件“连续”是定理已经规定的。而从两个以连续形式分布着元素的集合之间存在着的一一对应的关系可知:部分中的元素的个数等于整体中的元素的个数。由于元素的个数相同,而且元素与空间结构之间的依存关系由于两个空间之间存在着的母子关系也应相同,即全息空间的结构相同,而空间结构规定了空间测度的大小;从而使得具有元素个数相同,空间结构相同的两个不同形式大小的全息空间有相同的空间测度。故本定理的充分性得证。(注1:由于信息空间的空间结构不存在上述这种依赖关系,故相同个数的元素组成的两个不同形式大小的信息空间可能会有不同的空间测度。)
证明二 从元素的数量关系上证明其必要性:如若想证明m (W')=m (W)(W'Ì W),必须先证明ÀW'=ÀW;在证明这个定理的必要性之前,我们先证明一个引理:
引理2.1 对于具有连续势的W,将不可能在W中找到一个最小子空间。
证明 用反证法:假设对某个连续势为À 的W,存在着一个不为0的最小子空间W min,并暂记作W 。由于W 属于W本体范畴,其自身的性质和空间结构都不变,故应满足À =À 。但是,我们总可以找到一个W ≠0,使得满足:W Ì W ,并且使得W 上至少有一点(注2)不属于W 。然而根据上面同样的方法进行推理,À 应该与À 相对应,故有:À =À =À,结果使W 成为最小的子空间,这与假设W 为最小相矛盾,故本引理得证。(注2: 这一点总是可以找到的。例如:在有连续势的W 上剔除某一点,根据无穷集合的势的原则,其势不变。我们把剔除某一点后的W 记作为W ,测度记作为m (W ) ;由于W 已经假设为最小,与W 同级最小的但又比W 少一点的W 必然比W 更小一点,然而它们又同势,即À 并不比À 更大些;又由于W 是从母体W 中脱离出来的,结构亦相同,结构相同的两个空间区域应当有相同的空间测度,即: m ( W ) = m ( W ),故同势并同结构……以此类推,从À本身的连续性、无穷性和稠密性,故可由归纳法推出: À ≡À 。)
现在,利用上述引理,可以知道:当满足WÌ W 这一关系时,必然地存在着一个所谓的最小子空间的套;我们在W中任意选择一个子空间W',它至少能够比这个套中的第k个最小子空间W 以后的所有的W 要大;由于这个套中所有的子空间的势都相等,并且还由于它们共属于同一个母体结构,故空间结构亦相同;所以该套中每一个所谓最小子空间的空间测度:
m (W )≡m (W) 。
当某个W被W'所包含时,有如下不等式:
m (W)≥m (W')≥m (W)≡m (W)
成立,故定理2.3得证。
定理2.4 对于连续势为À的一个W,可以被任意地分割成为大小不为0的任何小块,其分割后的子空间碎片除了势和空间测度不变以外,每一个碎片都可以生成出一个与原W空间完全相同的新的W空间。
证明 设想有一个球面形状的存储器。将信息根据其自身的携带的性质按坐标有序地记入到球面上,构成一个球面状的全息空间。现在将球面剖为相等的A,B两个部分。根据定理2.3可以知道,由于半个球面上的元素能与整个球面上的元素一一对应,故半球面上的势不变,空间测度亦不变;另外,从定义2.9知道整个球面上的全部元素被球面的任何一个小区域所直接或间接地蕴涵,因而球面上的任意一个部分都能够确定被割去了的邻域上的信息元素。那么,A球面上的空间结构按照定理2.1和2.2的相容性和相适性原理,可以向外延拓,生成出与坐标相适的,并与附近(在A球面被切的边界附近)的元素相容的新的元素来代替被切除了的部分的元素。现在再让e 从0逐渐增大到pR/2,作为A半球边缘某一个小区域的邻域的一系列半径,逐步向外扩展和生成。这样一步步地向外延拓,最后生成和确定出B半球面的全部信息元素。反之也是这样。因此,每一个半球面至少都能各自形成一个势依旧为À,空间测度为m (W)的新的球面。证完。
但是,另一方面我们也知道,有限的几个信息元素之间既不一定能建立起那种互相依存的关系,也不一定就能构成全息空间。因此,对于具有非连续势或可列势的W空间,除了在空间结构上要完备以外,元素的数量也是一个相当重要的因素。我们将能够构成全息空间的最低的元素数目称为W上的最小势;信息元素的数目如果低于这个最小势就不能构成全息空间。
定理2.5 在具有非连续势À0的W上,对所有的W k Ì W,如果Àk≥À min,则Àmin=À0。(证明从略)
§2.4 W内的奇异区域和“眼”
定义2.11 如果在W中的某个区域里存在着某些特殊的点,该点上所携载的信息元素既不能与邻域的元素相容,又不能与W的空间坐标相适应,更不能说明和确定W的空间结构,我们则称之为伪点。
定义2.12 由成群的伪点构成的连续区域被称为奇异子空间。含有奇异子空间的全息空间叫准全息空间。
定义2.13 如若奇异子空间中存在这么一种区域:它使得该区域自身能够构成小型的严格的子全息空间;就是说,不论外界情况如何,该区域均能够使自己处于不败之地;则我们说:它是奇异子空间的一个眼,而且还是个“活”眼。奇异子空间能够在全息空间中长期保存而不被扭转,必须至少要有一个以上的这种活眼;眼越多,奇异子空间的空间结构强度就越大,就越不容易被扭转。
另外,如果全息空间W A中的某个奇异子空间可以与W A外面的某个全息空间W B构成连通,那么,它也是不可被扭转的。反之,如果在奇异子空间中既不存在着这种小型区域,又不能与其它的全息空间构成连通,那么,这个奇异子空间就是可扭转的。
定理2.6 设W I为准全息空间,区域S是W I中的奇异子空间,W 0是W I中不包含S的区域,区域R Ì W I,W R是从R上复制出的整个空间的像,那么:
如果R Ë S,则W R=W 0;
如果R Ì S,则W R≠W 0;
如果R跨在S与W 0之间的边界上,R1 Ë S,R2 Ì S,R1 + R2 = R,则W R发生一定程度的畸变。 数学模型基础知识
一.数学模型的定义
现在数学模型还没有一个统一的准确的定义,因为站在不同的角度可以有不同的定义。不过我们可以给出如下定义。"数学模型是关于部分现实世界和为一种特殊目的而作的一个抽象的、简化的结构。"具体来说,数学模型就是为了某种目的,用字母、数学及其它数学符号建立起来的等式或不等式以及图表、图象、框图等描述客观事物的特征及其内在联系的数学结构表达式。
二.建立数学模型的方法和步骤
第一、模型准备
首先要了解问题的实际背景,明确建模目的,搜集必需的各种信息,尽量弄清对象的特征。
第二、模型假设
根据对象的特征和建模目的,对问题进行必要的、合理的简化,用精确的语言作出假设,是建模至关重要的一步。如果对问题的所有因素一概考虑,无疑是一种有勇气但方法欠佳的行为,所以高超的建模者能充分发挥想象力、洞察力和判断力,善于辨别主次,而且为了使处理方法简单,应尽量使问题线性化、均匀化。
第三、模型构成
根据所作的假设分析对象的因果关系,利用对象的内在规律和适当的数学工具,构造各个量间的等式关系或其它数学结构。这时,我们便会进入一个广阔的应用数学天地,这里在高数、概率老人的膝下,有许多可爱的孩子们,他们是图论、排队论、线性规划、对策论等许多许多,真是泱泱大国,别有洞天。不过我们应当牢记,建立数学模型是为了让更多的人明了并能加以应用,因此工具愈简单愈有价值。
第四、模型求解
可以采用解方程、画图形、证明定理、逻辑运算、数值运算等各种传统的和近代的数学方法,特别是计算机技术。一道实际问题的解决往往需要纷繁的计算,许多时候还得将系统运行情况用计算机模拟出来,因此编程和熟悉数学软件包能力便举足轻重。
第五、模型分析
对模型解答进行数学上的分析。"横看成岭侧成峰,远近高低各不?quot;,能否对模型结果作出细致精当的分析,决定了你的模型能否达到更高的档次。还要记住,不论那种情况都需进行误差分析,数据稳定性分析。
关于数模竞赛的几本好书
<<数学建模竞赛培训教材>>共三本叶其孝主编
<<数学模型>>第二版姜启源
<<随机规划>>
<<模糊数学>>
<<数据结构>>
<<数学建模入门>>徐全智
<<计算机算法设计与分析>>国防科大
基础:1数学分析2高等代数3概率与数理统计 4最优化理论5图论6组合数学 7微分方程稳定性分析8排队论 摘自数学建模爱好者 长见识啊!看完了人都会很振奋,建议置顶! 楼主也不知道是从哪里找来的,好厉害啊,这么多。 good
我一直想找这么一篇介绍数学大厦结构的文章 我觉得真的要好好学习一下数学了,有时候我总觉得奇怪,很多人跟我说数学的无用,这让我很郁闷,更何况他们很多人又是作研究的,不知道该怎么理解他们的想法。 原帖由 fengyu 于 2006-9-15 16:50 发表
我觉得真的要好好学习一下数学了,有时候我总觉得奇怪,很多人跟我说数学的无用,这让我很郁闷,更何况他们很多人又是作研究的,不知道该怎么理解他们的想法。
个人理解简单的说两点:
1. 学习数学要学习数学思想,学习数学的严谨性,学习数学的逻辑。
2. 你可以回头看看,一个整整有成就的的科学家首先都是数学家和哲学、说数学无用只能说它对数学不了解,对数学的本学科不了解。
页:
[1]
2