浅说最小作用量原理
最小作用量是一个泛称,不同的领域有不同的定义,即便对同一问题也可以有多个最小作用量。1650年法国数学家费马提出光通过介质时满足所耗时间最短(或光程最短)原理,这被认为是最小作用量应用的第一个例子。光之所以会发生折射,是因为光在空气和水中的传播速度不同,光就选择了在阻力小、速度快的介质中多跑一段;在阻力大、速度慢的介质中少跑一段,这样可达到最短时间通过介质的目的。由于光在空气和水中的传播速度不同,光从空气中入射到水中会选择了耗时最短的路径,就发生了折射。正是因为光的折射放在水杯中的铅笔被折断了。
光的这种“智慧”和人是一样的。例如岸上一个人正好看到河里有人落水了,为了救人,我们总想在最短时间内把落水者救上岸,如下图所示。显然由于水的阻力大,游泳的速度肯定没有在岸上跑的速度快,大部分人会选择图中路径2,先在岸上跑到距离落水者距离最近的C点,然后再跳入河中救人;与直线路径1相比,路径2要用时短,提高了救人效率。 由此,我们看到从岸上某点到达河里某点的最快路径不是折线,也是一条折线,这就帮助我们理解了光为什么要发生折射。
到河里救人的路径弯折保证最短时间到达落水者位置(阴影部分表示河流)
这个原理的应用远不止这些,1630年,伽利略在做斜面实验时发现,两个相同的小球从起点滑向终点,最快的路径并不是直线而是一条曲线。我们知道两点之间的直线只有一条,但曲线却有无数条,一个问题便是在这许多曲线中哪一条是最快的曲线?这就是著名的最速降线问题。伽利略认为最快的曲线是一条弧线(圆的一部分),这是错误的。
1696年,约翰·伯努利将小球下落的空间分成许多小的下落层,每层高度为h,当h很小时,可认为小球做匀速运动,利用能量守恒定律,可求得小球到达每一层速度均不同。想想光折射、或者去河里救人,小球为了在最短时间内下落,速度方向就会不断改变,当h趋近于无穷小时,路径就变成一条连续的曲线,即最速降线。可以证明它是一条倒着的摆线(轮缘上的点在轮子滚动时绘出的轨线)。
最速降线伯努利求解方法示意图
可以看到我国古代房屋的屋顶一般都做成近似的摆线,虽然无法知道当时的设计者是否知道最速降线,但这样的屋顶设计客观上起到了最短时间排走雨水、减小屋面载荷的作用。
山西乔家大院,注意曲线的屋顶而非直线
从光的折射到物体运动之间相似性,或许说明了物理学大统一理论的可能性。莱布尼茨曾试图建立一个能支配于整个力学和光学过程的作用量概念,这一思想对后来的学者产生了重大影响。法国科学家莫佩尔蒂(Maupertuis,也译作莫泊丢、或莫培督、或马保梯,大数学家欧拉是他的学生之一)分别在1741年、1744年、1746年发表了关于最小作用量原理的文章,他认为自然界最普遍的原理就是最小作用量原理,只要找到合适的作用量,就可以构建该学科的理论基础。对于运动学,他还给出的作用量定义为:物体的质量,移动距离,与移动速度的乘积。
最小作用量原理的进一步发展,变分法起了不可忽视的作用。所谓变分就是泛函求极值问题。当一个函数的自变量本身就是函数的时候,称这样的函数为泛函,形象一点就是函数的函数,泛函求极值问题就是变分法。对于实数函数求极值,我们一般对该函数求导,一次导数等于0,说明存在极值,对变分的理解可类比于微分。
举个例子,“两点之间线段最短”,这在高中知识中,是作为公理不言自明的,但借助于变分可严格证明。
A、B两点间线段最短示意图
假设A、B两点之间的任意路径满足函数y=f(x),曲线上任意弧段M、N的长度为Δs,当M和N很近时,有
取极限后
写成泛函形式为
记F(x,y,y')=√1+y'2,上式变分为0,得有极值的条件是
上式被称为拉格朗日(Lagrange)方程,求解上式可得
到这一步后,就容易多了,这个式子要成立,必然要求y'=0或者y''=0.
· 积分y'=0,得y=C。是一条水平线;
· 积分y''=0,得y=kx+b。是一条斜率为k的直线。
这就证明了两点之间,最短路径是一条直线。
变分法是最小作用量原理的数学工具,必需声明一下:泛函取极值,并非一定就是极小值,也可能是极大值,还有可能是驻值(定义:一阶导数为0,但不是极值,可能为任一常数)。因此,在物理世界中作用量并非只有最小,更准确地说还有最大作用量原理,常数作用量原理。只是由于最小作用量原理最初研究的几个问题主要是最小值,人们也就习惯性的称为最小作用量原理。
举一个常数作用量原理的例子。制作一个椭圆形的镜面,如下图所示,从椭圆一个焦点发出的光线,经过椭圆的内表面反射后,所有光线又汇聚于椭圆另一个焦点。我们知道椭圆的定义为“到平面内两点(椭圆焦点)的距离之和为一常数(要求该常数大于两点间的距离)的点的轨迹为椭圆”,那么,所有从一个焦点出发并在椭圆内表面反射的光线,经过椭圆另一个焦点时,表明它们走过了相等的路程,并且等于椭圆长轴。这就是常数作用量定理。
mathgifs 椭圆镜面反射,从一个焦点出来的光线又汇聚到另一个焦点
再举出一个“最大作用量原理”的例子,最大熵原理。熵原本是热力学概念,宏观上,系统的熵变等于可逆过程吸收或耗散的热量除以它的绝对温度(克劳修斯,1865);微观上,熵是大量微观粒子的位置和速度的分布概率的函数,是描述系统中大量微观粒子的无序性的宏观参数(波尔兹曼,1872)。结论:熵是描述事物无序性的参数,熵越大则无序。
1948年,信息学之父香农借用了热力学中熵的概念去描述信息源的不确定度,提出了“信息熵”的概念。比如参加高考的学生,他说“我一定能达一本线”,这种说法是确定的,信息熵为0;如果说“有两种可能,一种能达线,一种达不了线”,这种说法就具有不确定,不确定性越强信息熵就越高。
再例如,一个人要投资做生意,那就需要尽可能把所有的情况都考虑周全,这样如果你考虑的周全,你掌握的信息熵就大,不确定度就大。不确定度大并非坏事,因为考虑周全了,才有可能针对性的做出各种防范或补救方案,投资的风险才会降低(从这个角度来看,最大熵实际上是要风险最低,最大熵是否可等价于最小风险?这样仍可以统一成最小作用量原理。不知道常数作用量原理,如椭圆镜面反射问题,能否找到等价的最小作用量?)。
投资策略中“不要把鸡蛋放在同一个篮子里”的前提,你必须掌握足够的信息熵
最大熵原理就是要保留全部的不确定性,这样才能做到心中有数,并达到降低风险的目的。对于在校大学生,最大熵原理的意义在于多学一些知识,增加自己的信息熵,将自己的人生风险降到最低。别的同学掌握了比你更多的信息熵,他对人生考虑的周祥,他面对的人生风险就低。
虽然我们常会看到一种现象,小学毕业的做老板,大学毕业的给打工。但这样的情况我们通常会说是机遇问题,对于一部分人做老板的人,他的人生是确定的而非不确定的,比如继承,所以他没有掌握更多信息熵的需求;另外一些老板虽然没有在大学里学,但是在人生的大学堂中仍是学习的佼佼者,比如《大染坊》中的陈寿亭,只是他的学习可能要比在学堂里的学习要辛苦几倍。
最大熵原理、常数路程原理、最短时间原理都是最小作用量原理的例子。庞加莱说“最小作用量原理迄今未经触动,人们似乎相信他会比其他原理更久长”。爱因斯坦则讲到最小作用量原理似乎“使物理学家们窥探到了那么一点点“上帝”创造世界的秘密。”它的高度抽象,足以使它成为大自然最迷人、最美妙的原理之一,它的简洁性和普适性令人震撼。似乎在科学的范畴中,人类只需要找到合适的作用量去描述自然,一切皆可明朗!
大自然都在照着最小作用量原理行事,我们又如何抛开最小作用量原理而生存呢?
参考资料:
· 百度百科 摆线,最速降线,最小作用量原理,皮埃尔•莫佩尔蒂,最大熵原理
· 秦伟 最小作用量原理及其应用 百度文库 2012
· 吕乃基社会中的“最小作用量定理”科学网博客 http://blog.sciencenet.cn/home.php?mod=space&uid=210844&do=blog&id=409955
· 新浪博客最大熵理论及其应用 http://blog.sina.com.cn/s/blog_73361fab0100zi8x.html
说明:关于Maupertuis的翻译上述三种翻译都有见。如,百度百科“最小作用量原理”中“莫培督在其1744年的一片著名论文中宣布了一个原理,他称之为“最小作用量原理””又“1744年由马保梯最先提出的一个最小作用量原理。”;百度百科“皮埃尔•莫佩尔蒂”中“莫佩尔蒂于1744年发表了最小作用量原理”。互动百科“物质波理论”中“在给出费马原理和莫泊丢原理的相似性表示后(指最小作用量)…”
来源:力学酒吧(ID:Mechanics-Bar)
作者:张伟伟
页:
[1]