1+1=10

记记笔记,放松一下...

最小作用量原理小记

胡乱整理一下,理理思绪。

最小?作用量?原理?

虽然这个原理历史上被称为“最小作用量原理(Principle of Least Action)”,或“最小作用原理”,但更准确的说法应该是“驻定作用量原理(Principle of Stationary Action)”,因为系统的路径不一定总是使作用量达到最小值,它可以是驻定值,可能是最小值、最大值或鞍点。为避免混淆,现在一般称呼“哈密顿原理”。

  • 最小(least):不一定是最小值,还可能是最大值,或者鞍点值。
  • 作用量(action):物理系统在某一段时间内的整体行为。为什么翻译成作用量,估计是借鉴的日语翻译?
  • 原理(principle):经验总结出的广泛规则或假设,不需要严格证明

分别看看

原理?

作为对自然现象的一种特别有效的描述方式,最小作用量原理在其发展史上曾被赋予各种神秘特性或目的论(Teleology /ˌtiːliˈɒlədʒi/)色彩。目的论是一种哲学思想,认为自然界中的事物或过程是朝着某种“目的”进行的。在最小作用量原理的语境中,目的论的含义可以理解为:自然界中的物理系统会选择一种特定的路径或演化方式(上帝创造自然界时的设计),以实现某种“最优”或“最小”的状态。

有好多词,经常出现,似乎挺容易混的。不过本来也没有严格定义,很多时候界限也不明确

中文概念 英文名称 音标 ... 证明性 例子
原理 Principle /ˈprɪnsɪpəl/ 经验总结出的广泛规则或假设 不需要严格证明 最小作用量原理、费马原理
公理 Axiom /ˈæksiəm/ 理论体系中的基本假设或前提,无需证明 不需要证明 欧几里得几何的平行公理
定理 Theorem /ˈθɪərəm/ 通过逻辑推理,从公理或其他定理推导出的结论 需要严格证明 勾股定理、费马小定理
定律 Law /lɔː/ 对自然界现象的普遍性描述,通常基于实验和观察 不需要证明,但需验证 牛顿运动定律、热力学第一定律、欧姆定律
假设 Hypothesis /haɪˈpɒθɪsɪs/ 对某个现象或问题的暂时性解释或假定,等待验证 需要验证或证伪 进化假设、宇宙膨胀假设
猜想 Conjecture /kənˈdʒɛktʃər/ 基于观察或直觉提出的命题,尚未被证明 需要证明或证伪 哥德巴赫猜想、庞加莱猜想
模型 Model /ˈmɒdəl/ 用于解释、预测或模拟某些现象的简化系统或结构 不需要严格证明,但需验证 原子模型、气体分子运动模型
假说 Postulate /ˈpɒstʃʊlɪt/ 在理论体系中被假定为真的陈述,通常用作推导其他结论的基础 不需要证明 狭义相对论的光速不变假说
推论 Corollary /ˈkɒrəlɛri/ 从一个已证明的定理或命题直接得出的结论 基于已知定理的证明 勾股定理的推论:等腰直角三角形的斜边与直角边的比例为 √2
定则 Rule /ruːl/ 特定领域的经验性总结,用于描述某类现象的行为模式或操作方式 通常不需要严格证明 克拉默定则
效应 Effect /ɪˈfɛkt/ 特定条件下的因果关系现象,通常是实验观察中的结果 不需要证明,但需验证 多普勒效应、光电效应

怎么能图形化显示一下?,chatgpt给出下面一个表,凑活看一下

graph TD A[理论基础] -->|公理| C[Axiom] A -->|原理| I[Principle] A -->|假说| K[Postulate] A -->|假设| B[Hypothesis] B -->|验证/证伪| D[Theory/Model] B -->|未验证| J[Conjecture] C -->|推导| E[Theorem] E -->|直接推导| F[Corollary] D -->|总结| G[Law] D -->|简化描述| H[Model] D -->|具体现象| L[Effect] G -->|特定场景应用| M[Rule]

作用量?

Action 作用量??? 神奇的翻译,Action为什么翻译成作用量,源于日语翻译??

作用量的核心思想是:它是某个物理系统在一定时间间隔内经历的运动的整体度量。

取决于所研究的系统和使用的理论框架,作用量在不同的物理学理论中有不同的形式:

  • 莫培督的定义:作用量是动量与路径长度的积分。【简略作用量(泛函)】
  • 经典力学:作用量等于拉格朗日量在时间上的积分。【作用量(泛函)】
  • 哈密顿力学:作用量可以表示为动量和广义坐标的积分。
  • 广义相对论:爱因斯坦-希尔伯特作用量用于描述引力场的动态行为。
  • 费曼路径积分:作用量用于描述所有可能路径的概率幅。
  • 杨-米尔斯理论:作用量用于描述规范场的行为。
  • 场论:作用量通过拉格朗日密度在时空上的积分来定义。

最小?

最小 到 驻点 演变:

  • 最小作用原理:最早由莫培督提出,认为物理系统沿着使作用量最小的路径演化。这一思想也体现在费马的最小时间原理中。
  • 拉格朗日力学:拉格朗日通过动能和势能的差来定义作用量,并基于最小作用原理导出了经典力学的运动方程。
  • 变分法的发展:随着数学变分法的发展,物理学家意识到系统的实际路径并不总是最小作用量的路径,而是驻定作用量的路径。
  • 驻点作用原理:最终导致了从“最小作用原理”到“驻点作用原理”的演变。

莫培督原理 与 哈密顿原理

最小作用原理名字不够准确,一般用“哈密顿原理”称呼。而莫培督提出的最小作用量原理,用“莫培督原理”称呼。

莫培督原理

莫培督原理(Maupertuis's Principle)表述如下:

对于一个物理系统,其真实运动轨迹是在固定能量条件下,使得某种物理量(称为作用量)达到极小值的轨迹。莫培督原理适用于描述系统在空间中的路径,并通过动量和位移的关系来表达。

作用量 WW 定义为:

W=x1x2pdx=x1x2mvds W = \int_{x_1}^{x_2} p \, dx = \int_{x_1}^{x_2} mv \, ds

其中:

  • p=mvp = mv 是系统的动量,
  • vv 是系统的速度,
  • mm 是系统的质量,
  • dsds 是沿路径的微小位移。

莫培督原理指出,系统的真实路径是使作用量 WW 取极小值的路径。这意味着系统选择的运动轨迹使得动量 pp 与位移 dsds 的积分最小化。在数学上,这可以表述为:

(δW)E=0 (\delta W)_E = 0

这里,EE 表示系统的总能量保持不变。

换句话说,物理系统在固定能量下选择的路径是使动量与位移的乘积积分最小的路径,即系统在空间中“节约”它的运动。

哈密顿原理

哈密顿原理(Hamilton's Principle)表述如下:

对于一个由广义坐标 q=(q1,q2,...,qN)q = (q_1, q_2, ..., q_N) 描述的物理系统,其在两个给定时刻 t1t_1t2t_2 之间的真实演化轨迹 q(t)q(t) 是使得作用量(Action)泛函 S[q]S[q] 取驻值(通常为极值)的轨迹。作用量 S[q]S[q] 由系统的拉格朗日量 L(q,q˙,t)L(q, \dot{q}, t) 随时间的积分定义:

S[q]=t1t2L(q(t),q˙(t),t)dt S[q] = \int_{t_1}^{t_2} L(q(t), \dot{q}(t), t) \, dt

哈密顿原理指出,物理系统的真实演化轨迹满足以下条件:在固定的边界条件(即在 t1t_1t2t_2 的时刻,系统的状态 q(t1)q(t_1)q(t2)q(t_2) 是固定的)下,作用量 S[q]S[q] 对轨迹 q(t)q(t) 的一阶变分为零:

δSδq(t)=0 \frac{\delta S}{\delta q(t)} = 0

换句话说,系统的真实运动轨迹是作用量泛函的驻定点,也就是系统所选择的路径使得作用量在所有可能路径中取极值(通常是最小值)。

作用原理 与 牛顿定律

在经典力学中,作用原理和牛顿定律是两种不同的理论框架,虽然它们的数学表述和逻辑基础不同,但它们在结果上是等价的。

  • 牛顿力学:直观、简单,适用于质点和刚体等简单系统。
  • 拉格朗日力学:适合处理复杂约束系统,通过最小作用原理描述运动。
  • 哈密顿力学:更抽象,适用于经典和量子力学,广泛应用于现代物理学。
特性 牛顿力学 拉格朗日力学 哈密顿力学
基本方程 F=maF = ma ddt(Lq˙i)=Lqi\frac{d}{dt} \left( \frac{\partial L}{\partial \dot{q}_i} \right) = \frac{\partial L}{\partial q_i} q˙i=Hpi,p˙i=Hqi\dot{q}_i = \frac{\partial H}{\partial p_i}, \quad \dot{p}_i = -\frac{\partial H}{\partial q_i}
变量 位置r(t)r(t),速度 v(t)v(t) 广义坐标qi(t)q_i(t),广义速度 q˙i(t)\dot{q}_i(t) 广义坐标qi(t)q_i(t),共轭动量 pi(t)p_i(t)
描述对象 通过加速度描述运动 通过拉格朗日量 L=TVL = T - V 描述运动 通过哈密顿量 H=T+VH = T + V 描述运动
数学框架 基于牛顿第二定律的微分方程 基于最小作用原理的变分法,推导运动方程 基于正则方程,使用广义坐标和共轭动量
优势 概念直观,适用于简单系统 能处理复杂、多粒子、约束系统 提供更抽象广泛的框架,适用于经典和量子系统

拉格朗日力学

在牛顿力学的基础上,达朗贝尔原理和虚功原理被提出,用以处理有约束的系统。

  • 达朗贝尔原理(D'Alembert's Principle)指出,对于有约束的系统,真正的受力和约束力之间存在一种平衡关系,使得系统的虚位移不做功。
  • 虚功原理(Principle of Virtual Work)为引入广义坐标奠定了基础。通过广义坐标 qi q_i 和广义速度 q˙i \dot{q}_i ,可以将系统的自由度进行重新表述,进而简化约束系统的分析。

约瑟夫·拉格朗日基于上述原理,提出了一个新的动力学描述方式:拉格朗日力学

他引入了一个新的函数,称为拉格朗日量(Lagrangians) L L ,它是系统动能 T T 和势能 V V 的差:

L=TV L = T - V

其中:

  • T 是系统的动能,通常表示为 T=12mq˙2 T = \frac{1}{2} m \dot{q}^2
  • V 是系统的势能,表示为 V=V(q) V = V(q) ,它依赖于系统的位置。

拉格朗日量的引入与最小作用原理密切相关。最小作用原理指出,物理系统的演化路径是使得总作用量 S S 取极值(通常是最小值)的路径。作用量 S S 是拉格朗日量在时间上的积分:

S=t1t2Ldt S = \int_{t_1}^{t_2} L \, dt

通过对作用量 S S 取变分 δS=0 \delta S = 0 ,可以得到系统的运动方程。这一过程称为变分法,最终推导出欧拉-拉格朗日方程

ddt(Lq˙)Lq=0 \frac{d}{dt} \left( \frac{\partial L}{\partial \dot{q}} \right) - \frac{\partial L}{\partial q} = 0

欧拉-拉格朗日方程是拉格朗日力学的核心方程,它取代了牛顿的运动方程,给出了物理系统的更一般的运动描述。

哈密顿力学

哈密顿力学是经典力学的一种重要表述方式,由威廉·哈密顿(William Rowan Hamilton)在1833年提出。它与拉格朗日力学一样,基于最小作用量原理,但通过引入新的变量——哈密顿量(Hamiltonian)和正则共轭变量,为描述物理系统提供了一个更加对称、通用的框架。这种形式在现代物理学,尤其是量子力学和统计力学中,具有广泛的应用。

在哈密顿力学中,系统的状态由一组广义坐标 qiq_i 和与之共轭的广义动量 pip_i 描述。哈密顿力学的核心是哈密顿量 H(q,p,t)H(q, p, t),它通常是系统的总能量,即动能与势能的和。

  • 广义坐标 qiq_i:描述系统的配置或位置。
  • 广义动量 pip_i:与 qiq_i 共轭的动量,定义为拉格朗日量 LL 对广义速度 q˙i\dot{q}_i 的偏导数:

pi=Lq˙i p_i = \frac{\partial L}{\partial \dot{q}_i}

  • 哈密顿量 H(q,p,t)H(q, p, t):系统的总能量函数,定义为拉格朗日量 LL 的勒让德变换(Legendre Transform):

H(q,p,t)=ipiq˙iL(q,q˙,t) H(q, p, t) = \sum_i p_i \dot{q}_i - L(q, \dot{q}, t)

哈密顿力学的核心是哈密顿方程(Hamilton's Equations),也叫做正则方程,它描述了系统随时间的演化。哈密顿方程由一组一阶微分方程组成,给出了广义坐标和广义动量随时间的变化:

q˙i=Hpi,p˙i=Hqi \dot{q}_i = \frac{\partial H}{\partial p_i}, \quad \dot{p}_i = -\frac{\partial H}{\partial q_i}

  • q˙i=Hpi\dot{q}_i = \frac{\partial H}{\partial p_i}:广义坐标的变化等于哈密顿量对广义动量的偏导数。
  • p˙i=Hqi\dot{p}_i = -\frac{\partial H}{\partial q_i}:广义动量的变化等于哈密顿量对广义坐标的负偏导数。

哈密顿力学与拉格朗日力学是经典力学的两种等价表述。拉格朗日力学使用广义坐标 qiq_i广义速度 q˙i\dot{q}_i 来描述系统,而哈密顿力学则使用广义坐标 qiq_i广义动量 pip_i

  • 在拉格朗日力学中,运动方程由欧拉-拉格朗日方程给出:

ddt(Lq˙i)Lqi=0 \frac{d}{dt} \left( \frac{\partial L}{\partial \dot{q}_i} \right) - \frac{\partial L}{\partial q_i} = 0

  • 在哈密顿力学中,这些二阶微分方程被转化为一组一阶的哈密顿方程:

q˙i=Hpi,p˙i=Hqi \dot{q}_i = \frac{\partial H}{\partial p_i}, \quad \dot{p}_i = -\frac{\partial H}{\partial q_i}

这两个表述方式实际上是等价的,但哈密顿力学在某些问题中提供了更大的便利和对称性。

路径积分 与 薛定谔方程

薛定谔方程可以通过费曼的路径积分表述重新解释,路径积分方法被认为是一种更具普遍性的量子力学框架,它与薛定谔方程等价。

对比维度 薛定谔方程 路径积分表述
历史背景 由薛定谔提出,基于波动力学理论 由费曼提出,基于狄拉克的量子作用思想
数学形式 偏微分方程 路径积分,即对所有可能路径的求和
物理意义 描述波函数的时间演化,给出概率幅 对所有可能路径的干涉进行求和,给出传播振幅
计算方法 通过求解微分方程得到波函数 通过对路径积分得到传播子
经典极限 WKB近似,经典轨迹 经典路径的贡献最大,符合最小作用原理
直观性 波函数较为抽象 强调所有可能路径的叠加,直观反映量子态的干涉效应

薛定谔方程

薛定谔方程是量子力学的基本方程,用来描述系统的波函数 ψ(r,t) \psi(\mathbf{r}, t) 随时间的演化。对于一个非相对论、无自旋的单粒子系统,薛定谔方程为:

itψ(r,t)=H^ψ(r,t) i\hbar \frac{\partial}{\partial t} \psi(\mathbf{r}, t) = \hat{H} \psi(\mathbf{r}, t)

其中 H^ \hat{H} 是哈密顿算符,通常包含动能和势能部分:

H^=22m2+V(r,t) \hat{H} = -\frac{\hbar^2}{2m} \nabla^2 + V(\mathbf{r}, t)

这个方程描述了粒子的波函数随时间的演化,给出量子态的时间演化规则。

积分路径

传播子可以写成:

K(r2,t2;r1,t1)=D[r(t)]exp(iS[r(t)]) K(\mathbf{r}_2, t_2; \mathbf{r}_1, t_1) = \int \mathcal{D}[\mathbf{r}(t)] \exp \left( \frac{i}{\hbar} S[\mathbf{r}(t)] \right)

其中:

  • D[r(t)] \mathcal{D}[\mathbf{r}(t)] 表示对所有可能路径 r(t) \mathbf{r}(t) 的积分。
  • S[r(t)] S[\mathbf{r}(t)] 是路径上的作用量,由拉格朗日量 L L 对时间的积分给出:

S[r(t)]=t1t2L(r(t),r˙(t))dt S[\mathbf{r}(t)] = \int_{t_1}^{t_2} L(\mathbf{r}(t), \dot{\mathbf{r}}(t)) dt

对于一个经典的粒子,拉格朗日量为:

L(r,r˙)=m2r˙2V(r) L(\mathbf{r}, \dot{\mathbf{r}}) = \frac{m}{2} \dot{\mathbf{r}}^2 - V(\mathbf{r})

因此,路径积分表述将粒子的传播振幅 K(r2,t2;r1,t1) K(\mathbf{r}_2, t_2; \mathbf{r}_1, t_1) 解释为所有可能路径对的贡献,其中每条路径的贡献由经典作用量 S[r(t)] S[\mathbf{r}(t)] 决定。

泛函

泛函是函数的一个推广。泛函是“函数的函数”(注意不同于复合函数)。

函数(Function)

Function 为什么翻译成“函数”?原意是“信函”或“封套”的意思,表示包裹、包含或传递信息。在数学中,“函” 引申为“包含某种关系的映射”。表示数字或数值。

函数是一种数学映射,它将一个数或一组数映射到另一个数。更形式化地说,函数是定义在某个集合上的一种规则,它将集合中的每一个元素映射到另一个集合中的唯一一个元素。

如果 xx 是一个变量,f(x)f(x) 是一个函数,则函数 ff 是将变量 xx 映射到一个值的规则,通常写作:

y=f(x) y = f(x)

其中:

  • xx 是函数的输入(自变量),
  • yy 是函数的输出(因变量)。

区分函数与函数值

  • 函数是一种映射关系。(注:20世纪初,大家默认函数=公式?)
  • 函数值是一个数值。

泛函(Functional)

泛函是函数的一个推广。与函数不同的是,泛函的输入是一个函数,输出是一个标量。简而言之,泛函是“函数的函数”。

如果 f(x)f(x) 是一个函数,泛函 SS 是一个将函数 $f(x) 映射到一个标量的规则。通常,泛函的形式为一个涉及函数 ff 及其导数的积分表达式:

S[f]=abF(x,f(x),f(x))dx S[f] = \int_{a}^{b} F(x, f(x), f'(x)) \, dx

其中:

  • f(x)f(x) 是泛函的输入,
  • S[f]S[f] 是泛函的输出,是一个标量,
  • F(x,f(x),f(x))F(x, f(x), f'(x)) 是一个包含 xxf(x)f(x)f(x)f'(x) 的函数,
  • aabb 是积分的上下限。

泛函的输入是一个函数,输出是一个数值(标量)

线性泛函(Linear Functional)

线性泛函是泛函的一种特殊形式,它是线性映射,将向量空间中的向量(函数)映射到实数或复数。简单来说,线性泛函是作用在向量空间上的线性函数,并且输出是一个标量。

VV 是一个向量空间,其中的元素可以是向量或函数。一个线性泛函 LL 是定义在 VV 上的一个映射,它将 VV 中的每个元素 vv 映射到一个标量(通常是实数或复数)上,并且满足以下两个性质:

  • 齐次性(Homogeneity):对于任意的标量 aa 和向量 vVv \in V,有:

L(av)=aL(v) L(a v) = a L(v)

  • 可加性(Additivity):对于任意的向量 v1,v2Vv_1, v_2 \in V,有:

L(v1+v2)=L(v1)+L(v2) L(v_1 + v_2) = L(v_1) + L(v_2)

这两个性质合起来就是线性性质,因此这种类型的泛函就是线性泛函

变分(Calculus of Variation)

变分与泛函之间的关系可以类比为微分与函数的关系:

  • 函数与微分:对于普通的函数 f(x)f(x),其微分描述了在 xx 发生微小变化时,函数 f(x)f(x) 如何变化。

df=dfdxdx df = \frac{df}{dx} \, dx

  • 泛函与变分:对应地,对于泛函 S[f]S[f],其变分描述了在输入的函数 f(x)f(x) 发生微小变化时,泛函 S[f]S[f] 如何变化。

f(x)f(x) 是函数,η(x)\eta(x) 是一个小扰动函数,ϵ\epsilon 是一个非常小的实数,则 f(x)+ϵη(x)f(x) + \epsilon \eta(x) 表示 f(x)f(x) 的微小变化。在这种情况下,泛函 S[f]S[f] 的变分定义为:

δS[f]=limϵ0S[f+ϵη]S[f]ϵ \delta S[f] = \lim_{\epsilon \to 0} \frac{S[f + \epsilon \eta] - S[f]}{\epsilon}

这个变化量 δS[f]\delta S[f] 就是泛函 S[f]S[f]变分(变分也是一个函数)。

参考

  • 许良 《最小作用量原理与物理学的发展》
  • https://en.wikipedia.org/wiki/Action_principles
  • https://en.wikipedia.org/wiki/History_of_variational_principles_in_physics
  • https://en.wikipedia.org/wiki/Hamilton%27s_principle
  • https://en.wikipedia.org/wiki/Calculus_of_variations

Tools