多元函数极值@条件极值

多元函数条件极值

  • 上面所讨论的极值问题,对于函数的自变量,除了限制在函数的定义域内以外,并无其他条件,所以有时候称为无条件极值.
  • 但在实际问题中,有时会遇到对函数的自变量还有附加条件的极值问题.
    • 例如,求表面积为a而体积为最大的长方体的体积问题.设长方体的三棱的长为 x , y , z x,y,z x,y,z则体积 V = x y z . V= xyz. V=xyz.又因假定表面积为 a 2 a^2 a2,所以自变量 x , y , z x,y,z x,y,z还必须满足附加条件 2 ( x y + y z + x z ) = a 2 2(xy + yz + xz) = a^2 2(xy+yz+xz)=a2.
    • 像这种对自变量有附加条件的极值称为条件极值.

条件极值转为无条件极值

  • 对于有些实际问题,可以把条件极值化为无条件极值,然后利用第一目中的方法加以解决.例如上述问题,可由条件 2 ( x y + y z + x z ) = a 2 2( xy + yz +xz) = a^2 2(xy+yz+xz)=a2,将 z z z表示成(展开合并同类项移项可得)
    • z = a 2 − 2 x y 2 ( x + y ) z=\frac{a^2-2xy}{2(x+y)} z=2(x+y)a22xy,将其代入 V = x y z V=xyz V=xyz,得 V = x y 2 ( a 2 − 2 x y 2 ( x + y ) ) V=\frac{xy}{2}(\frac{a^2-2xy}{2(x+y)}) V=2xy(2(x+y)a22xy)的无条件极值

极值必要条件

  • 很多情形下,条件极值化为无条件极值不容易,需要寻找新的途径求解条件极值
  • 这种方法称为Lagrange乘数法
  • z = f ( x , y ) z=f(x,y) z=f(x,y)(1)在条件 ϕ ( x , y ) = 0 \phi(x,y)=0 ϕ(x,y)=0(2)下取得极值的必要条件是什么?
    • 设函数(1)在 P 0 ( x 0 , y 0 ) P_{0}(x_0,y_0) P0(x0,y0)处取得所求的极值,则 ϕ ( x 0 , y 0 ) = 0 \phi(x_0,y_0)=0 ϕ(x0,y0)=0(3)
    • 假定在 P 0 P_0 P0的某一邻域内 f ( x , y ) f(x,y) f(x,y) ϕ ( x , y ) \phi(x,y) ϕ(x,y)均有连续的一阶偏导数,而 ϕ y ( x 0 , y 0 ) ≠ 0 \phi_{y}(x_0,y_0)\neq{0} ϕy(x0,y0)=0
    • 隐函数存在定理,方程(2)确定一个连续且具有连续导数的函数 y = ψ ( x ) y=\psi(x) y=ψ(x)(3-1)
    • 将式(3-1)代入(1),得到一个一元函数 z = f ( x , ψ ( x ) ) z=f(x,\psi(x)) z=f(x,ψ(x))(4)
    • 于是二元函数(1)在 P 0 P_0 P0取得所求的极值相当于一元函数(4)在 x = x 0 x=x_0 x=x0处取得极值
    • 由一元可导函数取得极值的必要条件, z x ∣ x = x 0 = 0 z_{x}|_{x=x_0}=0 zxx=x0=0(5),即 f x ( x 0 , y 0 ) + f y ( x 0 , y 0 ) y x ∣ x = x 0 = 0 f_{x}(x_0,y_0)+f_{y}(x_0,y_0)y_{x}|_{x=x_0}=0 fx(x0,y0)+fy(x0,y0)yxx=x0=0(5-1)
    • 而由方程(2),用隐函数求导公式, y x ∣ x = x 0 y_{x}|_{x=x_0} yxx=x0= − ϕ x ( x 0 , y 0 ) ϕ y ( x 0 , y 0 ) -\frac{\phi_{x}(x_0,y_0)}{\phi_{y}(x_0,y_0)} ϕy(x0,y0)ϕx(x0,y0)(5-2)把上式代入(5-1),得
      • f x ( x 0 , y 0 ) − f y ( x 0 , y 0 ) ϕ x ( x 0 , y 0 ) ϕ y ( x 0 , y 0 ) = 0 f_{x}(x_0,y_0)-f_{y}(x_0,y_0)\frac{\phi_{x}(x_0,y_0)}{\phi_{y}(x_0,y_0)}=0 fx(x0,y0)fy(x0,y0)ϕy(x0,y0)ϕx(x0,y0)=0(6)
    • 式(3),(6)就是函数(1)在条件(2)下在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)取得极值得必要条件
  • 变形条件(6)
    • − f y ( x 0 , y 0 ) 1 ϕ y ( x 0 , y 0 ) -f_{y}(x_0,y_0)\frac{1}{\phi_{y}(x_0,y_0)} fy(x0,y0)ϕy(x0,y0)1= λ \lambda λ(6-1),变形即有 f y ( x 0 , y 0 ) + λ ϕ y ( x 0 , y 0 ) = 0 f_{y}(x_0,y_0)+\lambda\phi_{y}(x_0,y_0)=0 fy(x0,y0)+λϕy(x0,y0)=0(6-2)
    • 且式(6)改写为 f x ( x 0 , y 0 ) + λ ϕ x ( x 0 , y 0 ) = 0 f_{x}(x_0,y_0)+\lambda\phi_{x}(x_0,y_0)=0 fx(x0,y0)+λϕx(x0,y0)=0(6-3)
  • 将上述必要条件整理,得方程组(7)
    1. f x ( x 0 , y 0 ) + λ ϕ x ( x 0 , y 0 ) = 0 f_{x}(x_0,y_0)+\lambda\phi_{x}(x_0,y_0)=0 fx(x0,y0)+λϕx(x0,y0)=0
    2. f y ( x 0 , y 0 ) + λ ϕ y ( x 0 , y 0 ) = 0 f_{y}(x_0,y_0)+\lambda\phi_{y}(x_0,y_0)=0 fy(x0,y0)+λϕy(x0,y0)=0
    3. ϕ ( x 0 , y 0 ) = 0 \phi(x_0,y_0)=0 ϕ(x0,y0)=0
  • 引进辅助函数 L ( x , y ) = f ( x , y ) + λ ϕ ( x , y ) L(x,y)=f(x,y)+\lambda\phi(x,y) L(x,y)=f(x,y)+λϕ(x,y)(8),则(7-1,7-2)分别为 L x ( x 0 , y 0 ) = 0 L_{x}(x_0,y_0)=0 Lx(x0,y0)=0(9-1); L y ( x 0 , y 0 ) = 0 L_{y}(x_0,y_0)=0 Ly(x0,y0)=0(9-2)
  • 辅助函数 L ( x , y ) L(x,y) L(x,y)也称为Lagrange函数,参数 λ \lambda λ称为Lagrange乘子

拉格朗日乘数法

  • 要找到函数 z = f ( x , y ) z=f(x,y) z=f(x,y)(1)在附加条件 ϕ ( x , y ) = 0 \phi(x,y)=0 ϕ(x,y)=0(2)下的可能极值点,可以线作Lagrange函数: L ( x , y ) L(x,y) L(x,y)= f ( x , y ) + λ ϕ ( x , y ) f(x,y)+\lambda\phi(x,y) f(x,y)+λϕ(x,y)= f + λ ϕ f+\lambda\phi f+λϕ,其中 λ \lambda λ为参数
  • 求其对 x , y x,y x,y的一阶偏导数,并令它们为0,在和条件方程联立:
    • f x + λ ϕ x = 0 f_{x}+\lambda\phi_{x}=0 fx+λϕx=0
    • f y + λ ϕ y = 0 f_{y}+\lambda\phi_{y}=0 fy+λϕy=0
    • ϕ = 0 \phi=0 ϕ=0
  • 有此方程组解出 x , y , λ x,y,\lambda x,y,λ,得到的 ( x , y ) (x,y) (x,y)就是函数 f ( x , y ) f(x,y) f(x,y)在附加条件(2)下的可能极值点

推广

  • Lagrange乘数法可以推广到自变量多于2个,附加条件多于1个的情形
  • 例如求 u = f ( x , y , z , t ) u=f(x,y,z,t) u=f(x,y,z,t)在附加条件 ϕ ( x , y , z , t ) = 0 \phi(x,y,z,t)=0 ϕ(x,y,z,t)=0, ψ ( x , y , z , t ) = 0 \psi(x,y,z,t)=0 ψ(x,y,z,t)=0下的极值
    • 此时构造的Lagrange函数为 L ( x , y , z , t ) L(x,y,z,t) L(x,y,z,t)= f ( x , y , z , t ) + λ ϕ ( x , y , z , t ) + μ ψ ( x , y , z , t ) f(x,y,z,t)+\lambda\phi(x,y,z,t)+\mu{\psi(x,y,z,t)} f(x,y,z,t)+λϕ(x,y,z,t)+μψ(x,y,z,t)
    • 参数 λ , μ \lambda,\mu λ,μ也可以用记号 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2表示
    • 求Lagrange函数 L L L的各个一阶偏导并令它们为0,再来联立两个条件方程,求出 ( x , y , z , t ) (x,y,z,t) (x,y,z,t),就是可能是所求的极值点

应用

  • 求表面积为 a 2 a^2 a2而体积为最大的长方体的体积
    • 设长方体的三棱分别为 x , y , z x,y,z x,y,z,体积函数为 V = x y z V=xyz V=xyz, ( x , y , z > 0 ) (x,y,z>0) (x,y,z>0),(1)
    • 定义域之外的附加条件为 2 ( x y + y z + z x ) = a 2 2(xy+yz+zx)=a^2 2(xy+yz+zx)=a2(2),用方程一般形式表示:令 ϕ ( x , y , z ) \phi(x,y,z) ϕ(x,y,z)= 2 ( x y + y z + z x ) − a 2 2(xy+yz+zx)-a^2 2(xy+yz+zx)a2=0
    • 这是一个含3个自变量和一个附加条件的极值问题
    • 构造Lagrange函数为 L ( x , y , z ) L(x,y,z) L(x,y,z)= V + λ ϕ V+\lambda{\phi} V+λϕ= x y z + λ ( 2 ( x y + y z + z x ) − a 2 ) xyz+\lambda(2(xy+yz+zx)-a^2) xyz+λ(2(xy+yz+zx)a2)
    • 分别求偏导并令他们为0:得方程组(3)
      1. L x L_{x} Lx= y z + 2 λ ( y + z ) yz+2\lambda(y+z) yz+2λ(y+z)=0
      2. L y L_{y} Ly= x z + 2 λ ( x + z ) xz+2\lambda(x+z) xz+2λ(x+z)=0
      3. L z L_z Lz= x y + 2 λ ( y + x ) xy+2\lambda(y+x) xy+2λ(y+x)=0
    • 再与条件(2)联立(可以表示为 L λ = 2 ( x y + y z + z x ) − a 2 L_{\lambda}=2(xy+yz+zx)-a^2 Lλ=2(xy+yz+zx)a2=0
      • 对方程组(3)移项:
        • y z = − 2 λ ( y + z ) yz=-2\lambda(y+z) yz=2λ(y+z);(4-1)
        • x z = − 2 λ ( x + z ) xz=-2\lambda(x+z) xz=2λ(x+z);(4-2)
        • x y = − 2 λ ( y + x ) xy=-2\lambda(y+x) xy=2λ(y+x)(4-3)
      • 作式(4-1)比去(4-2),以及(4-1)比去(4-3)分别得:
        • x y = x + z y + z \frac{x}{y}=\frac{x+z}{y+z} yx=y+zx+z; y z = x + y x + z \frac{y}{z}=\frac{x+y}{x+z} zy=x+zx+y,分别令这两个比值为 k 1 , k 2 k_1,k_2 k1,k2
        • 由比例性质, k 1 = 1 , k 2 = 1 k_1=1,k_2=1 k1=1,k2=1,可得 x = y , y = z x=y,y=z x=y,y=z,
        • 即得 x = y = z x=y=z x=y=z,代入(2),得 x = y = z = 6 6 a x=y=z=\frac{\sqrt{6}}{6}a x=y=z=66 a

  • 抛物面 z = x 2 + y 2 z=x^2+y^2 z=x2+y2被平面 x + y + z = 1 x+y+z=1 x+y+z=1截成一个椭圆 C C C,求该椭圆上的点到原点的距离的最值
  • 仅作初步分析
    • 建模:目标函数为 d = x 2 + y 2 + z 2 d=\sqrt{x^2+y^2+z^2} d=x2+y2+z2 ,可以转换为求 d 2 = x 2 + y 2 + z 2 d^2=x^2+y^2+z^2 d2=x2+y2+z2的最值
    • 附加条件为 z = x 2 + y 2 z=x^2+y^2 z=x2+y2, x + y + z = 1 x+y+z=1 x+y+z=1
    • Note:本例的目标式求距离最值,而不求椭圆 C C C方程,将构成椭圆的两个方程作为附加条件