x,y∈Rn,f(x,y)=xTy=i∑xiyi
∂xi∂f=yi
∂yi∂f=xi
故
∂x∂f=y
∂y∂f=x
以下是修改后的内容,公式已用 $$
包裹,适合在 .md
文件中显示:
在矩阵微积分中,分子布局(Numerator Layout) 和 分母布局(Denominator Layout) 是两种常见的约定,用于定义向量或矩阵对向量或矩阵的导数。它们的区别主要体现在导数的维度和排列方式上。以下是详细的展开说明:
1. 分子布局(Numerator Layout)
分子布局的核心思想是:导数的行数与分子(被求导的量)的维度一致,列数与分母(求导的量)的维度一致。
1.1 列向量对列向量求导
设 $ \mathbf{f} $ 是 $ m \times 1 $ 的列向量函数,$ \mathbf{x} $ 是 $ n \times 1 $ 的列向量。则导数 $ \frac{d\mathbf{f}}{d\mathbf{x}} $ 是一个 $ m \times n $ 的矩阵,其元素为:
dxdf=⎣⎢⎢⎢⎢⎢⎡∂x1∂f1∂x1∂f2⋮∂x1∂fm∂x2∂f1∂x2∂f2⋮∂x2∂fm⋯⋯⋱⋯∂xn∂f1∂xn∂f2⋮∂xn∂fm⎦⎥⎥⎥⎥⎥⎤
1.2 标量对列向量求导
设 $ f $ 是标量函数,$ \mathbf{x} $ 是 $ n \times 1 $ 的列向量。则导数 $ \frac{df}{d\mathbf{x}} $ 是一个 $ 1 \times n $ 的行向量:
dxdf=[∂x1∂f∂x2∂f⋯∂xn∂f]
1.3 列向量对矩阵求导
设 $ \mathbf{f} $ 是 $ m \times 1 $ 的列向量函数,$ \mathbf{X} $ 是 $ p \times q $ 的矩阵。则导数 $ \frac{d\mathbf{f}}{d\mathbf{X}} $ 是一个 $ m \times (p \cdot q) $ 的矩阵,其元素为:
dXdf=⎣⎢⎢⎢⎢⎢⎡∂X11∂f1∂X11∂f2⋮∂X11∂fm∂X12∂f1∂X12∂f2⋮∂X12∂fm⋯⋯⋱⋯∂Xpq∂f1∂Xpq∂f2⋮∂Xpq∂fm⎦⎥⎥⎥⎥⎥⎤
- 维度:$ m \times (p \cdot q) $
2. 分母布局(Denominator Layout)
分母布局的核心思想是:导数的行数与分母(求导的量)的维度一致,列数与分子(被求导的量)的维度一致。
2.1 列向量对列向量求导
设 $ \mathbf{f} $ 是 $ m \times 1 $ 的列向量函数,$ \mathbf{x} $ 是 $ n \times 1 $ 的列向量。则导数 $ \frac{d\mathbf{f}}{d\mathbf{x}} $ 是一个 $ n \times m $ 的矩阵,其元素为:
dxdf=⎣⎢⎢⎢⎢⎢⎡∂x1∂f1∂x2∂f1⋮∂xn∂f1∂x1∂f2∂x2∂f2⋮∂xn∂f2⋯⋯⋱⋯∂x1∂fm∂x2∂fm⋮∂xn∂fm⎦⎥⎥⎥⎥⎥⎤
2.2 标量对列向量求导
设 $ f $ 是标量函数,$ \mathbf{x} $ 是 $ n \times 1 $ 的列向量。则导数 $ \frac{df}{d\mathbf{x}} $ 是一个 $ n \times 1 $ 的列向量:
dxdf=⎣⎢⎢⎢⎢⎢⎡∂x1∂f∂x2∂f⋮∂xn∂f⎦⎥⎥⎥⎥⎥⎤
2.3 列向量对矩阵求导
设 $ \mathbf{f} $ 是 $ m \times 1 $ 的列向量函数,$ \mathbf{X} $ 是 $ p \times q $ 的矩阵。则导数 $ \frac{d\mathbf{f}}{d\mathbf{X}} $ 是一个 $ (p \cdot q) \times m $ 的矩阵,其元素为:
dXdf=⎣⎢⎢⎢⎢⎢⎡∂X11∂f1∂X12∂f1⋮∂Xpq∂f1∂X11∂f2∂X12∂f2⋮∂Xpq∂f2⋯⋯⋱⋯∂X11∂fm∂X12∂fm⋮∂Xpq∂fm⎦⎥⎥⎥⎥⎥⎤
- 维度:$ (p \cdot q) \times m $
总结
- 分子布局:导数的行数与分子一致,列数与分母一致。
- 分母布局:导数的行数与分母一致,列数与分子一致。
- 两种布局的区别主要体现在导数的维度和排列方式上,选择哪种布局取决于具体应用场景和领域习惯。
现在所有公式都已用 $$
包裹,可以直接复制到 .md
文件中使用。