Rayleigh 商 (Rayleigh Quotient)
定义 Definition
Rayleigh 商用于描述一个向量 和矩阵 之间的关系。对于给定的向量 和对称矩阵 ,Rayleigh 商定义如下:
The Rayleigh quotient describes the relationship between a vector and a matrix . For a given vector and symmetric matrix , the Rayleigh quotient is defined as:
其中,。
where .
性质 Properties
-
范围 Range: 对于对称矩阵 ,Rayleigh 商 的值在 的最小特征值 和最大特征值 之间。
For a symmetric matrix , the value of the Rayleigh quotient lies between the minimum eigenvalue and the maximum eigenvalue of .
-
特征值与特征向量 Eigenvalues and Eigenvectors: 如果 是 的特征向量,则 Rayleigh 商 等于 对应的特征值。
If is an eigenvector of , then the Rayleigh quotient equals the eigenvalue corresponding to .
-
正定矩阵 Positive Definite Matrix: 如果 是正定矩阵,则 Rayleigh 商 始终为正。
If is a positive definite matrix, then the Rayleigh quotient is always positive.
求解最值过程 Solving for Extremum
Rayleigh 商在求解特征值问题中非常重要,尤其是求最大和最小特征值。Rayleigh quotient is crucial in solving eigenvalue problems, especially for finding the maximum and minimum eigenvalues.
利用二次型、线性变换和矩阵特征值计算 Rayleigh 商的最值 Using Quadratic Forms, Linear Transformations, and Matrix Eigenvalues to Calculate the Extremum of the Rayleigh Quotient
-
二次型 Quadratic Form: Quadratic Forms and Positive Definite Matrices
二次型 表示向量 在矩阵 作用下的二次变换。Rayleigh 商可以视为二次型与向量模长平方的比值。
The quadratic form represents the quadratic transformation of the vector under the matrix . The Rayleigh quotient can be seen as the ratio of the quadratic form to the squared norm of the vector.
-
线性变换 Linear Transformation: Linear Transformation 考虑 的特征值分解 ,其中 是正交矩阵, 是对角矩阵,包含 的特征值。令 ,则有
Consider the eigenvalue decomposition of , , where is an orthogonal matrix and is a diagonal matrix containing the eigenvalues of . Let , then
-
分解过程 Decomposition Process:
-
特征值分解 Eigenvalue Decomposition: Eigenvalue & Eigen vector 首先,我们需要找到对称矩阵 的特征值和特征向量。特征值分解 其中 是由 的特征向量构成的正交矩阵, 是对角矩阵,包含 的特征值 。
First, we need to find the eigenvalues and eigenvectors of the symmetric matrix . The eigenvalue decomposition where is an orthogonal matrix composed of the eigenvectors of , and is a diagonal matrix containing the eigenvalues of .
-
其中 $\mathbf{q}_i$ 是 $\mathbf{A}$ 的特征向量,$\lambda_i$ 是对应的特征值。
where $\mathbf{q}_i$ is the eigenvector of $\mathbf{A}$ and $\lambda_i$ is the corresponding eigenvalue.
- **变换到特征空间 Transformation to Eigenvector Space**:
将向量 $\mathbf{x}$ 表示为特征向量的线性组合,即 $\mathbf{x} = \mathbf{Q} \mathbf{y}$,其中 $\mathbf{y}$ 是新坐标系中的向量。
Represent the vector $\mathbf{x}$ as a linear combination of eigenvectors, i.e., $\mathbf{x} = \mathbf{Q} \mathbf{y}$, where $\mathbf{y}$ is the vector in the new coordinate system.
由于 $\mathbf{Q}$ 是正交矩阵,所以 $\mathbf{Q}^\top \mathbf{Q} = \mathbf{I}$。
Since $\mathbf{Q}$ is an orthogonal matrix, $\mathbf{Q}^\top \mathbf{Q} = \mathbf{I}$.
$$
\mathbf{x}^\top \mathbf{x} = (\mathbf{Q} \mathbf{y})^\top (\mathbf{Q} \mathbf{y}) = \mathbf{y}^\top \mathbf{Q}^\top \mathbf{Q} \mathbf{y} = \mathbf{y}^\top \mathbf{y} $$
- **Rayleigh 商的表示 Representation of Rayleigh Quotient**:
将以上结果代入 Rayleigh 商的定义中,得到:
Substituting the above results into the definition of the Rayleigh quotient, we get:
$$ R(\mathbf{x}) = \frac{\mathbf{x}^\top \mathbf{A} \mathbf{x}}{\mathbf{x}^\top \mathbf{x}} = \frac{\mathbf{y}^\top \mathbf{\Lambda} \mathbf{y}}{\mathbf{y}^\top \mathbf{y}} $$
-
最大特征值与最小特征值 Maximum and Minimum Eigenvalues: 对于矩阵 的最大特征值 和最小特征值 ,可以通过如下方式计算 Rayleigh 商的最值:
For the maximum eigenvalue and minimum eigenvalue of the matrix , the extrema of the Rayleigh quotient can be calculated as follows:
-
最大值 Maximum: 当 为对应于 的特征向量时,Rayleigh 商达到最大值 。即
When is the eigenvector corresponding to , the Rayleigh quotient reaches its maximum value . That is,
-
R(\mathbf
{x}) = \lambda_{\min} \text{ 当 } \mathbf{x} = \mathbf{q}_{\min}
$$
详细示例 Detailed Example
假设 是一个 的对称矩阵:
Suppose is a symmetric matrix:
-
求特征值和特征向量 Finding Eigenvalues and Eigenvectors: 解特征方程 ,得到特征值 。
Solve the characteristic equation to get eigenvalues .
对应的特征向量分别为:
The corresponding eigenvectors are:
-
特征值分解 Eigenvalue Decomposition: 构造 和 :
Construct and :
-
计算 Rayleigh 商 Calculating Rayleigh Quotient: 对于任意向量 ,可以将其表示为 。
For any vector , it can be represented as .
R(\mathbf{x}) = \lambda_1 = 5
当 $\mathbf{x} = \mathbf{q}_2$ 时,
When $\mathbf{x} = \mathbf{q}_2$,
R(\mathbf{x}) = \lambda_2 = 2