2023年多元统计分析期末试题
1.试论述系统聚类、动态聚类和有序聚类的异同之处。
2、设
X
{X}
X~
N
3
{N_3}
N3(μ,Σ),其中
X
{X}
X ~ (
X
1
{X_1}
X1,
X
2
{X_2}
X2,
X
3
{X_3}
X3),μ = (1,-2,3)‘,Σ =
[
1
1
1
1
3
2
1
2
2
]
\begin{bmatrix} 1 & 1& 1 \\ 1 & 3&2\\ 1&2&2 \end{bmatrix}
111132122
(1)试求3X1-4X2+5X3的分布;
(2)求二维向量a=(a1,a2)’,使X1与X1-a’
[
X
3
X
2
]
\begin{bmatrix} {X_3} \\ {X_2} \\ \end{bmatrix}
[X3X2]相互独立。
3.欧洲各国语言有许多相似之处,有的甚至十分相似。以 E, N, G, Fr, S, I 分别表示英语、挪威语、德语、法语、西班牙语、意大利语这 6 种语言。人们以任两种语言对 1-10 这 10 个数字拼写中第一个字母不相同的个数定义两种语言间的“距离”。这种“距离”是广义距离。例如,英语和挪威语只有数字 1 和 8 的第一个字母不同,故这两种语言的距离定义为2。这样得到 6 种语言间的距离矩阵如下。请用最长距离法对这 6 种语言进行谱系聚类,并画出谱系图。
4.设有两个正态总体 G1和 G2,已知μ(1)=(10,15)’, μ(2)=(20,25)’,
Σ 1 = [ 1 0 0 1 ] Σ_1=\begin{bmatrix} 1 & 0 \\ 0& 1 \end{bmatrix} Σ1=[1001], Σ 2 = [ 4 0 0 4 ] Σ_2=\begin{bmatrix} 4 & 0 \\ 0 & 4 \end{bmatrix} Σ2=[4004]
先验概率和错判损失相同.试问样品 X(1)=(14,18) ’及 X(2)=(15,20) ’各应判归哪一类
(1)按距离判别准则;
(2)按贝叶斯判别准则(提示,对密度函数取对数。计算时假设 lnx≈log2x)。
5.已知 X 的协差阵如下,试进行主成分分析,并求出每个主成分的贡献率及每个原始变量的
信息提取率。
Σ = [ 2 0 0 0 3 / 2 1 / 2 0 1 / 2 3 / 2 ] Σ =\begin{bmatrix} 2& 0& 0 \\ 0 & 3/2&1/2\\ 0&1/2&3/2 \end{bmatrix} Σ= 20003/21/201/23/2
6.设某总体可用 3 个指标来描述,在因子分析时,从约相关阵出发计算出特征值为
λ
1
{λ_1}
λ1=1.96,
λ
2
{λ_2}
λ2=1,
λ
3
{λ_3}
λ3=0.25。又知
λ
1
{λ_1}
λ1,
λ
2
{λ_2}
λ2 和
λ
3
{λ_3}
λ3对应的单位特征向量分别为(0.707,-0.316,0.632) ’,(0,0.899,0.447) ’及(0.929,-0.261,0.261)’,要求:
⑴ 计算因子载荷矩阵 A,并建立因子模型;
⑵ 计算共同度
h
i
2
{h_i^2}
hi2 (i=1,2,3);
⑶ 计算第一公共因子对总体的“贡献”。