随机矩阵投影长度保持引理及其证明

原论文中的引理 2 \textbf{2} 2

引理 2 \textbf{2} 2的内容​​

👉前提 1 1 1:设一个随机矩阵 S = ( s i j ) ∈ R t × d S\text{=}(s_{ij})\text{∈}\mathbb{R}^{t\text{×}d} S=(sij)Rt×d,每个元素 s i j s_{ij} sij独立同分布于 N ( 0 , 1 ) N(0,1) N(0,1)

👉前提 2 2 2:对任意固定向量 u ∈ R d × 1 u\text{∈}\mathbb{R}^{d\text{×}1} uRd×1(即 u i j u_{ij} uij不随机),定义 u ′ = 1 t ( S u ) u^{\prime}\text{=}\cfrac{1}{\sqrt{t}}(Su) u=t 1(Su)

👉结论 1 1 1 E [ ∥ u ′ ∥ 2 ] = ∥ u ∥ 2 \mathbb{E}\left[\left\|u^{\prime}\right\|^2\right]\text{=}\|u\|^2 E[u2]=u2,即 ∥ u ′ ∥ 2 \left\|u^{\prime}\right\|^2 u2 ∥ u ∥ 2 \|u\|^2 u2在统计学上是相等的

👉结论 2 2 2 Pr [ ∥ u ′ ∥ 2 ∉ ( 1 ± ε ) ∥ u ∥ 2 ] ≤ 2 e – ( ε 2 – ε 3 ) t 4 \text{Pr}\left[\left\|u^{\prime}\right\|^2\notin(1\text{±}\varepsilon{})\|u\|^2\right]\text{≤}2e^{–\left(\varepsilon{}^2–\varepsilon{}^3\right)\frac{t}{4}} Pr[u2/(1±ε)u2]2e(ε2ε3)4t,即 ∥ u ′ ∥ 2 \left\|u^{\prime}\right\|^2 u2 ∥ u ∥ 2 \|u\|^2 u2在实际值上偏差极小且可控

引理 1 \textbf{1} 1的内容

👉前提: X ∼ N ( 0 , σ ) X\sim{}N(0,\sigma) XN(0,σ) f ( x ) = 1 2 π σ e – x 2 2 σ 2 f(x)\text{=}\cfrac{1}{\sqrt{2\pi}\sigma}e^{–\frac{x^{2}}{2\sigma^{2}}} f(x)=2π σ1e2σ2x2,且 ∀ α < 1 2 σ 2 \forall{}\alpha{}\text{<}\cfrac{1}{2\sigma^{2}} α<2σ21

👉结论: E [ e α X 2 ] = 1 1 – 2 α σ 2 \mathbb{E}\left[e^{\alpha{}X^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}\sigma^{2}}} E[eαX2]=1–2ασ2 1

对结论 1 \textbf{1} 1的证明

➡️对于 s i j ∼ N ( 0 , 1 ) s_{ij}\sim{}N(0,1) sijN(0,1),则有 S ⋅ j u = ∑ i = 1 d s i j u i ∼ N ( 0 , ∥ u ∥ 2 ) \displaystyle{}S_{\cdot{}j}u\text{=}\sum_{i=1}^{d}s_{ij}u_i\sim{}N(0,\|u\|^2) Sju=i=1dsijuiN(0,u2)

  1. 均值 E [ S ⋅ j u ] = E [ ∑ i = 1 d s i j u i ] = ∑ i = 1 d u i E [ s i j ] = 0 \displaystyle{}\mathbb{E}\left[S_{\cdot{}j}u\right]\text{=}\mathbb{E}\left[\sum_{i=1}^ds_{ij}u_i\right]\text{=}\sum_{i=1}^du_i\mathbb{E}\left[s_{ij}\right]\text{=}0 E[Sju]=E[i=1dsijui]=i=1duiE[sij]=0
  2. 方差 Var [ S ⋅ j u ] =Var [ ∑ i = 1 d s i j u i ] = ∑ i = 1 d Var [ s i j u i ] = ∑ i = 1 d u i 2 Var [ s i j ] = ∑ i = 1 d u i 2 = ∥ u ∥ 2 \displaystyle{}\text{Var}\left[S_{\cdot{}j}u\right]\text{=}\text{Var}\left[\sum_{i=1}^ds_{ij}u_i\right]\text{=}\sum_{i=1}^d\text{Var}[s_{ij}u_i]\text{=}\sum_{i=1}^du_i^2\text{Var}[s_{ij}]\text{=}\sum_{i=1}^du_i^2\text{=}\|u\|^2 Var[Sju]=Var[i=1dsijui]=i=1dVar[sijui]=i=1dui2Var[sij]=i=1dui2=u2

➡️正态分布性质 E [ X 2 ] = σ 2 \mathbb{E}[X^2]\text{=}\sigma{}^2 E[X2]=σ2,所以 E [ ( S ⋅ j u ) 2 ] = ∥ u ∥ 2 \mathbb{E}\left[\left(S_{\cdot{}j}u\right)^2\right]\text{=}\|u\|^2 E[(Sju)2]=u2

➡️所以 E [ ∥ S u ∥ 2 ] = E [ ∑ j = 1 t ( S ⋅ j u ) 2 ] = ∑ j = 1 t E [ ( S ⋅ j u ) 2 ] = t ∥ u ∥ 2 \displaystyle{}\mathbb{E}\left[\|Su\|^2\right]\text{=}\mathbb{E}\left[\sum_{j\text{=}1}^t\left(S_{\cdot{}j}u\right)^2\right]\text{=}\sum_{j=1}^t\mathbb{E}\left[\left(S_{\cdot{}j}u\right)^2\right]\text{=}t\|u\|^2 E[Su2]=E[j=1t(Sju)2]=j=1tE[(Sju)2]=tu2

➡️根据 u ′ = 1 t ( S u ) u^{\prime}\text{=}\cfrac{1}{\sqrt{t}}(Su) u=t 1(Su),得到 ∥ u ′ ∥ 2 = 1 t ∥ S u ∥ 2 \left\|u^{\prime}\right\|^2\text{=}\cfrac{1}{t}\|Su\|^2 u2=t1Su2

➡️所以 E [ ∥ u ′ ∥ 2 ] = E [ 1 t ∥ S u ∥ 2 ] = 1 t E [ ∥ S u ∥ 2 ] = 1 t ( t ∥ u ∥ 2 ) = ∥ u ∥ 2 \displaystyle{}\mathbb{E}\left[\left\|u^{\prime}\right\|^2\right]\text{=}\mathbb{E}\left[\cfrac{1}{t}\|Su\|^2\right]\text{=}\cfrac{1}{t}\mathbb{E}\left[\|Su\|^2\right]\text{=}\cfrac{1}{t}\left(t\|u\|^2\right)\text{=}\|u\|^2 E[u2]=E[t1Su2]=t1E[Su2]=t1(tu2)=u2

对结论 2 \textbf{2} 2的证明(正半边)

➡️考虑到 S ⋅ j u ∼ N ( 0 , ∥ u ∥ 2 ) \displaystyle{}S_{\cdot{}j}u\sim{}N(0,\|u\|^2) SjuN(0,u2),故将其归一化为 X j = S ⋅ j u ∥ u ∥ ∼ N ( 0 , 1 ) X_j\text{=}\cfrac{S_{\cdot{}j}u}{\|u\|}\sim{}N(0,1) Xj=uSjuN(0,1)

➡️由此定义 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2(自由度为 t t t χ 2 \chi^2 χ2分布),由此 ∥ u ′ ∥ 2 = 1 t ∥ S u ∥ 2 = 1 t ∑ j = 1 t ( S ⋅ j u ) 2 = ∥ u ∥ 2 1 t ∑ j = 1 t X j 2 = 1 t ∥ u ∥ 2 X \displaystyle{}\left\|u^{\prime}\right\|^2\text{=}\cfrac{1}{t}\|Su\|^2\text{=}\cfrac{1}{t}\sum_{j=1}^t\left(S_{\cdot{}j}u\right)^2\text{=}\|u\|^2\cfrac{1}{t}\sum_{j=1}^tX_j^2\text{=}\cfrac{1}{t}\|u\|^2X u2=t1Su2=t1j=1t(Sju)2=u2t1j=1tXj2=t1u2X

➡️由此 Pr [ ∥ u ′ ∥ 2 ≥ ( 1 + ε ) ∥ u ∥ 2 ] =Pr [ X ≥ ( 1 + ε ) t ] \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≥}(1\text{+}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right] Pr[u2(1+ε)u2]=Pr[X(1+ε)t]

➡️考虑马可夫不等式的指数形式: Pr [ X ≥ ( 1 + ε ) t ] =Pr [ e α X ≥ e α ( 1 + ε ) t ] ≤ E [ e α X ] e α ( 1 + ε ) t \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{=}\text{Pr}\left[e^{\alpha{}X}\text{≥}e^{\alpha{}(1\text{+}\varepsilon{})t}\right]\text{≤}\cfrac{\mathbb{E}\left[e^{\alpha{}X}\right]}{e^{\alpha{}(1\text{+}\varepsilon{})t}} Pr[X(1+ε)t]=Pr[eαXeα(1+ε)t]eα(1+ε)tE[eαX]

  1. 考虑到 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2,所以 E [ e α X ] = E [ e α ( X 1 2 + X 2 2 + ⋯ + X t 2 ) ] = E [ e α X 1 2 e α X 2 2 ⋯ e α X t 2 ] = E [ ∏ j = 1 t e α X j 2 ] = ∏ j = 1 t E [ e α X j 2 ] \displaystyle{}\mathbb{E}\left[e^{\alpha{}X}\right]\text{=}\mathbb{E}\left[e^{\alpha{}(X^2_1\text{+}X^2_2\text{+}\cdots\text{+}X^2_t)}\right]\text{=}\mathbb{E}\left[e^{\alpha{}X^2_1}e^{\alpha{}X^2_2}\cdots{}e^{\alpha{}X^2_t}\right]\text{=}\mathbb{E}\left[\prod_{j=1}^te^{\alpha{}X^2_j}\right]\text{=}\prod_{j=1}^t\mathbb{E}\left[e^{\alpha{}X_j^2}\right] E[eαX]=E[eα(X12+X22++Xt2)]=E[eαX12eαX22eαXt2]=E[j=1teαXj2]=j=1tE[eαXj2]
  2. 在引理 1 1 1中已经证明 E [ e α X j 2 ] = 1 1 – 2 α σ 2 ( α < 1 2 σ 2 ) \mathbb{E}\left[e^{\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}\sigma^{2}}}(\alpha{}\text{<}\cfrac{1}{2\sigma^{2}}) E[eαXj2]=1–2ασ2 1(α<2σ21),考虑到此处 σ ( X j ) = 1 \sigma({X_j})\text{=}1 σ(Xj)=1所以 E [ e α X j 2 ] = 1 1 – 2 α ( α < 1 2 ) \mathbb{E}\left[e^{\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}}}(\alpha{}\text{<}\cfrac{1}{2}) E[eαXj2]=1–2α 1(α<21)
  3. 所以 E [ e α X ] = ∏ j = 1 t ( 1 1 – 2 α ) = ( 1 1 – 2 α ) t = 1 ( 1 – 2 α ) t 2 \displaystyle{}\mathbb{E}\left[e^{\alpha{}X}\right]\text{=}\prod_{j=1}^t\left(\cfrac{1}{\sqrt{1–2\alpha{}}}\right)\text{=}\left(\cfrac{1}{\sqrt{1–2\alpha{}}}\right)^t\text{=}\cfrac{1}{(1–2\alpha)^{\frac{t}{2}}} E[eαX]=j=1t(1–2α 1)=(1–2α 1)t=(1–2α)2t1
  4. 代入原式得 Pr [ X ≥ ( 1 + ε ) t ] ≤ E [ e α X ] e α ( 1 + ε ) t = ( 1 – 2 α ) – t 2 e α ( 1 + ε ) t = ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\cfrac{\mathbb{E}\left[e^{\alpha{}X}\right]}{e^{\alpha{}(1\text{+}\varepsilon{})t}}\text{=}\cfrac{{(1–2\alpha)^{–\frac{t}{2}}}}{e^{\alpha{}(1\text{+}\varepsilon{})t}}\text{=}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}} Pr[X(1+ε)t]eα(1+ε)tE[eαX]=eα(1+ε)t(1–2α)2t=(1–2αe–2(1+ε)α)2t

➡️对于 Pr [ X ≥ ( 1 + ε ) t ] ≤ ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}} Pr[X(1+ε)t](1–2αe–2(1+ε)α)2t,有必要在 0 < α < 1 2 0\text{<}\alpha{}\text{<}\cfrac{1}{2} 0<α<21的范围内确定 f ( α ) = ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 f(\alpha)\text{=}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}} f(α)=(1–2αe–2(1+ε)α)2t的最小值

  1. 对于 ln ⁡ ( f ( α ) ) = t 2 [ – 2 ( 1 + ε ) α – ln ⁡ ( 1 – 2 α ) ] \ln(f(\alpha))\text{=}\cfrac{t}{2}[–2(1\text{+}\varepsilon)\alpha–\ln(1–2\alpha)] ln(f(α))=2t[–2(1+ε)αln(1–2α)],令 g ( α ) =– 2 ( 1 + ε ) α – ln ⁡ ( 1 – 2 α ) g(\alpha)\text{=}–2(1\text{+}\varepsilon)\alpha–\ln(1–2\alpha) g(α)=–2(1+ε)αln(1–2α),如下图( ε = 3 \varepsilon\text{=}3 ε=3)
    image-20250123232509535
  2. 一阶导 d g ( α ) d α = 2 1 – 2 α – 2 ( 1 + ε ) \cfrac{\text{d}g{(\alpha)}}{\text{d}\alpha}\text{=}\cfrac{2}{1–2\alpha}–2(1\text{+}\varepsilon) dαdg(α)=1–2α2–2(1+ε),具有临界点 α ∗ = ε 2 ( 1 + ε ) ∈ ( 0 , 1 2 ) \alpha^*\text{=}\cfrac{\varepsilon}{2(1\text{+}\varepsilon)}\text{∈}\left(0,\cfrac{1}{2}\right) α=2(1+ε)ε(0,21),故 ε > 0 \varepsilon\text{>}0 ε>0
  3. 代入原式即得 Pr [ X ≥ ( 1 + ε ) t ] ≤ ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 ≤ ( ( 1 + ε ) e – ε ) t 2 \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1\text{+}\varepsilon) e^{–\varepsilon}\right)^{\frac{t}{2}} Pr[X(1+ε)t](1–2αe–2(1+ε)α)2t((1+ε)eε)2t

➡️进一步对 h ( ε ) = ( ( 1 + ε ) e – ε ) t 2 h(\varepsilon)\text{=}\left((1\text{+}\varepsilon)e^{–\varepsilon}\right)^{\frac{t}{2}} h(ε)=((1+ε)eε)2t的分析

  1. 泰勒展开 ln ⁡ ( 1 + ε ) = ε – ε 2 2 + ε 3 3 + O ( ε 4 ) \ln{}(1\text{+}\varepsilon)\text{=}\varepsilon–\cfrac{\varepsilon^2}{2}\text{+}\cfrac{\varepsilon^3}{3}\text{+}O\left(\varepsilon^4\right) ln(1+ε)=ε2ε2+3ε3+O(ε4),则 ln ⁡ ( 1 + ε ) – ε ≤– ε 2 2 + ε 3 3 ≤– 1 2 ( ε 2 – ε 3 ) \ln(1\text{+}\varepsilon)–\varepsilon\text{≤}–\cfrac{\varepsilon^2}{2}\text{+}\cfrac{\varepsilon^3}{3}\text{≤}–\cfrac{1}{2}\left(\varepsilon^2–\varepsilon^3\right) ln(1+ε)ε2ε2+3ε321(ε2ε3)
  2. 故在 ln ⁡ ( h ( ε ) ) = t 2 ( ln ⁡ ( 1 + ε ) – ε ) ≤– t 4 ( ε 2 – ε 3 ) \ln(h(\varepsilon))\text{=}\cfrac{t}{2}(\ln(1\text{+}\varepsilon)–\varepsilon)\text{≤}–\cfrac{t}{4}\left(\varepsilon^2–\varepsilon^3\right) ln(h(ε))=2t(ln(1+ε)ε)4t(ε2ε3),即 h ( ε ) ≤ e – t 4 ( ε 2 – ε 3 ) h(\varepsilon)\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} h(ε)e4t(ε2ε3)

➡️最后 Pr [ ∥ u ′ ∥ 2 ≥ ( 1 + ε ) ∥ u ∥ 2 ] =Pr [ X ≥ ( 1 + ε ) t ] ≤ ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 ≤ ( ( 1 + ε ) e – ε ) t 2 ≤ e – t 4 ( ε 2 – ε 3 ) \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≥}(1\text{+}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1\text{+}\varepsilon) e^{–\varepsilon}\right)^{\frac{t}{2}}\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} Pr[u2(1+ε)u2]=Pr[X(1+ε)t](1–2αe–2(1+ε)α)2t((1+ε)eε)2te4t(ε2ε3)

对结论 2 2 2的证明(负半边)

➡️考虑到 S ⋅ j u ∼ N ( 0 , ∥ u ∥ 2 ) \displaystyle{}S_{\cdot{}j}u\sim{}N(0,\|u\|^2) SjuN(0,u2),故将其归一化为 X j = S ⋅ j u ∥ u ∥ ∼ N ( 0 , 1 ) X_j\text{=}\cfrac{S_{\cdot{}j}u}{\|u\|}\sim{}N(0,1) Xj=uSjuN(0,1)

➡️由此定义 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2(自由度为 t t t χ 2 \chi^2 χ2分布),由此 ∥ u ′ ∥ 2 = 1 t ∥ S u ∥ 2 = 1 t ∑ j = 1 t ( S ⋅ j u ) 2 = ∥ u ∥ 2 1 t ∑ j = 1 t X j 2 = 1 t ∥ u ∥ 2 X \displaystyle{}\left\|u^{\prime}\right\|^2\text{=}\cfrac{1}{t}\|Su\|^2\text{=}\cfrac{1}{t}\sum_{j=1}^t\left(S_{\cdot{}j}u\right)^2\text{=}\|u\|^2\cfrac{1}{t}\sum_{j=1}^tX_j^2\text{=}\cfrac{1}{t}\|u\|^2X u2=t1Su2=t1j=1t(Sju)2=u2t1j=1tXj2=t1u2X

➡️由此 Pr [ ∥ u ′ ∥ 2 ≤ ( 1 – ε ) ∥ u ∥ 2 ] =Pr [ X ≤ ( 1 – ε ) t ] =Pr [ – X ≥– ( 1 – ε ) t ] \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≤}(1\text{–}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[X\text{≤}(1\text{–}\varepsilon{})t\right]\text{=}\text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right] Pr[u2(1ε)u2]=Pr[X(1ε)t]=Pr[X(1ε)t]

➡️考虑马可夫不等式的指数形式: Pr [ – X ≥– ( 1 – ε ) t ] =Pr [ e α ( – X ) ≥ e – α ( 1 – ε ) t ] ≤ E [ e – α X ] e – α ( 1 – ε ) t \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{=}\text{Pr}\left[e^{\alpha{}(–X)}\text{≥}e^{–\alpha{}(1\text{–}\varepsilon{})t}\right]\text{≤}\cfrac{\mathbb{E}\left[e^{–\alpha{}X}\right]}{e^{–\alpha{}(1\text{–}\varepsilon{})t}} Pr[X(1ε)t]=Pr[eα(X)eα(1ε)t]eα(1ε)tE[eαX]

  1. X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2,所以 E [ e – α X ] = E [ e – α ( X 1 2 + X 2 2 + ⋯ + X t 2 ) ] = E [ e – α X 1 2 e – α X 2 2 ⋯ e – α X t 2 ] = E [ ∏ j = 1 t e – α X j 2 ] = ∏ j = 1 t E [ e – α X j 2 ] \displaystyle{}\mathbb{E}\left[e^{–\alpha{}X}\right]\text{=}\mathbb{E}\left[e^{–\alpha{}(X^2_1\text{+}X^2_2\text{+}\cdots\text{+}X^2_t)}\right]\text{=}\mathbb{E}\left[e^{–\alpha{}X^2_1}e^{–\alpha{}X^2_2}\cdots{}e^{–\alpha{}X^2_t}\right]\text{=}\mathbb{E}\left[\prod_{j=1}^te^{–\alpha{}X_j^2}\right]\text{=}\prod_{j=1}^t\mathbb{E}\left[e^{–\alpha{}X_j^2}\right] E[eαX]=E[eα(X12+X22++Xt2)]=E[eαX12eαX22eαXt2]=E[j=1teαXj2]=j=1tE[eαXj2]
  2. 在引理 1 1 1中已经证明 E [ e – α X j 2 ] = 1 1 + 2 α σ 2 ( α >– 1 2 σ 2 ) \mathbb{E}\left[e^{–\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1\text{+}2\alpha{}\sigma^{2}}}(\alpha{}\text{>}–\cfrac{1}{2\sigma^{2}}) E[eαXj2]=1+2ασ2 1(α>2σ21),考虑到此处 σ ( X j ) = 1 \sigma({X_j})\text{=}1 σ(Xj)=1所以 E [ e – α X j 2 ] = 1 1 + 2 α ( α >– 1 2 ) \mathbb{E}\left[e^{–\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1\text{+}2\alpha{}}}(\alpha{}\text{>}–\cfrac{1}{2}) E[eαXj2]=1+2α 1(α>21)
  3. 所以 E [ e – α X ] = ∏ j = 1 t ( 1 1 + 2 α ) = ( 1 1 + 2 α ) t = 1 ( 1 + 2 α ) t 2 \displaystyle{}\mathbb{E}\left[e^{–\alpha{}X}\right]\text{=}\prod_{j=1}^t\left(\cfrac{1}{\sqrt{1\text{+}2\alpha{}}}\right)\text{=}\left(\cfrac{1}{\sqrt{1\text{+}2\alpha{}}}\right)^t\text{=}\cfrac{1}{(1\text{+}2\alpha)^{\frac{t}{2}}} E[eαX]=j=1t(1+2α 1)=(1+2α 1)t=(1+2α)2t1
  4. 代入原式得 Pr [ – X ≥– ( 1 – ε ) t ] ≤ E [ e – α X ] e – α ( 1 – ε ) t = ( 1 + 2 α ) – t 2 e – α ( 1 – ε ) t = ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\cfrac{\mathbb{E}\left[e^{–\alpha{}X}\right]}{e^{–\alpha{}(1–\varepsilon{})t}}\text{=}\cfrac{{(1\text{+}2\alpha)^{–\frac{t}{2}}}}{e^{–\alpha{}(1–\varepsilon{})t}}\text{=}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}} Pr[X(1ε)t]eα(1–ε)tE[eαX]=eα(1–ε)t(1+2α)2t=(1+2αe2(1–ε)α)2t

➡️对于 Pr [ – X ≥– ( 1 – ε ) t ] ≤ ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}} Pr[X(1ε)t](1+2αe2(1–ε)α)2t,有必要在 α >– 1 2 \alpha{}\text{>}–\cfrac{1}{2} α>21的范围内确定 f ( α ) = ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 f(\alpha)\text{=}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}} f(α)=(1+2αe2(1–ε)α)2t的最小值

  1. 对于 ln ⁡ ( f ( α ) ) = t 2 [ 2 ( 1 – ε ) α – ln ⁡ ( 1 + 2 α ) ] \ln(f(\alpha))\text{=}\cfrac{t}{2}[2(1–\varepsilon)\alpha–\ln(1\text{+}2\alpha)] ln(f(α))=2t[2(1–ε)αln(1+2α)],令 g ( α ) = [ 2 ( 1 – ε ) α – ln ⁡ ( 1 + 2 α ) ] g(\alpha)\text{=}[2(1–\varepsilon)\alpha–\ln(1\text{+}2\alpha)] g(α)=[2(1–ε)αln(1+2α)],如下图( ε =– 1 3 \varepsilon\text{=}–\cfrac{1}{3} ε=31)
    image-20250123232509535
  2. 一阶导 d g ( α ) d α =– 2 1 + 2 α + 2 ( 1 + ε ) \cfrac{\text{d}g{(\alpha)}}{\text{d}\alpha}\text{=}–\cfrac{2}{1\text{+}2\alpha}\text{+}2(1\text{+}\varepsilon) dαdg(α)=1+2α2+2(1+ε),具有临界点 α ∗ = ε 2 ( 1 – ε ) ∈ ( – 1 2 , +∞ ) \alpha^*\text{=}\cfrac{\varepsilon}{2(1–\varepsilon)}\text{∈}\left(–\cfrac{1}{2},\text{+∞}\right) α=2(1–ε)ε(21,+∞),故 – 1 < ε < 1 –1\text{<}\varepsilon\text{<}1 –1<ε<1(由于前提限制故截取为 0 < ε < 1 0\text{<}\varepsilon\text{<}1 0<ε<1)
  3. 代入原式即得 Pr [ – X ≥– ( 1 – ε ) t ] ≤ ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 ≤ ( ( 1 – ε ) e ε ) t 2 \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1–\varepsilon) e^{\varepsilon}\right)^{\frac{t}{2}} Pr[X(1ε)t](1+2αe2(1–ε)α)2t((1–ε)eε)2t

➡️进一步对 h ( ε ) = ( ( 1 – ε ) e ε ) t 2 h(\varepsilon)\text{=}\left((1–\varepsilon) e^{\varepsilon}\right)^{\frac{t}{2}} h(ε)=((1–ε)eε)2t的分析

  1. 泰勒展开 ln ⁡ ( 1 – ε ) =– ε – ε 2 2 – ε 3 3 + O ( ε 4 ) \ln{}(1–\varepsilon)\text{=}–\varepsilon–\cfrac{\varepsilon^2}{2}–\cfrac{\varepsilon^3}{3}\text{+}O\left(\varepsilon^4\right) ln(1–ε)=ε2ε23ε3+O(ε4),则 ln ⁡ ( 1 – ε ) + ε ≤– ε 2 2 – ε 3 3 ≤– 1 2 ( ε 2 – ε 3 ) \ln(1–\varepsilon)\text{+}\varepsilon\text{≤}–\cfrac{\varepsilon^2}{2}–\cfrac{\varepsilon^3}{3}\text{≤}–\cfrac{1}{2}\left(\varepsilon^2–\varepsilon^3\right) ln(1–ε)+ε2ε23ε321(ε2ε3)
  2. 故在 ln ⁡ ( h ( ε ) ) = t 2 ( ln ⁡ ( 1 – ε ) + ε ) ≤– t 4 ( ε 2 – ε 3 ) \ln(h(\varepsilon))\text{=}\cfrac{t}{2}(\ln(1–\varepsilon)\text{+}\varepsilon)\text{≤}–\cfrac{t}{4}\left(\varepsilon^2–\varepsilon^3\right) ln(h(ε))=2t(ln(1–ε)+ε)4t(ε2ε3),即 h ( ε ) ≤ e – t 4 ( ε 2 – ε 3 ) h(\varepsilon)\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} h(ε)e4t(ε2ε3)

➡️最后 Pr [ ∥ u ′ ∥ 2 ≤ ( 1 – ε ) ∥ u ∥ 2 ] =Pr [ – X ≥– ( 1 – ε ) t ] ≤ ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 ≤ ( ( 1 – ε ) e ε ) t 2 ≤ e – t 4 ( ε 2 – ε 3 ) \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≤}(1\text{–}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1–\varepsilon) e^{\varepsilon}\right)^{\frac{t}{2}}\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} Pr[u2(1ε)u2]=Pr[X(1ε)t](1+2αe2(1–ε)α)2t((1–ε)eε)2te4t(ε2ε3)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/961959.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

详细解释java当中的所有知识点(前言及数据类型及变量)(第一部分)

会将java当中的所有的知识点以及相关的题目进行分享&#xff0c;这是其中的第一部分&#xff0c;用红色字体标注出重点&#xff0c;以及加粗的方式进行提醒 目录 一、Java语言概述 1.Java语言简介 2.语言优势 二、main方法 1.Java程序结构组成 2.运行Java程序 3.注释 4.…

STM32 PWMI模式测频率占空比

接线图&#xff1a; PWMI基本结构 代码配置&#xff1a; 与上一章输入捕获代码一样&#xff0c;根据结构体&#xff0c;需要在输入捕获单元再配置一个通道。我们调用一个函数 这个函数可以给结构体赋值&#xff0c;当我们定义了一遍结构体参数&#xff0c;再调用这个函数&…

Fort Firewall:全方位守护网络安全

Fort Firewall是一款专为 Windows 操作系统设计的开源防火墙工具&#xff0c;旨在为用户提供全面的网络安全保护。它基于 Windows 过滤平台&#xff08;WFP&#xff09;&#xff0c;能够与系统无缝集成&#xff0c;确保高效的网络流量管理和安全防护。该软件支持实时监控网络流…

Baklib引领内容管理平台新时代优化创作流程与团队协作

内容概要 在迅速变化的数字化时代&#xff0c;内容管理平台已成为各种行业中不可或缺的工具。通过系统化的管理&#xff0c;用户能够有效地组织、存储和共享信息&#xff0c;从而提升工作效率和创意表达。Baklib作为一款新兴的内容管理平台&#xff0c;以其独特的优势和创新功…

【算法设计与分析】实验2:递归与分治—Hanoi塔、棋盘覆盖、最大子段和

目录 一、实验目的 二、实验环境 三、实验内容 四、核心代码 五、记录与处理 六、思考与总结 七、完整报告和成果文件提取链接 一、实验目的 掌握递归求解问题的思想及对应的程序编码结构。针对不同的问题&#xff0c;能够利用递归进行问题求解&#xff0c;并利用Jav…

mysql_init和mysql_real_connect的形象化认识

解析总结 1. mysql_init 的作用 mysql_init 用于初始化一个 MYSQL 结构体&#xff0c;为后续数据库连接和操作做准备。该结构体存储连接配置及状态信息&#xff0c;是 MySQL C API 的核心句柄。 示例&#xff1a; MYSQL *conn mysql_init(NULL); // 初始化连接句柄2. mysql_…

C语言------数组从入门到精通

1.一维数组 目标:通过思维导图了解学习一维数组的核心知识点: 1.1定义 使用 类型名 数组名[数组长度]; 定义数组。 // 示例&#xff1a; int arr[5]; 1.2一维数组初始化 数组的初始化可以分为静态初始化和动态初始化两种方式。 它们的主要区别在于初始化的时机和内存分配的方…

留学毕业论文如何利用不同问题设计问卷

在留学毕业论文的写作中&#xff0c;我们经常会遇到各种问题&#xff0c;例如选择合适的问题&#xff0c;选择合适的研究方法&#xff0c;以及设计合理的研究过程。然而在完成留学毕业论文的过程中&#xff0c;我们往往会在研究设计这里卡住。即使我们选准了研究问题和研究方法…

范冰冰担任第75届柏林电影节主竞赛单元评委 共鉴电影佳作

近日&#xff0c;备受瞩目的柏林电影节迎来了新一届盛事&#xff0c;而华人演员范冰冰将以主竞赛单元评委身份亮相&#xff0c;引发了广泛关注。此前她已担任过戛纳国际电影节、东京国际电影节、圣塞巴斯蒂安国际电影节等众多电影节主竞赛单元评委。作为国际影坛的知名人物&…

对顾客行为的数据分析:融入2+1链动模式、AI智能名片与S2B2C商城小程序的新视角

摘要&#xff1a;随着互联网技术的飞速发展&#xff0c;企业与顾客之间的交互方式变得日益多样化&#xff0c;移动设备、社交媒体、门店、电子商务网站等交互点应运而生。这些交互点不仅为顾客提供了便捷的服务体验&#xff0c;同时也为企业积累了大量的顾客行为数据。本文旨在…

如何用 Groq API 免费使用 DeepSeek-R1 70B,并通过 Deno 实现国内访问

这几天都被Deepseek刷屏了&#xff0c;而且Deepseek由于异常访问量&#xff0c;这几天都不能愉快的和它玩耍了&#xff0c; 我发现Groq新增了一个Deepseek的70b参数的模型&#xff0c; DeepSeek-R1 70B 作为一款强大的开源模型&#xff0c;提供了卓越的推理能力&#xff0c;而 …

docker配置mysql并使用mysql connector cpp编程

mysql 配置mysql使用docker 这里使用docker安装了&#xff0c;比较简洁&#xff0c;不想使用了直接就可以把容器删掉&#xff0c;首先获取下镜像&#xff0c;如下命令 docker pull container-registry.oracle.com/mysql/community-server这里直接默认使用最新版本的mysql了 …

STM32 TIM输入捕获 测量频率

输入捕获简介&#xff1a; IC&#xff08;Input Capture&#xff09;输入捕获 输入捕获模式下&#xff0c;当通道输入引脚出现指定电平跳变时&#xff0c;当前CNT的值将被锁存到CCR中&#xff0c;可用于测量PWM波形的频率、占空比、脉冲间隔、电平持续时间等参数 每个高级定时器…

【已解决】windows7虚拟机安装VMtools频繁报错

为了在虚拟机VMware中安装win7&#xff0c;题主先在网上下载了windows7 professional版本的镜像&#xff0c;在vmware中安装vmtools时报错&#xff0c;信息如下 &#xff08;安装程序无法继续&#xff0c;本程序需要您将此虚拟机上安装的操作系统更新到SP1&#xff09; 然后就…

7.抽象工厂(Abstract Factory)

抽象工厂与工厂方法极其类似&#xff0c;都是绕开new的&#xff0c;但是有些许不同。 动机 在软件系统中&#xff0c;经常面临着“一系列相互依赖的对象”的创建工作&#xff1b;同时&#xff0c;由于需求的变化&#xff0c;往往存在更多系列对象的创建工作。 假设案例 假设…

电路研究9.2.3——合宙Air780EP中FTP——FTPGET 命令使用方法研究

怎么说呢&#xff0c;之前也是看的&#xff0c;但是也很迷茫&#xff0c;感觉上虽然是对的&#xff0c;但是无法联系到应用里面&#xff0c;今天研究一下FTP 命令使用方法吧。 15.29 使用方法举例 这里发现下面那些看的不懂呢&#xff0c;于是就返回FTP的应用了。 9.5.4 FTP 应…

高精度加法乘法

高精度加法&乘法都是把数字转化成数组进行运算&#xff0c;存储 高精度加法 建议多在纸上画画&#xff0c;梳理思路 代码实现 输入字符串 //初始化数组存储 int a[250]{0}; int b[250]{0}; int c[251]{0}; //定义字符串&#xff0c;输入字符串 string s1,s2; getline(c…

【C++】STL介绍 + string类使用介绍 + 模拟实现string类

目录 前言 一、STL简介 二、string类 1.为什么学习string类 2.标准库中的string类 3.auto和范围for 4.迭代器 5.string类的常用接口说明 三、模拟实现 string类 前言 本文带大家入坑STL&#xff0c;学习第一个容器string。 一、STL简介 在学习C数据结构和算法前&#xff0c;我…

数据结构的队列

一.队列 1.队列&#xff08;Queue&#xff09;的概念就是先进先出。 2.队列的用法&#xff0c;红色框和绿色框为两组&#xff0c;offer为插入元素&#xff0c;poll为删除元素&#xff0c;peek为查看元素红色的也是一样的。 3.LinkedList实现了Deque的接口&#xff0c;Deque又…

【开源免费】基于SpringBoot+Vue.JS体育馆管理系统(JAVA毕业设计)

本文项目编号 T 165 &#xff0c;文末自助获取源码 \color{red}{T165&#xff0c;文末自助获取源码} T165&#xff0c;文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…