优化|数学软件是如何求解线性方程Ax=b ?

在这里插入图片描述

编者按

对于大家来说,我们从学会多项式开始就得和求解矩阵方程打交道。大学之前靠手算,到了大学阶段我们学会了使用科学计算软件,然后只需要输入简单的一行指令 x = A \ b x = A \backslash b x=A\b,就可以轻轻松松求解方程组 A x = b . Ax = b. Ax=b.那么它在优化算法中有什么样的作用呢?实际应用时候又会出现什么样的问题呢?

优化和线性系统求解实例

优化问题和求解线性系统是紧密相关的。对于如下的优化问题,
min ⁡ 1 2 x ⊤ P x + q ⊤ x s . t . G x = c , \begin{align} \begin{aligned} \min & \frac{1}{2}x^\top P x + q^\top x \\ s.t. & Gx = c \end{aligned}, \end{align} mins.t.21xPx+qxGx=c,

的KKT条件就是
[ P G ⊤ G 0 ] [ x y ] = [ − q c ] . \begin{align} \begin{aligned} \begin{bmatrix} P & G^\top\\ G & 0 \end{bmatrix}\begin{bmatrix} x\\ y \end{bmatrix} = \begin{bmatrix} -q \\ c \end{bmatrix}. \end{aligned} \end{align} [PGG0][xy]=[qc].

对于二次规划中常用的算子分裂法[1],[2]和内点法[3],算法的每一个周期其实也是需要求解如下的线性系统
A : = [ P G ⊤ G − D ] [ x y ] = [ r 1 r 2 ] , \begin{align} \begin{aligned} A :=\begin{bmatrix} P & G^\top\\ G & -D \end{bmatrix}\begin{bmatrix} x\\ y \end{bmatrix} = \begin{bmatrix} r_1 \\ r_2 \end{bmatrix}, \end{aligned} \end{align} A:=[PGGD][xy]=[r1r2],

而且求解线性系统往往是算法中最耗时的一部分,决定了一个优化算法的最终收敛速度。

线性系统求解方法

在数学上求解线性系统是很直观的,因为 x = A − 1 b x = A^{-1}b x=A1b,那么我们计算逆矩阵 A − 1 A^{-1} A1然后乘上b似乎就解决了。这主要会带来几方面问题:

(1)求解A矩阵的逆将会很费时;

(2)即使 A A A是稀疏矩阵,它的逆矩阵也往往会丧失稀疏性,需要更多的内存来进行存储;

(3)当矩阵 A A A的条件数很差(ill-conditioned)时,这种方式的求解很可能会带来很大的误差。

求解线性系统 A x = b Ax=b Ax=b一般分为两种方法。一种是直接法,先对矩阵 M M M进行分解(factorization),然后通过分解矩阵进行反向求解(back-solve)。另外一种是迭代法,通过不断的矩阵乘法和加减法得到最后的解。

基于矩阵分解的直接法

针对矩阵 A A A的特殊结构,代码底层会调用不同的矩阵分解方法。Julia的LinearAlgebra模块自动调用方法如下[4]:

我们在这复现一段相关的Julia代码:

using LinearAlgebra
  
n = 10
m = 8
P = rand(n, n)
P = P' * P + 0.1*I
G = sprand(m,n,0.2)
d = rand(m)
d[1:3] .= 1e9
d[6:end] .= 1e-9   
A = [P G'; G -diagm(0=>d)]        #生成矩阵  A = [P G'; G -D] 
A = A + A'
R = factorize(A)         #ldlt分解
typeof(R)                

返回的结果将为

BunchKaufman{Float64, Matrix{Float64}, Vector{Int64}}

可见对于正定对称矩阵,此时factorize()函数自动选择了BunchKaufman LDL分解。此时求解x的值可以调用 R \ b R\backslash b R\b得到,得到的效果和 A \ b A\backslash b A\b是一样的。

另外矩阵的稀疏性也会决定矩阵方法的使用。如果运行如下代码

using SparseArrays

R = factorize(sparse(A))         #ldlt分解
typeof(R)    

此时会采用稀疏形式的LDL分解,并且调用的是不同的SuiteSparse包。

SuiteSparse.CHOLMOD.Factor{Float64}
type:    LDLt
method:  simplicial
maxnnz:  80
nnz:     80
success: true

感兴趣的同学也可以参考matlab文档 (Algorithms部分)了解分解方法选取的逻辑图,https://uk.mathworks.com/help/matlab/ref/mldivide.html#bt4jslc-6。

现在最常用的求解线性系统的包应该还是LAPACK(配合BLAS进行矩阵乘法运算),但是LAPACK本身是用Fortran语言写的。所幸的是,LAPACK现在基本都有在不同语言下的接口。感兴趣的同学可以参考不同语言下相关的调用方式

•Python: https://docs.scipy.org/doc/scipy/reference/linalg.lapack.html

•Julia:https://docs.julialang.org/en/v1/stdlib/LinearAlgebra/#LinearAlgebra.LAPACK

直接法的优势是数值性能很稳定,然后一个矩阵一旦完成分解后,可以重复高效的利用矩阵分解进行计算,如SCS[1],OSQP[2]的底层算法。

基于迭代的间接法

间接法是另外一大类常用的矩阵求解算法。跟基于矩阵分解的直接法一样,也有很多基于矩阵 A A A的结构对应设计的间接求解线性系统的方法,下图截取自Julia的IterativeSolvers.jl的包:

稀疏性

在实际使用中,我们也需要考虑矩阵的稀疏性,如果矩阵本来是稀疏的,但是没有设置成稀疏类型,程序底层也会自动选取非稀疏形式的矩阵分解。当运行如下代码时:

 using LinearAlgebra, SparseArrays
 using BenchmarkTools        #记录时间的包
 
 A = Symmetric(sprandn(1000,1000,0.01))        #1000 x 1000 矩阵,稀疏性为0.1~0.2
 A = A + 0.1*I        #避免不满秩
 Ad = Matrix(A)
 @assert issymmtric(Ad)     #确保矩阵是对称的
 
 typeof(A)                  # Symmetric{Float64, SparseMatrixCSC{Float64, Int64}}
 
 @btime factorize(A)        #  28.833 ms (74 allocations: 6.58 MiB)
                            # SuiteSparse.CHOLMOD.Factor{Float64}
                            # type:    LDLt
                            # method:  simplicial
                            # maxnnz:  191629
                            # nnz:     140279
                            # success: true
 
 typeof(Ad)                  # Matrix{Float64}
 
 @btime factorize(Ad)        # 60.418 ms (8 allocations: 15.76 MiB)
                             # BunchKaufman{Float64, Matrix{Float64}, Vector{Int64}}

可以看到上述代码中,当使用稀疏矩阵 A A A时,矩阵分解时间约为28.833ms,但是如果使用非稀疏矩阵类型, A d A_d Ad的矩阵分解时间就变成了60.418ms。

**具体选取稀疏矩阵类型还是非稀疏类型取决于实际矩阵 A A A的稀疏性。**如果我们将上述代码矩阵稀疏性提高10倍,则有如下结果:

A = Symmetric(sprandn(1000,1000,0.1))        # A的稀疏性变成之前的10倍
 A = A + 0.1*I        #避免不满秩
 Ad = Matrix(A)
 @assert issymmtric(Ad)     #确保矩阵是对称的
 
 @btime factorize(A)        #   161.359 ms (74 allocations: 25.00 MiB)
                            # SuiteSparse.CHOLMOD.Factor{Float64}
                            # type:    LDLt
                            # method:  simplicial
                            # maxnnz:  473377
                            # nnz:     431513
                            # success: true
 
 @btime factorize(Ad)        # 62.464 ms (8 allocations: 15.76 MiB)
                             # BunchKaufman{Float64, Matrix{Float64}, Vector{Int64}}

可以看到,非稀疏矩阵分解时间几乎不变,而稀疏矩阵分解的时间反而远大于非稀疏矩阵分解的时间。

优化问题中如何求解系统(3)

这时候,如果我们回过头去看(3)中的矩阵 A A A,它本身是quasi-definite的,并且大部分实际问题下都是稀疏的,这样就非常适合使用LDL分解法[5]。许多求解器的底层都是默认使用这个矩阵分解方法。

数值实验

最后,我们对于公式(3)中定义的矩阵进行了数值实验(Julia源码),为了能有更直观的对比效果,我们人为的生成了一个条件数很差的矩阵 A A A

using LinearAlgebra, SparseArrays

n = 10
m = 8
P = rand(n, n)
P = P' * P
V, D = eigen(P)
D[1:5] .= 1e-6
D[6:end] .= 1e6
P = V * D * V'
G = sprand(m,n,0.2)
d = rand(m)
d[1:3] .= 1e9
d[6:end] .= 1e-9   
A = [P G'; G -diagm(0=>d)]        #生成矩阵  A = [P G'; G -D] 
A = A + A'
cond(A)                        # 返回条件数(Condition Number)= 1.0000000013286812e18

#ldlt分解
F = ldlt(sparse(A))
invA = inv(A)
x = zeros(m+n)
x[10] = 1e-5
x[15] = 1e5
b = A*x
x1 = invA*b
x2 = F\b

#Ax=b系统误差
res1 = norm(A*x1-b,Inf)        # res1 = 4.304065664004539e-7 
res2 = norm(A*x2-b,Inf)        # res2 = 2.9103830456733704e-11
nnz(sparse(A))                 #A中的非零项有136个
nnz(sparse(invA))              ##invA中的非零项有290个 (很接近18x18=324)

实验结果表明,当 A A A条件数很大时(例如 > 1 e 18 >1e^{18} >1e18),通过直接的逆求解得到的误差将会比用矩阵分解法得到的大很多,并且 A − 1 A^{-1} A1矩阵中非零项接近于矩阵的维度本身,丧失了 A A A潜在的稀疏性。

对于同样的问题,我们再利用迭代法GMRES求解同样的方程:

using IterativeSolvers

x3 = gmres(A,b)
res3 = norm(A*x3-b,Inf)        # res3 = 9.188644068589468e-5

可以发现对于条件数很差的矩阵,如果不做任何处理,那么迭代法最终求解的精度将很差。改善迭代法收敛精度可以通过从一个很好的初始值进行迭代来进行改善:

x4 = deepcopy(x1)        #拷贝已知的x1 = A^{-1}b的值作为迭代法初始值,此时误差为4.304065664004539e-7 
gmres!(x4,A,b)
res4 = norm(A*x4-b,Inf)        # res4 = 8.273806188044642e-14    

可以看到,如果迭代法具有很好的初始值,那么收敛精度也是可以很高的!

另外一种改善迭代法精度的方法是采用preconditioning方法改善 A A A矩阵的条件数,使得迭代法能有更好的收敛结果,在这儿就不做详细论述了。此外,对于不同矩阵结构迭代法的选取(以及preconditioning),感兴趣的同学可以参考matlab文档https://uk.mathworks.com/help/matlab/math/iterative-methods-for-linear-systems.html。

两种方法的优缺点

那这两种方法各有什么优缺点呢?看看ChatGPT给出的回答:

下面是每种方法的优缺点:

直接法:
优点:
•可以保证唯一解(如果存在)
•对于小到中等规模的线性方程组可以非常高效
•通常只需要固定数量的运算就可以计算出解​
缺点:​
•对于大型线性方程组来说,可能会非常计算密集,特别是对于稠密矩阵来说​
•舍入误差可能会累积,影响解的精度​
•对于病态矩阵来说,无法处理得很好​

间接法:​
优点:​
•可以高效地处理大型和稀疏的线性方程组​
•如果矩阵病态或奇异,可能比直接法更精确​
•可以轻松地并行化以利用多个处理器​
缺点:​
•可能需要更多的迭代才能收敛,这可能会非常计算密集​
•对于某些矩阵或初始猜测,可能无法收敛​
•收敛速度可能取决于矩阵的特性,对于某些矩阵可能会很慢​

总的来说,选择直接法还是间接法取决于线性系统的特性、问题的规模以及所需的精度级别。在实践中,可以结合使用直接法和间接法来高效而精确地求解线性方程组。

嗯…的确是这么回事。

PS: 一般来说只要不是超大规模矩阵,大家平时采用基于矩阵分解的直接法就足够了。

[1] O’Donoghue, B., Chu, E., Parikh, N., Boyd, S.: Conic optimization via operator splitting and homogeneous self-dual embedding. J. Optim. Theory Appl. 169(3), 1042–1068 (2016)
[2] B. Stellato, G. Banjac, P. Goulart, A. Bemporad, and S. Boyd, “OSQP: an operator splitting solver for
quadratic programs,” Mathematical Programming Computation, vol. 12, no. 4, pp. 637–672, 2020.
[3] S. J. Wright, Primal-Dual Interior-Point Methods. Society for Industrial and Applied Mathematics, 1997.
[4] https://docs.julialang.org/en/v1/stdlib/LinearAlgebra/#man-linalg-factorizations
[5] Vanderbei, R.: Symmetric quasi-definite matrices. SIAM J. Optim. 5(1), 100–113 (1995)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/24751.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

移动端开发

1. 视口 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevice-width, in…

MySQL---SQL优化上(explain分析执行计划、查看SQL的执行效率、定位低效率SQL)

1. 查看SQL的执行效率 MySQL 客户端连接成功后&#xff0c;通过 show [session|global] status 命令可以查看服务器状态信息。通 过查看状态信息可以查看对当前数据库的主要操作类型。 --下面的命令显示了当前 session 中所有统计参数的值 show session status like Com____…

oracle表空间、用户、表的关系和创建

目录 一、表空间 二、用户 &#xff08;1&#xff09;Oracle和mysql、sqlserver的区别 &#xff08;2&#xff09;创建用户 &#xff08;3&#xff09;给用户授权 三、表 &#xff08;1&#xff09;创建表 &#xff08;2&#xff09;用图像化软件添加表约束 1.主键约束…

【java】leetcode 二叉树展开为链表

二叉树展开为链表 leetcode114 .二叉树展开为链表解题思路二叉树专题&#xff1a; leetcode114 .二叉树展开为链表 114 leetcode 链接。可以打开测试 给你二叉树的根结点 root &#xff0c;请你将它展开为一个单链表&#xff1a; 展开后的单链表应该同样使用 TreeNode &#x…

茶润童心 以茶明礼

中国是茶的故乡&#xff0c;也是茶文化的发源地&#xff0c;茶文化也是中国文化的一部分。5月27日下午&#xff0c;8位武汉公益小天使来到中茶恩施硒茶全国运营中心开展少儿茶艺活动。 开场的自我介绍&#xff0c;公益小天使逐个进行自我介绍&#xff0c;喊着“好名字”互相加…

HMM实现中文分词

引言 在隐马尔可夫模型中介绍了HMM的理论部分&#xff0c;为了巩固理论知识&#xff0c;本文基于HMM实现中文分词。具体来说&#xff0c;通过HMM实现基于字级别的分词算法。 HMM 这里简单说明一下&#xff0c;更详细的请参考隐马尔可夫模型。 这里输入序列为 X 1 : N X_{1:N…

基于springboot注解的shiro 授权及角色认证

目录 授权 后端接口服务注解 授权验证-没有角色无法访问 授权验证-获取角色进行验证 授权验证-获取权限进行验证 授权验证-异常处理 授权 用户登录后&#xff0c;需要验证是否具有指定角色指定权限。Shiro也提供了方便的工具进行判 断。 这个工具就是Realm的doGetAuthor…

1.矢量引入

目录 一.什么是矢量 1.1 定义 1.2 公理与体系 1.3 矢量几何化 二.矢量间的相互作用 1.点积 2.点积应用 3.叉积 4. 叉积应用 三.矢量除法 1.单用叉积无法唯一定义矢量除法 2.矢量除法 四.复杂相互作用 1.混合积 2.双叉积 3.Laplace公式 五.泛函的广义矢量理论…

hive任务reduce步骤卡在99%原因及解决

我们在写sql的时候经常发现读取数据不多&#xff0c;但是代码运行时间异常长的情况&#xff0c;这通常是发生了数据倾斜现象。数据倾斜现象本质上是因为数据中的key分布不均匀&#xff0c;大量的数据集中到了一台或者几台机器上计算&#xff0c;这些数据的计算速度远远低于平均…

NVM-Nodejs多版本管理工具

NVM:&#x1f50e;:下载点我 下载含有 setup.exe的 下载完成之后修改一下settings.txt 文件&#xff0c;在原有的基础上直接加入这些配置 root: D:\nvm path: D:\nvm\nodejs node_mirror: https://npm.taobao.org/mirrors/node/ npm_mirror: https://npm.taobao.org/mirrors…

旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

前言 嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 “旅”是旅行&#xff0c;外出&#xff0c;即为了实现某一目的而在空间上从甲地到乙地的行进过程&#xff1b; “游”是外出游览、观光、娱乐&#xff0c;即为达到这些目的所作的旅行。 二者合起来即旅游。所以&#…

JavaScript 基础 DOM (四)

正则表达式正则表达式 正则基本使用 定义规则 const reg /表达式/其中/ /是正则表达式字面量正则表达式也是对象 使用正则 test()方法 用来查看正则表达式与指定的字符串是否匹配 如果正则表达式与指定的字符串匹配 &#xff0c;返回true&#xff0c;否则false reg.test(…

【算法】【算法杂谈】旋转数组的二分法查找

目录 前言问题介绍解决方案代码编写java语言版本c语言版本c语言版本 思考感悟写在最后 前言 当前所有算法都使用测试用例运行过&#xff0c;但是不保证100%的测试用例&#xff0c;如果存在问题务必联系批评指正~ 在此感谢左大神让我对算法有了新的感悟认识&#xff01; 问题介…

1722_PolySpace Bug Finder的几种启动方式

全部学习汇总&#xff1a; GreyZhang/g_matlab: MATLAB once used to be my daily tool. After many years when I go back and read my old learning notes I felt maybe I still need it in the future. So, start this repo to keep some of my old learning notes servral …

pinia

一、pinia是什么&#xff1f; &#x1f69c;&#x1f69c;&#x1f69c;Pinia是最接近西班牙语中的菠萝的词&#xff1b;背景&#xff1a;大概2019年&#xff0c;是作为一个实验为Vue重新设计状态管理&#xff0c;让它用起来像组合式API。从那时到现在&#xff0c;最初的设计原…

Vulkan Tutorial 5 顶点缓冲区

目录 16 顶点缓冲区 顶点着色器 顶点数据 管道顶点输入 17 顶点缓冲区创建 缓冲区创建 内存要求 内存分配 填充顶点缓冲区 18 暂存缓冲区 传输队列 使用暂存缓冲区 19 索引缓冲区 索引缓冲区创建 使用索引缓冲区 16 顶点缓冲区 我们将用内存中的顶点缓冲区替换…

5。STM32裸机开发(4)

嵌入式软件开发学习过程记录&#xff0c;本部分结合本人的学习经验撰写&#xff0c;系统描述各类基础例程的程序撰写逻辑。构建裸机开发的思维&#xff0c;为RTOS做铺垫&#xff08;本部分基于库函数版实现&#xff09;&#xff0c;如有不足之处&#xff0c;敬请批评指正。 &…

拥抱 Spring 全新 OAuth 解决方案

以下全文 Spring Authorization Server 简称为: SAS 背景 Spring 团队正式宣布 Spring Security OAuth 停止维护&#xff0c;该项目将不会再进行任何的迭代 目前 Spring 生态中的 OAuth2 授权服务器是 Spring Authorization Server 已经可以正式生产使用 作为 SpringBoot 3.0…

FastThreadLocal 原理解析

FastThreadLocal 每个 FastThread 包含一个 FastThreadLocalMap&#xff0c;每个 FastThreadLocalThread 中的多个 FastThreadLocal 占用不同的索引。每个 InternalThreadLocalMap 的第一个元素保存了所有的 ThreadLocal 对象。之后的元素保存了每个 ThreadLocal 对应的 value …

SpringBoot 之 Tomcat 与 Undertow 容器性能对比

一、前言&#x1f525; 环境说明&#xff1a;Windows10 Idea2021.3.2 Jdk1.8 SpringBoot 2.3.1.RELEASE 在上一篇《SpringBoot 之配置 Undertow 容器》一文中写道&#xff1a;“Undertow 的性能和内存使用方面都要优于 Tomcat 容器”, 这一期&#xff0c;我就要给大家来求证…