求解大规模数学优化问题
规划也称为优化
四要素:数据、变量、目标、约束
将一个简单的数学规划问题项gpt进行提问,GPT给了一个近似解,但不是确切的解。
大模型的训练本身就是一个优化问题。
大模型是如何训练的?大模型训练通常使用Adam优化器。Adam优化器在大模型训练中占据了主导地位,因为它能够有效地处理大规模数据集和复杂的模型结构,同时减少梯度消失或梯度爆炸的问题
国家电网用的是国外的求解器
华为原来用的IBM求解器,用于排产,但是2019年起,不让用了,所以找到了杉树科技去做求解器
上述中为国内外的优化算法求解器,国内的第一家为COPT
上述的1:指的是问题平均求解的时间为1秒
考虑如何将优化和GPU相结合,优化一般需要高性能和高准确性
上述为欧洲的物流问题,在不同时间解的时间
半定规划,量子计算、物理计算上很有用
肝移植配对用的是线性规划
智能计算与大模型求解:理论与实践
上述为CPU与GPU的区别
CPU:中央处理单元,设计用于处理各种类型的计算任务,包括复杂的逻辑和算术运算。通常用于执行程序的流程控制和数据处理,CPU通常包含少量的核心(通常4-32个),每个核心能够处理复杂的任务和多任务操作。
GPU:图形处理单元,最初设计用于处理图像和视觉渲染任务,但随着技术的发展,GPU也被广泛用于并行计算任务,特别是在深度学习和大规模数据处理领域。GPU包含成千上万个小核心,这些核心专门用于并行处理大量相对简单的计算任务。这种设计是的GPU在处理大规模big你小姑娘任务时比CPU更高效。
CUDSS:库函数,实现矩阵分解,但是性能不是很好,性能不稳定,分解的结果很随机,无法实现多卡并联
GPU无法实现矩阵求逆
CPU——CPU+GPU混合架构
CPU与GPU共享一个显存(在研究中)
都是在英伟达芯片上实现的
最大的问题,CUDA生态,库函数件
80%的是整数规划
现在,用GPT4或者4o去做,稍微麻烦的问题,还是无法解
ORLM:可以私有化部署,任何基座,可以用LLM,可以用合成数据,让大模型建模,COPT求解
比GPT4有明显优势