机器学习实战26-一种基于LightGBM的股市涨跌预测系统与代码实现过程

大家好,我是微学AI,今天给大家介绍一下机器学习实战26-一种基于LightGBM的股市涨跌预测系统与代码实现过程。文章首先阐述了项目背景,随后详细解释了LightGBM模型的原理及其在股市预测中的应用。通过选取具有代表性的样例股票数据集,对模型进行了训练与验证。最后,对模型的预测性能进行了评估,证明了LightGBM在股市涨跌预测中的有效性和可行性。该系统为投资者提供了一种科学、可靠的股市预测工具,具有一定的实用价值。
在这里插入图片描述

文章目录

  • 一、项目背景介绍
    • 1.1 当前股市分析的需求与挑战
      • 1.1.1 信息过载与噪音干扰
      • 1.1.2 非线性关系与复杂性
      • 1.1.3 实时性要求
    • 1.2 传统股市预测方法的不足
      • 1.2.1 技术分析局限性
      • 1.2.2 基本面分析的滞后性
      • 1.2.3 经典统计模型的瓶颈
      • 1.2.4 机器学习应用的挑战
    • 1.3 LightGBM模型的引入背景
  • 二、LightGBM 模型原理阐述
    • 2.1 GBDT 与 LightGBM:一场效率与精度的革命
    • 2.2 与传统 GBDT 的比较:从“根”到“叶”的优化
      • 2.2.1 直接支持高效数据结构
      • 2.2.2 特征并行与数据并行的双重加速
      • 2.2.3 精准的梯度与增益计算
    • 2.3 独特算法特点:深度解析
      • 2.3.1 自适应增强学习策略
      • 2.3.2 多目标优化
      • 2.3.3 交叉验证与早停策略
      • 2.3.4 LightGBM 数学原理
        • 梯度提升决策树 (GBDT) 原理
        • LightGBM 的改进
        • 目标函数公式
  • 三、样例股票数据集分析
    • 3.1 数据集来源与特点
      • 3.1.1 数据集来源
      • 3.1.2 数据集特点
    • 3.2 数据预处理
      • 3.2.1 数据清洗
      • 3.2.2 特征工程
      • 3.2.3 数据标准化与归一化
      • 3.2.4 时序切片与滑动窗口
    • 3.3 小结
  • 四、模型构建与训练
    • 4.1 参数配置与优化策略
      • 4.1.1 基础参数设定
      • 4.1.2 树相关参数调整
      • 4.1.3 学习率与正则化
    • 4.2 数据集划分与交叉验证
    • 4.3 训练流程与监控
      • 4.3.1 训练过程
      • 4.3.2 监控与早停
    • 4.4 特征重要性分析
    • 4.5 调参策略与自动化工具
  • 五、模型评估
    • 5.1 评估指标选择
      • 5.1.1 准确率与召回率
      • 5.1.2 ROC曲线与AUC值
      • 5.1.3 准确率得分(Precision Score)
    • 5.2 评估方法
      • 5.2.1 交叉验证
      • 5.2.2 时间序列交叉验证
    • 5.3 模型性能分析
      • 5.3.1 性能指标汇总与解读
      • 5.3.2 特征重要性分析
      • 5.3.3 错误案例分析
      • 5.3.4 过拟合与欠拟合检测
    • 结语

一、项目背景介绍

1.1 当前股市分析的需求与挑战

在全球经济一体化的背景下,股市作为经济活动的晴雨表,其波动与预测对于投资者、金融机构乃至国家政策制定者而言至关重要。随着金融市场的日益复杂化与信息量的爆炸式增长,股市分析不再仅限于基本面和技术面的传统研究,而是迫切需要更加精准、高效及智能化的方法来捕捉市场动态,以辅助决策制定。

1.1.1 信息过载与噪音干扰

现代金融市场中,每日产生的交易数据、新闻资讯、社交媒体情绪等海量信息,给投资者带来了巨大的信息筛选和解读挑战。如何从这些庞杂的数据中快速提取有价值的信息,过滤掉噪声,成为了提高预测准确性的关键。

1.1.2 非线性关系与复杂性

股市行为不仅受到宏观经济、公司业绩等直接影响,还深受投资者心理预期、政策变动等多种因素的非线性影响。这种高度复杂的相互作用使得传统线性模型难以准确捕捉市场动态,需要更高级的算法来处理高维度特征空间中的非线性关系。

1.1.3 实时性要求

金融市场瞬息万变,及时响应市场变化对于投资决策尤为关键。传统的手工分析方法往往滞后,无法满足实时预测的需求,而这也正是机器学习和人工智能技术大显身手的领域。

1.2 传统股市预测方法的不足

1.2.1 技术分析局限性

技术分析依赖历史价格和成交量数据,通过图表模式识别预测未来趋势,但这种方法往往忽视了影响股市的众多外部因素,且在高度随机的市场环境中预测准确性有限。

1.2.2 基本面分析的滞后性

基本面分析侧重于公司的财务状况、行业地位等长期价值因素,虽能提供投资的底层逻辑,但面对突发事件或市场短期情绪波动时显得反应迟缓,难以即时调整策略。

1.2.3 经典统计模型的瓶颈

如线性回归、ARIMA等经典统计模型在处理股市时间序列数据时,往往难以有效处理高维度特征、非线性关系及异方差性等问题,导致预测精度受限。

1.2.4 机器学习应用的挑战

早期的机器学习模型,如支持向量机(SVM)、随机森林(RF)等,在一定程度上改善了预测效果,但仍面临计算效率低、处理大规模数据集能力有限的问题,特别是在高维度特征空间上的优化问题。

1.3 LightGBM模型的引入背景

鉴于上述挑战,寻找一种既能高效处理大数据量,又能精确捕捉非线性关系,并具有高解释性和预测精度的模型成为当务之急。LightGBM(Light Gradient Boosting Machine)应运而生,它是由微软亚洲研究院开发的一种梯度提升决策树算法。相较于传统的GBDT(Gradient Boosting Decision Tree),LightGBM在算法设计上进行了多项创新,显著提高了训练速度,降低了内存消耗,同时保持了预测性能,成为处理大规模数据集和复杂预测任务的理想选择。特别是在股市预测领域,其高效的特征处理能力和对非线性关系的良好拟合能力,为克服传统方法的不足提供了新的途径。基于LightGBM的股市涨跌预测系统,旨在通过先进技术手段,应对股市分析的复杂挑战,为投资者提供更为科学、高效的投资决策支持工具。

二、LightGBM 模型原理阐述

2.1 GBDT 与 LightGBM:一场效率与精度的革命

在机器学习领域,梯度提升决策树(Gradient Boosting Decision Tree, GBDT)作为一种集成学习方法,因其强大的预测能力和解释性而广受青睐。然而,随着数据规模的日益增长,GBDT 在训练速度和内存消耗方面的问题逐渐凸显。在此背景下,LightGBM 应运而生,它在保持 GBDT 高预测准确性的基础上,通过一系列创新算法显著提升了训练效率并降低了资源消耗。

2.2 与传统 GBDT 的比较:从“根”到“叶”的优化

2.2.1 直接支持高效数据结构

传统的 GBDT 在训练过程中,每棵树都需要遍历所有数据以确定最佳分裂点,这在大数据场景下极为耗时。相比之下,LightGBM 引入了基于 Leaf-wise(叶优先)的生长策略,直接在数据分布上寻找最佳分割点,而非传统的 Level-wise(层优先),大幅减少了不必要的计算量。此外,它还使用了稀疏优化技术,对于特征稀疏的数据集,能够跳过非零值较少的特征,进一步加速训练过程。

2.2.2 特征并行与数据并行的双重加速

为了解决大规模数据处理难题,LightGBM 实现了高效的并行策略。一方面,它采用了特征并行的方法,将特征分配到不同的工作节点上并行地计算最佳分裂点,大大缩短了特征选择的时间;另一方面,数据并行策略通过划分数据集到不同节点上并行训练多个子模型,最后合并模型结果,显著提高了数据处理能力。

2.2.3 精准的梯度与增益计算

在梯度计算上,LightGBM 采用了更精确的二阶泰勒展开近似,相较于一阶近似,这能更准确地反映损失函数的变化趋势,从而在每一步迭代中找到更好的分裂方向。同时,它还实现了基于直方图的算法来近似计算信息增益,避免了直接计算大量数据点的复杂度,既保持了准确性又显著提升了效率。

2.3 独特算法特点:深度解析

2.3.1 自适应增强学习策略

不同于传统 GBDT 固定的学习率,LightGBM 引入了自适应学习率调整机制。在训练过程中,它会根据当前模型的表现动态调整学习率,这样不仅加快了收敛速度,也增强了模型的泛化能力。

2.3.2 多目标优化

除了常见的回归和分类任务,LightGBM 还支持多目标优化。用户可以同时优化多个目标函数,比如同时考虑预测误差和模型复杂度,使得模型在提高精度的同时保持简洁,这对于资源有限的环境尤为重要。

2.3.3 交叉验证与早停策略

为了防止过拟合,LightGBM 提供了内置的交叉验证功能,可以在训练过程中自动评估模型性能并适时停止,避免了不必要的迭代,进一步节省了时间和计算资源。

2.3.4 LightGBM 数学原理

梯度提升决策树 (GBDT) 原理

梯度提升决策树通过最小化损失函数来构建一系列决策树。假设我们有一个损失函数 L ( y i , y ^ i ) L(y_i, \hat{y}_i) L(yi,y^i),其中 y i y_i yi 是真实值, y ^ i \hat{y}_i y^i 是预测值。在第 t t t 轮迭代中,我们希望最小化以下目标函数:

L ( t ) = ∑ i = 1 n L ( y i , y ^ i ( t − 1 ) + f t ( x i ) ) + Ω ( f t ) \mathcal{L}^{(t)} = \sum_{i=1}^n L(y_i, \hat{y}_i^{(t-1)} + f_t(x_i)) + \Omega(f_t) L(t)=i=1nL(yi,y^i(t1)+ft(xi))+Ω(ft)

这里, f t ( x i ) f_t(x_i) ft(xi) 是第 t t t 棵树对样本 x i x_i xi 的预测值, Ω ( f t ) \Omega(f_t) Ω(ft) 是正则项,用于控制模型复杂度。

LightGBM 的改进

LightGBM 通过以下方式改进了 GBDT:

  1. 直方图的并行构建:

    • 使用基于直方图的梯度统计方法,减少数据处理时间。
  2. GoSS (Gradient-based One-Side Sampling):

    • 仅采样一部分梯度较大的数据点来构建决策树,忽略梯度较小的数据点以加速训练过程。
  3. EFB (Exclusive Feature Bundling):

    • 将特征捆绑以减少分裂点的枚举次数,从而加快训练速度。
目标函数公式

对于一个给定的树结构 T T T 和叶子权重向量 w w w,LightGBM 的目标函数为:

L ( t ) = ∑ i = 1 n L ( y i , y ^ i ( t − 1 ) + f t ( x i ) ) + γ T + 1 2 λ ∑ j = 1 T w j 2 \mathcal{L}^{(t)} = \sum_{i=1}^n L(y_i, \hat{y}_i^{(t-1)} + f_t(x_i)) + \gamma T + \frac{1}{2}\lambda \sum_{j=1}^T w_j^2 L(t)=i=1nL(yi,y^i(t1)+ft(xi))+γT+21λj=1Twj2

  • 其中, T T T 表示树的叶子节点数。
  • γ \gamma γ λ \lambda λ 分别是正则化参数,用于惩罚树的复杂度和叶子权重的大小。
  • w j w_j wj 是第 j j j 个叶子节点上的权重值。

通过这些改进,LightGBM 在保持高准确性的前提下大大提升了训练效率。

三、样例股票数据集分析

在构建基于 LightGBM 的股市涨跌预测系统之前,对所采用的数据集进行深入分析是至关重要的一步。本节将详细介绍样例股票数据集的来源、特点,并探讨如何进行有效的数据预处理,以确保模型训练的质量与准确性。

3.1 数据集来源与特点

3.1.1 数据集来源

样例股票数据集通常来源于公开的金融数据库或交易平台API,如Yahoo Finance、Quandl、Google Finance等。这些平台提供了丰富的历史股价信息,包括但不限于开盘价、收盘价、最高价、最低价及成交量等。为了构建一个全面且具有代表性的预测模型,我们选取了涵盖不同行业、市值范围广泛的企业股票数据,时间跨度通常设定为几年至几十年,以便捕捉市场长期趋势和短期波动。

3.1.2 数据集特点

  1. 时间序列性:股票价格随时间变化呈现出强烈的时间序列特征,即当前价格受过去价格影响较大。
  2. 波动性:股票市场存在高度不确定性,价格波动频繁且幅度不定。
  3. 多重因素影响:股票价格受到宏观经济指标、公司财务状况、政策变动、市场情绪等多种因素的影响。
  4. 非线性关系:影响股票价格的因素间可能存在复杂的非线性关系。
  5. 季节性和周期性:某些行业或特定时期内(如财报发布季)存在明显的季节性或周期性模式。

3.2 数据预处理

3.2.1 数据清洗

数据清洗是数据预处理的第一步,旨在去除或修正数据集中存在的错误、不完整、不准确或无关的信息。针对股票数据,常见的清洗步骤包括:

  • 缺失值处理:检查并处理时间序列中的空缺值,可采用前向填充、后向填充、插值等方法。
  • 异常值检测与处理:识别并处理由于记录错误或其他原因导致的极端数值,常用方法有Z-score、IQR等。
  • 重复数据剔除:确保每个时间点的数据唯一性。

3.2.2 特征工程

特征工程是提高模型预测能力的关键。对于股票数据集,常见的特征构建包括:

  • 技术指标:如移动平均线、相对强弱指数(RSI)、布林带等,用于捕获价格趋势和波动性。
  • 基本面指标:包括市盈率、市净率、股息率等,反映公司财务状况。
  • 宏观经济指标:如GDP增长率、失业率等,宏观环境对股市有显著影响。
  • 时间特征:如日期(星期几、月份)、节假日标记,捕捉时间序列的周期性。
  • 滞后特征:考虑过去若干期的价格和成交量作为输入,利用历史信息预测未来。

3.2.3 数据标准化与归一化

为了消除不同特征之间量级差异对模型学习的影响,通常需要对数据进行标准化(如z-score标准化)或归一化(如最小-最大缩放)。这一步骤可以提升模型训练的效率和稳定性。

3.2.4 时序切片与滑动窗口

鉴于股市预测的时序特性,常使用滑动窗口方法对数据进行切片,以生成训练和测试样本。例如,以过去30天的数据预测第31天的涨跌情况,通过不断滑动窗口来获取足够多的样本进行模型训练。

3.3 小结

样例股票数据集的选择与预处理是构建有效预测模型的基础。通过对数据集来源的精心挑选、深刻理解其特点,并实施一系列数据清洗、特征工程、标准化及时序处理策略,我们可以获得高质量的训练数据,为后续使用LightGBM模型进行高效学习和准确预测打下坚实基础。在接下来的“模型构建与训练”部分中,我们将深入探讨如何利用这些经过预处理的数据集,结合LightGBM的算法优势,实现股市涨跌的有效预测。

四、模型构建与训练

在完成了对LightGBM模型原理的理解以及股票数据集的细致分析之后,我们步入了实践的核心阶段:利用LightGBM模型对股票数据进行模型构建与训练。本部分将详述如何设置参数、执行训练流程,并确保模型能够高效、准确地学习到股票数据中的复杂模式。

4.1 参数配置与优化策略

4.1.1 基础参数设定

使用LightGBM进行模型构建前,合理配置参数是关键。基础参数如boosting_typeobjectivemetric对模型表现至关重要。对于股票涨跌预测,通常选择boosting_type='gbdt'以利用梯度提升决策树的优势,objective='binary'作为二分类问题(涨或跌),并设置metric='binary_logloss''auc'作为评估指标,衡量预测准确性。

4.1.2 树相关参数调整

为了提高模型的预测精度,需要细致调整与树结构相关的参数。num_leaves控制每棵树的最大叶子节点数,较大的值可增加模型复杂度但可能引发过拟合,推荐初始设置为31并根据交叉验证结果调整。max_depth通常不需直接设置,由num_leaves间接控制。此外,min_child_samples用于防止过拟合,推荐设置为20至100,具体数值依据数据量和噪声水平确定。

4.1.3 学习率与正则化

学习率(learning_rate)是每次迭代更新权重的比例,较小的学习率有助于模型收敛,但需更多迭代次数。建议从0.1开始尝试,根据训练效果逐步减小。正则化参数如lambda_l1lambda_l2帮助控制模型复杂度,避免过拟合,初设可考虑lambda_l1=1e-5lambda_l2=1e-5,依据验证结果调整。

4.2 数据集划分与交叉验证

在训练前,应将样例股票数据集划分为训练集、验证集和测试集,比例一般为7:2:1。采用交叉验证(如5折交叉验证)来评估模型性能,通过平均每次验证的评价指标来获得更稳定的性能估计。这不仅有助于发现并优化过拟合问题,还能更准确地评估模型泛化能力。

4.3 训练流程与监控

4.3.1 训练过程

利用Python的lightgbm库,通过以下代码片段启动模型训练:

import lightgbm as lgb
from sklearn.model_selection import train_test_split

# 数据预处理后
X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size=0.3, random_state=42)

# 初始化模型
params = {
    'boosting_type': 'gbdt',
    'objective': 'binary',
    'metric': 'binary_logloss',
    'num_leaves': 31,
    'learning_rate': 0.1,
    'lambda_l1': 1e-5,
    'lambda_l2': 1e-5,
    'min_child_samples': 20,
    # 其他参数...
}

train_data = lgb.Dataset(X_train, label=y_train)
valid_data = lgb.Dataset(X_test, label=y_test, reference=train_data)

model = lgb.train(params, train_data, num_boost_round=1000, valid_sets=[valid_data], early_stopping_rounds=50, verbose_eval=10)

4.3.2 监控与早停

引入early_stopping_rounds机制可以在验证集上的评估指标不再提升后自动停止训练,避免不必要的迭代。同时,通过verbose_eval定期输出训练日志,监控学习进度与性能变化。

4.4 特征重要性分析

训练完成后,利用LightGBM的特征重要性功能分析哪些特征对模型预测最为关键。这不仅有助于理解模型内部逻辑,还能指导未来数据采集和特征工程的优化。通过model.feature_importance()即可获取各特征的重要性评分,并可进一步可视化展示。

4.5 调参策略与自动化工具

手动调整参数是一项耗时且技术要求高的工作。为加速这一过程,可利用自动化调参工具如Grid Search、Random Search或更先进的Bayesian Optimization。这些方法能系统地探索参数空间,寻找最优参数组合,显著提升模型性能。

构建与训练基于LightGBM的股票预测模型是一个包含参数调整、数据分割、模型训练、性能监控与特征重要性分析的系统过程。通过精细化管理这些步骤,可以确保模型既具备高度的预测准确性,又能在实际应用中展现出良好的泛化能力。随着不断优化与迭代,模型将成为股市分析中不可或缺的有力工具。

五、模型评估

在完成LightGBM模型的构建与训练之后,至关重要的一步是对模型的性能进行评估。这不仅有助于理解模型预测股市涨跌的能力,还能指导我们进行模型的优化和调整。本部分将详述模型评估的指标、方法及性能分析过程,确保模型的有效性和可靠性。

5.1 评估指标选择

5.1.1 准确率与召回率

准确率(Accuracy)衡量的是模型正确分类的比例,但在股市预测中,由于涨跌样本可能不均衡,准确率可能不是最合适的指标。召回率(Recall)则关注于正类样本被正确识别的比例,对于避免遗漏重要涨跌信息有一定意义。结合二者,我们还会使用F1分数作为综合考量指标,它平衡了精确度和召回率。

5.1.2 ROC曲线与AUC值

接收者操作特征曲线(ROC Curve)通过真阳性率(TPR)和假阳性率(FPR)的变化,展现了模型在不同阈值下的表现。而曲线下面积(AUC,Area Under the Curve)是ROC曲线下的面积,其值越接近1,说明模型的区分能力越强。在股市预测场景下,AUC值是评估模型预测效能的重要指标。

5.1.3 准确率得分(Precision Score)

在预测涨跌这种不对称成本问题上,准确率得分尤为重要。它衡量了模型预测为涨跌时,实际确实涨跌的比率。高准确率得分意味着模型在预测涨跌时更为可靠。

5.2 评估方法

5.2.1 交叉验证

为了确保模型评估结果的稳定性和可靠性,我们将采用K折交叉验证(K-Fold Cross Validation)。这种方法将数据集分为K个子集,每次以K-1个子集作为训练集,剩下的1个子集作为测试集,重复K次并取平均性能指标,以此来减少随机性对评估结果的影响。

5.2.2 时间序列交叉验证

考虑到股市数据的时间序列特性,我们会特别采用时间序列交叉验证(Time Series Cross-Validation, TSCV),如滚动窗口验证法。这种方法确保了模型在未知未来数据上的泛化能力评估更加准确,避免了因时间顺序而导致的信息泄露问题。

5.3 模型性能分析

5.3.1 性能指标汇总与解读

基于上述评估指标和方法,我们将得到一系列量化性能指标。比如,AUC值若接近于1,表示模型在区分涨跌样本上有较强能力;F1分数高,则说明模型在预测精度和覆盖度上取得了较好的平衡。通过这些指标的对比分析,可以直观地了解模型的整体性能。

5.3.2 特征重要性分析

LightGBM模型提供了特征重要性评估功能,通过计算每个特征对模型预测结果的贡献度,帮助我们识别出哪些特征对股市涨跌预测最为关键。这一分析不仅能够提升我们对股市动态的理解,也为后续特征选择和模型优化提供了依据。

5.3.3 错误案例分析

深入研究预测错误的案例,分析模型为何在这些情况下表现不佳,是提高模型性能的关键步骤。可能包括极端市场事件、数据噪声或是模型本身的局限性等因素。通过错误案例的复盘,我们可以发现模型的潜在改进方向,如增加新特征、调整模型参数或采用更复杂的模型结构。

5.3.4 过拟合与欠拟合检测

通过对训练集和验证集性能的比较,监测过拟合(模型对训练数据过度学习,泛化能力差)和欠拟合(模型过于简单,无法捕捉数据中的复杂模式)现象。通过调整模型复杂度、正则化参数等手段,寻求最佳的模型复杂度平衡点。

结语

模型评估是确保LightGBM股市预测系统准确性和稳定性不可或缺的一环。通过综合运用多种评估指标、科学的验证方法以及深入的性能分析,我们不仅能够全面理解模型的能力和限制,还能为持续优化模型、提升预测准确性奠定坚实基础。随着市场环境的变化和新数据的不断加入,持续的评估与调整将是保障模型长期有效性的关键策略。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/884763.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入浅出MongoDB(三)

深入浅出MongoDB(三) 文章目录 深入浅出MongoDB(三)复制副本集设置分片分片实例备份与恢复监控ObjectId 复制 复制时将数据同步在多个服务器的过程,提供了数据的冗余备份,在多个服务器上存储数据副本&#…

视频压缩怎么压缩更小?分享释放视频占用空间的小技巧

想问问同样在做视频自媒体博主的你,都是怎么解决占满内存的视频素材的? 是有听说有一部分博主会把录制好的,还未使用的视频素材,用工具压缩他们的体积,以减少占用内存空间。 小编也有试过,发现视频的体积是…

oracle解决关联查询报invalid number问题

出现问题的原因和背景 oracle进行关联查询的时候因为字段存在多个用逗号切割的id,导致查询的过程中报无效数字或非法数字 问题复现 新建表A CREATE TABLE "A" (id NUMBER NOT NULL,name VARCHAR2(255 BYTE) )INSERT INTO "A" VALUES (1, 上海…

【Spring】lombok、dbUtil插件应用

一、lombok插件 1. 功能:对实体类自动,动态生成get、set方法,无参、有参构造..... 2. 步骤: (1)idea安装插件(只做一次) (2)添加坐标 (3)编写注解 NoArgsCo…

Codeforces Round 975 (Div. 2) A-C 题解

这次看到 C 题分数 1750 就开始害怕了,用小号打的比赛,一直觉得做不出来,最后才想到 A. Max Plus Size 题意 给你一些整数,选择一些涂成红色,两两不能相邻,你的得分为: [ 红色元素的个数 ] …

Tableau数据可视化入门

目录 一、实验名称 二、实验目的 三、实验原理 四、实验环境 五、实验步骤 1、Tableau界面引导 2、数据来源 3、数据预处理操作 4、制作中国各个地区的利润图表 4.1条形图 4.2气泡图 5、制作填充地球图 一、实验名称: 实验一:Tableau数据可视…

PyCharm 的安装和配置

环境要求: OS:Windows / macOS / Linux (此处使用 Windows 10 进行演示)Python:包括但不限于 Anaconda,miniconda,Python。在 Windows 下只要能找到 python.exe 即可 Download 进入 PyCharm 官网,选择对…

gitlab修改访问端口

目录 1.找到gitlab.rb文件,一般在/etc/gitlab/路径下 2.打开配置文件,加上代码 3.重新配置 4.重启gitlab 1.找到gitlab.rb文件,一般在/etc/gitlab/路径下 2.打开配置文件,加上代码 打开文件 sudo vi gitlab.rb 加上默认端口配…

上交所服务器崩溃:金融交易背后的技术隐患暴露杭州BGP高防服务器43.228.71.X

一、上交所宕机事件始末 2024 年 9 月 27 日,上交所交易系统突发崩溃,这一事件犹如一颗巨石投入平静的湖面,引起了轩然大波。当天上午,众多投资者反馈券商交易出现延迟问题,随后上交所发布了《关于股票竞价交易出现异常…

OJ在线评测系统 前端创建题目(增) 更新题目(改) 题目列表(查) 以及做题页面的开发 基于VUECLI脚手架画界面

目录 前端创建页面的开发一 创建一个路由 用acro design写 前端创建页面的开发二 题目管理页面 搜索 最終效果 题目更新页面的开发 携带参数的那种 修改路由 页码更新细节 我们先处理菜单项的权限控制和权限隐藏 在这里改 属性绑定一个函数 可以参考聚合搜索项目…

某客户Oracle RAC无法启动故障快速解决

某日,9:50左右接到好友协助需求,某个客户Oracle RAC无法启动,并发过来一个报错截图,如下: 和客户维护人员对接后,远程登录服务端进行故障分析。 查看hosts信息,首先进行心跳测试,测…

RK3568的型号区分

RK3568是瑞芯微公司设计开发和生产的MPU芯片产品。RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,集成4核ARM架构A55处理器和Mali G52 2EE图形处理器,支持4K解码和1080P编码。内置独立的NPU,0.8Tops算力,可…

【tower-boot 系列】开源RocketMQ和阿里云rockerMq 4.x和5.x集成 (一)

RocketMQ 简单介绍 阿里云rockerMq 4.x和5.x集成 一、云平台创建实例 参考文档: 阿里云api 阿里云 创建实例 二、skd集成思路 公司用的RocketMQ一般是自建开源apache的RocketMQ和上阿里云的RocketMQ,目前阿里云支持4.x和5.x版本 项目集成思路&…

巨控协议转换网关GRM321GRM322GRM323应用场景

巨控工业协议网关GRM321,GRM322,GRM323是网口型网关,支持各种PLC的TCP协议,具备多路RS485,RS232和三个TCP网口。能实现RS485,RS232和TCP的工业协议的零代码无缝转换,能极大节约工程师编程时间,保障数据采集的可靠性。 …

无人机侦测:频谱无线电侦测设备技术详解

无人机侦测中的频谱无线电侦测设备技术是一项复杂而关键的技术,它主要通过分析无线电频谱中的信号来探测和识别无人机。以下是该技术的详细解析: 一、技术原理 频谱探测技术:该技术通过分析信号在频域上的分布和特性,来识别、测…

[大语言模型-论文精读] ACL2024-长尾知识在检索增强型大型语言模型中的作用

ACL2024-长尾知识在检索增强型大型语言模型中的作用 On the Role of Long-tail Knowledge in Retrieval Augmented Large Language Models Authors: Dongyang Li, Junbing Yan, Taolin Zhang, Chengyu Wang, Xiaofeng He, Longtao Huang, Hui Xue, Jun Huang 1.概览 问题解决&…

荣业食品销售费用每年上亿元:主要产品收入大降,电商占比过低

《港湾商业观察》黄懿 今年3月,广东荣业食品有限公司的控股公司Wing Yip Food Holdings Group Limited(下称“荣业食品”)向美国SEC递交了纳斯达克上市申请。 据悉,2023年11月,商务部宣布移除了一批共计55家因长期经…

AI大模型的基本流程

这篇文章主要是记录自己的问题,虽然说AI大数据模型已经出现了很久,但是一直找不到它与企业的关系,因为有ghat gpt,只要应用这个人工智能就可以了,所以思想一直没有转变过来。 昨天梳理了一下AI大数据的模型,解答了我的…

VMware 虚拟机配置固定 IP

相关链接: SSH 服务配置与 Network error: Connection refused 解决 1. 查看 VMware 网络配置 点击【编辑】 -> 【虚拟网络编辑器】 选择【更改设置】查看 VMnet8 配置信息 选择【NAT设置】 查看当前虚拟机的网关是 192.168.17.2(也可以进行修改…

Tpflow:提升开发效率的PHP工作流引擎

Tpflow:提升开发效率的PHP工作流引擎 今天要跟大家介绍的是一款能够显著提升开发效率的工具——Tpflow!它是一个专门为PHP开发者设计的工作流引擎,致力于帮助你减少80%以上的代码量,轻松管理复杂的业务流程。让我们一起来看看它的…