【第十三章:Sentosa_DSML社区版-机器学习聚类】

目录

【第十三章:Sentosa_DSML社区版-机器学习聚类】

13.1 KMeans聚类

13.2 二分KMeans聚类

13.3 高斯混合聚类

13.4 模糊C均值聚类

13.5 Canopy聚类

13.6 Canopy-KMeans聚类

13.7 文档主题生成模型聚类

13.8 谱聚类


【第十三章:Sentosa_DSML社区版-机器学习聚类】

13.1 KMeans聚类

1.算子介绍

        KMeans聚类算子(k-means clustering algorithm:k均值聚类算法)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。

2.算子类型

        机器学习/聚类算子。

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

k

聚类数目

必填

Int

2

>=2

k-means 聚类最终创建的簇的数目

max_iter

最大迭代次数

必填

Int

20

>0

最大迭代次数

tolerance

收敛偏差

必填

Double

0.0001

>0

收敛偏差

init_mode

初始化算法

必选

String

k-means||

“random”,“k-means||”中的一个

初始化算法类型,可选“random”,“k-means||”

init_steps

k-means||算法的步数

必填

Int

2

>0 并且只在 init_mode 为“k-means||”时让用户设置

“k-means||”算法的步数

Wight

权重列设置

非必填

String

在建模时,有时不同的样本可能有不同的权重。我们需要支持用户在建模时指定权重列。

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        KMeans算子属性界面如图所示

KMeans属性界面

        聚类中心点有两种初始化方法:随机初始化和“k - means||”算法。当使用“k - means||”算法进行中心点初始化时,需要设置“k - means||”算法的步数参数。

(3)算子的运行

        KMeans为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个KMeans算子,右击算子,点击运行,得到KMeans模型。

运行KMeans算子获得KMeans模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

KMeans模型算子流

        右击模型,查看模型的模型信息

KMeans模型信息

        模型的运行结果如图所示

KMeans模型运行结果

        模型的评估结果如图所示

KMeans模型模型评估结果

13.2 二分KMeans聚类

1.算子介绍

        二分KMeans(BuildBKMeansnode)算法是对K-means的改进,防止聚类陷入局部最优解。它的主要思想是:首先将所有点作为一个簇,然后将该簇一分为二。之后选择能最大限度降低聚类代价函数的簇划分为两个簇。以此进行下去,直到簇的数目等于用户给定的数目k为止。

2.算子类型

        机器学习/聚类算子。

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

k

聚类数目

必填

Int

4

>=2

聚类数目

max_iter

最大迭代次数

必填

Int

20

>0

最大迭代次数

min_divisible_cluster_size

最小可分割簇数目

必填

Double

1.0

>0.0

最小可试用集群大小,如果大于1则为最小点数,如果<1则为最小比例

Wight

权重列设置

非必填

String

在建模时,有时不同的样本可能有不同的权重。我们需要支持用户在建模时指定权重列。

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        二分KMeans算子属性界面如图所示

二分KMeans属性界面

(3)算子的运行

        二分KMeans为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个二分KMeans算子,右击算子,点击运行,得到二分KMeans模型。

运行二分KMeans算子获得二分KMeans模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

二分KMeans模型算子流

        右击模型,查看模型的模型信息,如图所示。

二分KMeans模型信息

        模型的运行结果如图所示

二分KMeans模型运行结果

        模型的评估结果如图所示

二分KMeans模型评估结果

13.3 高斯混合聚类

1.算子介绍

        高斯混合模型(BuildGMNode)就是用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。高斯混合模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。

2.算子类型

        机器学习/聚类算子。

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

k

高斯函数的数量

必填

Int

2

>1

混合模型中独立高斯函数的个数。必须大于1。默认值:2。

max_iter

最大迭代次数

必填

Double

100

>0

最大迭代次数

tol

收敛偏差

必填

Double

0.000001

>0

收敛偏差

Wight

权重列设置

非必填

String

在建模时,有时不同的样本可能有不同的权重。我们需要支持用户在建模时指定权重列。

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        高斯混合模型属性界面如图所示

高斯混合模型属性界面

(3)算子的运行

        高斯混合模型为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个高斯混合模型算子,右击算子,点击运行,得到高斯混合模型的模型。

运行高斯混合模型算子获得高斯混合模型的模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

高斯混合模型的模型算子流

        右击模型,查看模型的模型信息

高斯混合模型的模型信息

        模型的运行结果如图所示

高斯混合模型运行结果

        模型的评估结果如图所示

高斯混合模型的模型评估结果

13.4 模糊C均值聚类

1.算子介绍

        模糊C均值聚类算法 fuzzy c-means algorithm (FCMA)或称( FCM)。它是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。它除了给出某一样本的具体分类,还可以给出它隶属于每一样本的隶属度。更方便用户对聚类结果有更深入的判断。

2.算子类型

        机器学习/聚类算子

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

clusters_num

聚类数目

必选

Integer

3

>2

聚类数目

max_iter

最大迭代次数

必选

Integer

100

>=1

最大迭代次数

epsilon

迭代终止判定准则

必选

Double

0.1

0<x<1

迭代中止判定准则

fuzzyness_coefficient

隶属度因子

必选

Double

2.0

>=2.0

隶属度因子

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        模糊C均值模型属性界面如图所示

模糊C均值模型属性界面

        其中迭代终止判定准则表示迭代后中心点坐标的改变量小于0.1时迭代终止。隶属度因子为代价函数中隶属度的加权指数。

(3)算子的运行

        模糊C均值聚类模型为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个模糊C均值聚类模型算子,右击算子,点击运行,得到模糊C均值聚类的模型。

运行模糊C均值聚类算子获得模糊C均值聚类模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

模糊C均值聚类模型的算子流

        右击模型,查看模型信息

模糊C均值聚类模型的模型信息

        模型的运行结果如图所示

模糊C均值聚类模型的运行结果

        模型的评估结果如图所示

模糊C均值聚类模型的评估结果

13.5 Canopy聚类

1.算子介绍

        Canopy算法也是一种常用的聚类算法,它的一种快速粗聚类算法,优势是用户不用事先指定聚类数目。用户需要指定两个距离阈值,T1,T2,且T1>T2。可以认为T2为核心聚类范围,T1为外围聚类范围。每一个训练样本都属于一个确定的核心聚类范围,但可以属于多个外围聚类范围。

2.算子类型

        机器学习/聚类算子

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

T1

T1值

必填

Double

100.0

>0.0 且 >=T2

Canopy算法T1值

T2

T2值

必填

Double

1.0

>0.0 且 <=T1

Canopy算法T2值

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作。

(2)算子属性设置

        Canopy聚类算子的属性界面如图所示

Canopy聚类算子属性界面

(3)算子的运行

        Canopy聚类算子为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个Canopy聚类算子,右击算子,点击运行,得到Canopy聚类算子的模型。

运行Canopy聚类算子获得Canopy聚类模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

Canopy聚类模型的算子流

        右击模型,查看模型信息

Canopy聚类模型信息

        模型的运行结果如图所示。

Canopy聚类模型的运行结果

        模型的评估结果如图所示

Canopy聚类模型的评估结果

        常见问题解答

        1. 分类结果过多(超过100种)

        该算子建模后,生成过多的分类结果,造成算子报错。

13.6 Canopy-KMeans聚类

1.算子介绍

        Canopy-Kmeans 是结合Canopy和Kmeans两种聚类算法的优势,首先利用Canopy聚类先对数据进行快速“粗”聚类,得到k值后再使用K-means进行进一步“细”聚类。这样既提高聚类算法性能,也不用用户提前指定聚类具体个数。

2.算子类型

        机器学习/聚类算子

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

T1

T1值

必填

Double

100.0

>0.0 且 >=T2

Canopy算法T1值

T2

T2值

必填

Double

1.0

>0.0 且 <=T1

Canopy算法T2值

max_iter

最大迭代次数

必填

Int

20

>0

最大迭代次数

tolerance

收敛偏差

必填

Double

0.0001

>0.0

收敛偏差

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作。

(2)算子属性设置

        Canopy-KMeans聚类算子的属性界面如图所示

Canopy-KMeans聚类算子属性界面

        Canopy-KMeans聚类算子用Canopy算法确定聚类的初始中心点,再用KMeans算法进行细聚类。

(3)算子的运行

        Canopy-KMeans聚类算子为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个Canopy-KMeans聚类算子,右击算子,点击运行,得到Canopy-KMeans聚类算子的模型。

运行Canopy-KMeans聚类算子获得Canopy-KMeans聚类模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

Canopy-KMeans聚类模型的算子流

        右击模型,查看模型信息

Canopy-KMeans聚类模型信息

        模型的运行结果如图所示

Canopy-KMeans聚类模型的运行结果

        模型的评估结果如图所示

Canopy-KMeans聚类模型的评估结果

13.7 文档主题生成模型聚类

1.算子介绍

        文档主题生成模型聚类(BuildLDANode)也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。

2.算子类型

        机器学习/聚类算子

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

k

主题数量

必填

Int

10

>1

推断的主题(集群)的数量。一定是> 1。默认值:10。

max_iter

最大迭代次数

必填

Int

20

>0

最大迭代次数

sub_sampling_rate

采样率

必填

Double

0.05

optimizer=online 且(0,1)

仅适用于优化器为online模式,在每次梯度下降迭代中被采样和使用的语料在(0,1)范围内的分数。

learning_decay

学习速率

必填

Double

0.51

optimizer=online 且(0.5,1.0]

指数衰减速率,仅适用于优化器为online模式,这个值应该在(0.5,1.0]之间,已保证渐进收敛

learning_offset

学习偏移量

必填

Int

1024

optimizer=online且>0

仅适用于优化器online。(正)学习参数,降低早期迭代。 越大的值使早期迭代次数减少。

optimize_doc_concentration

是否优化alpha

必选

Boolean

单选:true false

是否优化文档主题参数

checkpoint_interval

检查点间隔

必填

Int

10

>= 1或者=-1

设置检查点间隔(>= 1)或禁用检查点(-1)的参数。

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        文档主题生成模型的属性界面如图所示

文档主题生成模型聚类属性界面

(3)算子的运行

        文档主题生成模型为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个文档主题生成模型,右击算子,点击运行,得到文档主题生成模型的模型。

运行文档主题生成模型聚类算子获得模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

文档主题生成模型聚类的模型算子流

        右击模型,查看模型信息

文档主题生成模型聚类的模型信息

        模型的运行结果如图所示

文档主题生成模型聚类的模型运行结果

        模型的评估结果如图所示

文档主题生成模型聚类的模型评估结果

12.8 DBSCAN聚类

1.算子介绍

        DBSCAN (Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。该算法利用基于密度的聚类的概念,即要求聚类空间中的一定区域内(用Eps定义出的半径)所包含对象(点或其他空间对象)的数目不小于某一给定阈值(用MinPts定义的聚类点数)。

2.算子类型

        机器学习/聚类算子

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

maxDistance

邻域半径R(>0)

必填

Double

10

>0

邻域半径R

minPoints

密度邻域的最小实例数(>0)

必填

Int

10

>0

密度邻域的最小实例数

feature_weight

是否计算特征重要性

必填

Boolean

单选:是,否

是否计算特征重要性

show_pie_chart

是否显示聚类大小饼状图

必填

Boolean

单选:是,否

是否显示聚类大小饼状图

show_distribution_mpa

是否显示聚类分布图

必填

Boolean

单选:是,否

是否显示聚类分布图

skip_null_value

是否跳过空值

必填

Boolean

单选:是,否

是否跳过空值

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        DBSCAN算子属性界面如图所示

DBSCAN属性界面

(3)算子的运行

        DBSCAN为建模算子,需要先训练数据生成模型,再通过模型对相同结构的数据进行处理得到最终结果。具体运行过程如下所述。

        首先通过数据读入算子读取数据,中间可以接任意个数据处理算子(例,行处理,列处理等),然后接一个DBSCAN算子,右击算子,点击运行,得到DBSCAN模型。

运行DBSCAN算子获得DBSCAN模型

        得到模型后右击模型,可以查看模型信息。模型后可接任意个数据处理算子,再接图表分析算子或数据写出算子,形成算子流执行。模型后也可接评估算子,对模型的聚类结果进行评估。

DBSCAN模型算子流

        右击模型,查看模型的模型信息

DBSCAN模型信息

        模型的运行结果如图所示

DBSCAN模型运行结果

        模型的评估结果如图所示

DBSCAN模型模型评估结果

13.8 谱聚类

1.算子介绍

        谱聚类是从图论中演化出来的算法,它将聚类问题转换成一个无向加权图的多路划分问题。主要思想是把所有数据点看做是一个无向加权图 G = ( V,E ) 的顶点 V ,E 表示两点间的权重,数据点之间的相似度越高权重值越大。然后根据划分准则对所有数据点组成的图进行切图,使切图后不同的子图间的边权重和尽可能低,而子图内的边权重和尽可能高,从而实现聚类的效果。

2.算子类型

        机器学习/聚类算子

3.算子属性说明

属性

页面显示名称

选项

类型

默认值

约束规则

属性说明

Input_list

需要计算的列

必填

Array

列名

需要参与计算的列名

Sigma

Sigma系数

必填

Double

0.05

>0

相似度矩阵计算系数

K

聚类个数

必填

Int

2

>1

聚类的类别数

max_iter

最大迭代次数

必填

Int

3

>0

最大迭代次数

4.算子使用介绍

(1)算子初始化

        参考公共功能算子初始化操作

(2)算子属性设置

        谱聚类算子属性界面如图所示 

DBSCAN属性界面

(3)算子的运行

        谱聚类算子对输入数据计算相似度,然后聚类,输出聚类类别

谱聚类算子执行流程

        执行算子流得到结果

谱聚类算子流执行结果


 为了非商业用途的科研学者、研究人员及开发者提供学习、交流及实践机器学习技术,推出了一款轻量化且完全免费的Sentosa_DSML社区版。以轻量化一键安装、平台免费使用、视频教学和社区论坛服务为主要特点,能够与其他数据科学家和机器学习爱好者交流心得,分享经验和解决问题。文章最后附上官网链接,感兴趣工具的可以直接下载使用

Sentosa_DSML社区版​​​​​​​​​​​​​​

​​

Sentosa_DSML算子流开发视频

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/881235.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

聊天组件 Vue3-beautiful-chat 插槽

前言 Vue3-beautiful-chat 组件有四个插槽可以定制 一、user-avatar(头像) 首先是头像插槽,我们可以直接在 <beautiful-chat></beautiful-chat> 中间使用; 作用: 我们可以在用户头像上添加自定义样式,比如添加节日边框、可以使用首字母作为头像。。。 …

由于安全风险,安全领导者考虑禁止人工智能编码

安全团队与开发团队之间的紧张关系 83% 的安全领导者表示&#xff0c;他们的开发人员目前使用人工智能来生成代码&#xff0c;57% 的人表示这已成为一种常见做法。 然而&#xff0c;72% 的人认为他们别无选择&#xff0c;只能允许开发人员使用人工智能来保持竞争力&#xff0…

优优嗨聚集团:引领互联网服务新篇章

在当今这个日新月异的互联网时代&#xff0c;企业之间的竞争愈发激烈&#xff0c;如何高效地运营线上业务成为了众多商家关注的焦点。在这一背景下&#xff0c;四川优优嗨聚集团凭借其卓越的服务质量、创新的技术解决方案和强大的品牌影响力&#xff0c;逐渐成为了众多商家信赖…

vscode 配置rust格式化的正确方法

vscode 配置rust格式化的正确方法&#xff1a; 在settings.json里输入&#xff1a; "[rust]": {"editor.defaultFormatter": "rust-lang.rust-analyzer","editor.formatOnSave": true}

CUDA并行架构

一、CUDA简介 CUDA(Compute Unified Device Architecture)是一种由NVIDIA推出的通用并行计算架构&#xff0c;该架构使GPU(Graphics Processing Unit)能够对复杂的计算问题做性能速度优化。 二、串并行模式 高性能计算的关键是利用多核处理器进行并行计算。 串行模式&#…

Python 中的 typing 模块常见用法

typing 模块是 Python 提供的一个标准库&#xff0c;主要用于为函数、变量和类定义类型提示&#xff08;Type Hints&#xff09;&#xff0c;从而提高代码的可读性和类型安全性。虽然 Python 是动态类型语言&#xff0c;但通过 typing 模块&#xff0c;开发者可以明确指定变量和…

【2024研赛】【华为杯E题】2024 年研究生数学建模比赛思路、代码、论文助攻

思路将在名片下群聊分享 高速公路应急车道紧急启用模型 高速公路拥堵现象的原因众多&#xff0c;除了交通事故外&#xff0c;最典型的就是部分路段出现瓶颈现象&#xff0c;主要原因是车辆汇聚&#xff0c;而拥堵后又容易蔓延。高速公路一些特定的路段容易形成堵点&#xff0…

Scrapy爬虫实战——某瓣250

# 按照我个人的习惯&#xff0c;在一些需要较多的包作为基础支撑的项目里&#xff0c;习惯使用虚拟环境&#xff0c;因为这样能极大程度的减少出现依赖冲突的问题。依赖冲突就比如A、B、C三个库&#xff0c;A和B同时依赖于C&#xff0c;但是A需要的C库版本大于N&#xff0c;而B…

一文说清楚ETL与Kafka如何实现集成

ETL与Kafka为何需要集成? 随着企业对实时流数据的处理要求越来越高&#xff0c;很多企业都把实时流数(日志、实时CDC采集数据、设备数据…)先推入到kafka中&#xff0c;再通过ETL对kafka中的数据进行消费通过ETL强大的数据的转换、清洗功能来进行数据的集成与分发。 实时数据…

CefSharp_Vue交互(Element UI)_WinFormWeb应用---设置应用透明度(含示例代码)

一、界面预览 1.1 设置透明(整个页面透明80%示例) 限制输入值:10-100(数字太小会不好看见) 1.2 vue标题栏 //注册类与js调用 (async function(

11年计算机考研408-数据结构

设执行了k次。 解析&#xff1a; d要第一个出&#xff0c;那么abc先入栈&#xff0c;d入栈然后再出栈&#xff0c;这前面是一个固定的流程&#xff0c;后面就很灵活了&#xff0c;可以ecba&#xff0c;ceba&#xff0c;cbea&#xff0c;cbae。 答案是4个序列。 解析&#xff1a…

CSS 复合选择器简单学习

目录 1. Emmet 语法 1.1 快速生成 HTML 结构语法 1.2 快速生成 CSS 样式 1.3 格式化工具 2. 调试 2.1 打开调试工具 2.2 使用调试工具 3. 复合选择器 3.1 后代选择器 3.2 子选择器 3.3 并集选择器 3.4 伪类选择器 3.3.1 链接伪类选择器 3.3.2 :focus 伪类选择器 …

OpenCV特征检测(5)检测图像中的角点函数cornerMinEigenVal()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 计算用于角点检测的梯度矩阵的最小特征值。 该函数类似于 cornerEigenValsAndVecs&#xff0c;但它计算并存储协方差矩阵导数的最小特征值&…

帧率和丢帧分析理论

一、丢帧问题概述 应用丢帧通常指的是在应用程序的界面绘制过程中&#xff0c;由于某些原因导致界面绘制的帧率下降&#xff0c;从而造成界面卡顿、动画不流畅等问题。以60Hz刷新率为例子&#xff0c;想要达到每秒60帧&#xff08;即60fps&#xff09;的流畅体验&#xff0c;每…

NLP 主要语言模型分类

文章目录 ngram自回归语言模型TransformerGPTBERT&#xff08;2018年提出&#xff09;基于 Transformer 架构的预训练模型特点应用基于 transformer&#xff08;2017年提出&#xff0c;attention is all you need&#xff09;堆叠层数与原transformer 的差异bert transformer 层…

1--SpringBoot外卖项目介绍及环境搭建 详解

目录 软件开发整体流程 软件开发流程 角色分工 软件环境 苍穹外卖项目介绍 项目介绍 产品原型 技术选型 开发环境搭建 前端环境搭建 后端环境搭建 完善登录功能 导入接口文档 Swagger 介绍 使用方式 常用注解 软件开发整体流程 软件开发流程 需求分析&#x…

Shiro-721—漏洞分析(CVE-2019-12422)

文章目录 Padding Oracle Attack 原理PKCS5填充怎么爆破攻击 漏洞原理源码分析漏洞复现 本文基于shiro550漏洞基础上分析&#xff0c;建议先看上期内容&#xff1a; https://blog.csdn.net/weixin_60521036/article/details/142373353 Padding Oracle Attack 原理 网上看了很多…

ElasticSearch-2-核心语法集群高可用实战-Week2

ES批量操作 1.批量获取文档数据 这里多个文档是指&#xff0c;批量操作多个文档&#xff0c;搜索查询文档将在之后的章节讲解 批量获取文档数据是通过_mget的API来实现的 (1)在URL中不指定index和type 请求方式&#xff1a;GET 请求地址&#xff1a;_mget 功能说明 &#…

【C++ Primer Plus习题】16.10

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: #include <iostream> #include <string> #include <…

java自定义线程池详解

目录 线程池使用线程池的目的线程池工作原理线程池常用方法自定义线程池等待队列拒绝策略线程工厂 线程池 使用线程池的目的 资源复用&#xff0c;降低开销。重复利用已创建的线程&#xff0c;避免线程频繁地创建和销毁带来的性能开销。方便线程的可管理性。线程是稀缺资源&a…