【机器学习】K-means聚类算法:原理、应用与优化

一、引言

1、简述聚类分析的重要性及其在机器学习中的应用

  聚类分析,作为机器学习领域中的一种无监督学习方法,在数据探索与知识发现过程中扮演着举足轻重的角色。它能够在没有先验知识或标签信息的情况下,通过挖掘数据中的内在结构和规律,将数据对象自动划分为多个类别或簇。每个簇内的对象具有高度的相似性,而不同簇间的对象则表现出明显的差异性。

  聚类分析的重要性主要体现在以下几个方面:首先,它可以帮助我们理解数据的分布和特征,发现潜在的数据模式;其次,通过聚类,我们可以识别出数据中的异常值或噪声,提高数据质量;最后,聚类分析还可以为后续的监督学习提供有价值的先验知识,如通过聚类结果初始化分类器的参数等。

  在机器学习的广泛应用中,聚类分析发挥着不可或缺的作用。例如,在图像处理中,聚类可以用于图像分割、颜色量化等任务;在市场分析中,聚类可以帮助企业实现客户细分,制定更精准的营销策略;在生物信息学中,聚类则可用于基因表达数据的分析,揭示基因之间的相互作用关系。
在这里插入图片描述

2、引入K-means聚类算法,简要介绍其基本概念

  在众多聚类算法中,K-means算法因其简单高效而备受青睐。K-means算法的基本思想是:通过迭代的方式,将数据划分为K个不同的簇,并使得每个数据点与其所属簇的质心(或称为中心点、均值点)之间的距离之和最小。

  具体来说,K-means算法的执行过程通常包括以下几个步骤:首先,随机选择K个数据点作为初始的簇质心;然后,根据每个数据点与各个簇质心的距离,将其分配给最近的簇;接着,重新计算每个簇的质心,即取簇内所有数据点的平均值作为新的质心;重复上述的分配和更新步骤,直到满足某种终止条件(如簇质心不再发生显著变化或达到预设的迭代次数)。

  K-means算法的优点在于其直观易懂、计算速度快且易于实现。然而,它也存在一些局限性,如对初始簇质心的选择敏感、可能陷入局部最优解以及需要预先设定聚类数K等。因此,在实际应用中,我们需要根据具体的问题和数据特点来选择合适的聚类算法,并可能需要对算法进行优化或改进以适应特定的需求。

  在接下来的内容中,我们将进一步深入探讨K-means聚类算法的原理、实现细节、优缺点以及在实际应用中的案例。希望通过本文的介绍,读者能够对K-means算法有更深入的理解和认识,并能够将其有效地应用于实际的数据分析和机器学习任务中。

二、K-means聚类算法原理

1、K-means算法的基本思想

  K-means算法是一种迭代求解的聚类分析算法,其核心思想是将数据集中的n个对象划分为K个聚类,使得每个对象到其所属聚类的中心(或称为均值点、质心)的距离之和最小。这里所说的距离通常指的是欧氏距离,但也可以是其他类型的距离度量。

  K-means算法通过迭代的方式不断优化聚类结果,使得每个聚类内的对象尽可能紧密,而不同聚类间的对象则尽可能分开。这种优化过程通常基于某种目标函数,如误差平方和(Sum of Squared Errors, SSE),该目标函数衡量了所有对象到其所属聚类中心的距离之和。

2、算法步骤详解

  K-means算法的执行过程通常包括以下几个步骤:

  (1)初始化:选择K个初始聚类中心

  在算法开始时,需要随机选择K个数据点作为初始的聚类中心。这些初始聚类中心的选择对最终的聚类结果有一定的影响,因此在实际应用中,通常会采用一些启发式的方法来选择较好的初始聚类中心,如K-means++算法。

  (2)分配:将每个数据点分配给最近的聚类中心

  对于数据集中的每个数据点,计算其与每个聚类中心的距离,并将其分配给距离最近的聚类中心。这一步通常使用欧氏距离作为距离度量,计算公式如下:

d i s t ( x , c i ) = ∑ j = 1 d ( x j − c i j ) 2 dist(x, c_i) = \sqrt{\sum_{j=1}^{d} (x_j - c_{ij})^2} dist(x,ci)=j=1d(xjcij)2

  其中, x x x是数据点, c i c_i ci是第 i i i 个聚类中心, d d d 是数据的维度, x j x_j xj c i j c_{ij} cij 分别是 x x x c i c_i ci 在第 j j j 维上的值。

  (3)更新:重新计算每个聚类的中心

  对于每个聚类,重新计算其聚类中心。新的聚类中心是该聚类内所有数据点的均值,计算公式如下:

c i = 1 ∣ S i ∣ ∑ x ∈ S i x c_i = \frac{1}{|S_i|} \sum_{x \in S_i} x ci=Si1xSix

  其中, S i S_i Si 是第 i i i 个聚类的数据点集合, ∣ S i ∣ |S_i| Si是该集合中数据点的数量。

(4)迭代:重复分配和更新步骤,直到满足终止条件

  重复执行分配和更新步骤,直到满足某种终止条件。常见的终止条件包括:

  聚类中心不再发生显著变化:即新的聚类中心与旧的聚类中心之间的距离小于某个预设的阈值。
  达到最大迭代次数:为了避免算法陷入无限循环,通常会设置一个最大迭代次数作为终止条件。
  在迭代过程中,算法会不断优化聚类结果,使得每个聚类内的对象更加紧密,而不同聚类间的对象更加分散。最终,当满足终止条件时,算法停止迭代并输出最终的聚类结果。

  需要注意的是,K-means算法对初始聚类中心的选择和聚类数K的设定非常敏感。不同的初始聚类中心和K值可能会导致完全不同的聚类结果。因此,在实际应用中,通常需要结合具体问题和数据特点来选择合适的初始聚类中心和K值,并可能需要对算法进行多次运行以获取更稳定的结果。

三、K-means算法的优点与局限性

  K-means算法作为机器学习中常用的聚类方法之一,在实际应用中具有诸多优点,但同时也存在一些局限性。下面我们将详细探讨K-means算法的优点和局限性。

1、优点

  (1)简单易懂:
  K-means算法的原理直观易懂,通过迭代的方式将数据划分为K个聚类,使得每个数据点到其所属聚类的质心距离之和最小。这种简单直观的思想使得K-means算法易于被理解和接受,适合初学者入门学习。

  (2)计算效率高:
  K-means算法在迭代过程中,主要涉及到距离计算和均值计算,这些计算相对简单且高效。因此,在处理大规模数据集时,K-means算法通常能够在较短的时间内完成聚类任务,适合用于实时处理或大规模数据处理场景。

  (3)易于实现:
  K-means算法的实现相对简单,只需按照初始化、分配、更新和迭代的步骤进行即可。这使得K-means算法在编程实践中易于实现和调试,降低了使用门槛。

2、 局限性

  (1)对初始聚类中心敏感:
  K-means算法的聚类结果在很大程度上受到初始聚类中心选择的影响。如果初始聚类中心选择不当,可能会导致聚类结果出现偏差或不稳定。为了缓解这一问题,可以采用一些启发式方法(如K-means++算法)来优化初始聚类中心的选择。

  (2)可能陷入局部最优:
  K-means算法在迭代过程中采用贪心策略,每一步都试图找到当前最优解。然而,这种策略可能导致算法陷入局部最优解,而无法达到全局最优。为了克服这一问题,可以尝试使用不同的初始聚类中心进行多次运行,或者结合其他优化算法来改进K-means算法的性能。

  (3)需要预先设定聚类数K:
  K-means算法需要提前设定聚类数K,这个值的选择往往需要根据具体问题和数据特点来确定。如果K值选择不当,可能会导致聚类结果不符合实际情况或无法有效揭示数据的内在结构。在实际应用中,可以通过一些评估指标(如轮廓系数、肘部法则等)来辅助确定合适的K值。

  综上所述,K-means算法具有简单易懂、计算效率高和易于实现等优点,但同时也存在对初始聚类中心敏感、可能陷入局部最优和需要预先设定聚类数K等局限性。因此,在使用K-means算法时,我们需要结合具体问题和数据特点来选择合适的初始聚类中心、K值以及优化策略,以获得更好的聚类效果。

四、K-means算法的应用场景

  K-means算法作为一种强大的无监督学习工具,在多个领域有着广泛的应用。下面我们将详细探讨K-means算法在图像处理、市场分析、文本挖掘以及生物信息学等领域的应用。

1、 图像处理

  在图像处理领域,K-means算法常用于图像分割和颜色量化等任务。

  图像分割:K-means算法能够将图像中的像素点按照颜色、亮度等特征进行聚类,从而实现图像的分割。通过设定不同的聚类数K,可以将图像划分为不同的区域,有助于提取出图像中的目标物体或背景信息。

  颜色量化:在图像压缩或简化处理中,K-means算法可以用于减少图像中的颜色数量。通过将颜色空间中的颜色值进行聚类,每个聚类中心代表一种颜色,从而实现对图像颜色的量化。这有助于减小图像文件的大小,同时保持较好的视觉效果。

2、 市场分析

  在市场营销领域,K-means算法可以帮助企业实现客户细分和产品推荐等任务。

  客户细分:通过对客户的购买记录、浏览行为等数据进行聚类分析,K-means算法可以将客户划分为不同的群体。这些群体在消费习惯、兴趣爱好等方面具有相似性,有助于企业制定更精准的营销策略,提高客户满意度和忠诚度。

  产品推荐:基于K-means算法的聚类结果,企业可以为客户推荐与其所在群体喜好相似的产品。这种个性化推荐方式可以提高客户的购买意愿和转化率,从而增加企业的销售额和利润。

3、文本挖掘

  在文本挖掘领域,K-means算法可以用于文档聚类和主题识别等任务。

  文档聚类:通过对文档中的关键词、词频等特征进行提取和聚类分析,K-means算法可以将相似的文档归为一类。这有助于对大量文档进行组织和分类,方便用户查找和浏览相关信息。

  主题识别:基于K-means算法的聚类结果,可以进一步提取出每个聚类中的主题或关键词。这有助于了解文档集的主要内容和热点话题,为后续的文本分析和挖掘提供有价值的线索。

4、生物信息学

  在生物信息学领域,K-means算法常用于基因表达数据的聚类分析。

  基因表达数据聚类:通过对基因表达数据进行聚类分析,K-means算法可以帮助研究人员发现具有相似表达模式的基因群体。这些基因群体可能参与相同的生物过程或具有相似的功能,有助于揭示基因之间的相互作用关系和生物系统的复杂性。

  综上所述,K-means算法在图像处理、市场分析、文本挖掘以及生物信息学等领域具有广泛的应用价值。通过运用K-means算法进行聚类分析,我们可以更好地理解和利用数据中的内在结构和规律,为实际问题的解决提供有力的支持。

五、K-means算法的优化与改进

  K-means算法作为一种经典的聚类方法,在实际应用中虽然得到了广泛的使用,但也存在一些问题和局限性。为了提高K-means算法的性能和准确性,研究者们提出了多种优化与改进方法。下面我们将详细探讨初始聚类中心的选择方法、距离度量方式的改进、算法加速技巧以及自适应确定聚类数K的方法。

1、初始聚类中心的选择方法

  K-means算法对初始聚类中心的选择非常敏感,不同的初始聚类中心可能导致完全不同的聚类结果。为了优化初始聚类中心的选择,研究者们提出了以下方法:

  K-means++算法:K-means++算法通过改进初始聚类中心的选择策略,旨在提高聚类的稳定性和准确性。该算法首先随机选择一个数据点作为第一个初始聚类中心,然后对于每个未被选择的数据点,计算其与已有聚类中心之间的最小距离,并根据该距离的概率分布选择下一个聚类中心。通过这种方式,K-means++算法能够使得初始聚类中心之间距离较远,从而避免陷入局部最优解。

  基于密度的初始化:基于密度的初始化方法考虑数据点的分布密度,选择密度较高的区域作为初始聚类中心。这种方法能够更好地反映数据的内在结构,使得聚类结果更加合理。一种常见的基于密度的初始化方法是选择局部密度峰值作为初始聚类中心。

2、距离度量方式的改进

  K-means算法默认使用欧氏距离作为数据点之间的距离度量方式。然而,在某些情况下,欧氏距离可能不是最合适的度量方式。为了改进距离度量方式,研究者们提出了以下方法:

  使用余弦相似度:余弦相似度是一种衡量两个向量之间夹角的相似度度量方式。在某些情况下,如文本聚类或图像聚类中,使用余弦相似度可能更加合适。余弦相似度能够忽略向量长度的影响,只关注向量之间的方向差异,从而更好地反映数据点之间的相似性。

  曼哈顿距离:曼哈顿距离也称为城市街区距离,是两点在标准坐标系上的绝对轴距总和。在处理具有离散特征或高维数据时,曼哈顿距离可能是一个更好的选择。它对于数据的异常值和噪声相对不敏感,因此在某些情况下能够提供更稳定的聚类结果。

3、 算法加速技巧

  K-means算法在迭代过程中需要进行大量的距离计算和均值计算,这可能导致算法运行时间较长。为了加速K-means算法的执行,研究者们提出了以下技巧:

  使用KD树或球树:KD树和球树是两种常用的空间划分数据结构,能够高效地处理最近邻搜索问题。在K-means算法中,可以使用KD树或球树来加速数据点到聚类中心之间的距离计算,从而提高算法的运行效率。

  并行化计算:K-means算法的迭代过程可以并行化执行,即同时处理多个数据点的分配和更新操作。通过利用多核处理器或分布式计算平台,可以显著提高K-means算法的计算速度。

4、自适应确定聚类数K的方法

  K-means算法需要提前设定聚类数K,而选择合适的K值往往是一个挑战。为了自适应地确定聚类数K,研究者们提出了以下方法:

  轮廓系数:轮廓系数是一种评估聚类效果的指标,它综合考虑了同一聚类内数据点的紧凑度和不同聚类间数据点的分离度。通过计算不同K值下的轮廓系数,可以选择使得轮廓系数最大的K值作为最优聚类数。

  肘部法则:肘部法则通过观察聚类误差平方和(SSE)随K值变化的曲线来确定最优聚类数。当K值较小时,增加K值会显著降低SSE;而当K值达到某个阈值后,再增加K值对SSE的降低效果不再明显。这个阈值对应的K值即为最优聚类数。

  综上所述,通过对初始聚类中心的选择方法、距离度量方式的改进、算法加速技巧以及自适应确定聚类数K的方法的优化与改进,我们可以提高K-means算法的性能和准确性,使其更好地适应不同领域和场景的需求。

六、K-means算法的实现与案例

  在Python中,我们可以使用sklearn库中的KMeans类来方便地实现K-means算法。下面我们将展示如何使用sklearn库进行K-means聚类,并通过一个简单的案例来演示其在实际数据上的应用过程,同时介绍如何利用肘部法则来确定最佳的聚类数K。

1、使用sklearn实现K-means算法

  首先,确保你已经安装了sklearn库。如果没有安装,可以使用pip进行安装:

pip install -U scikit-learn

然后,你可以按照以下步骤使用KMeans类:

from sklearn.cluster import KMeans  
import numpy as np  
import matplotlib.pyplot as plt  
  
# 假设我们有一些二维数据  
data = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])  
  
# 设置聚类数K  
K = 2  
  
# 初始化KMeans对象  
kmeans = KMeans(n_clusters=K, random_state=0)  
  
# 对数据进行拟合和预测  
kmeans.fit(data)  
labels = kmeans.predict(data)  
centroids = kmeans.cluster_centers_  
  
# 打印聚类中心和标签  
print("Cluster centers:")  
print(centroids)  
print("Labels:")  
print(labels)  
 
# 可视化结果  
plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis')  
plt.scatter(centroids[:, 0], centroids[:, 1], c='red', s=300, alpha=0.5)  
plt.title('K-means Clustering')  
plt.xlabel('Feature 1')  
plt.ylabel('Feature 2')  
plt.show()

  从上面的运行结果中,我们知道聚类中心为(1,2)和(4,2)点,也可以将相应的点打上类别的标签,上面代码的计算结果和可视化结果如下:
在这里插入图片描述
在这里插入图片描述
  这段代码首先导入了必要的库,然后创建了一个二维数据集。接着,我们设置了聚类数K为2,并初始化了一个KMeans对象。之后,我们使用fit方法对数据进行拟合,并通过predict方法获取每个数据点的聚类标签。最后,我们打印出聚类中心和每个数据点的标签,并使用matplotlib进行可视化。

2、 简单的案例:确定K值并使用K-means算法

  假设我们有一组关于用户购买行为的数据,并希望根据这些数据对用户进行聚类。我们将使用肘部法则来确定最佳的K值。

  首先,加载数据并预处理(例如标准化或归一化):

from sklearn.datasets import make_blobs  
from sklearn.preprocessing import StandardScaler  
  
# 生成模拟数据  
X, y_true = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)  
  
# 数据标准化  
scaler = StandardScaler()  
X = scaler.fit_transform(X)

  接下来,使用肘部法则确定K值:

from sklearn.metrics import silhouette_score  
import matplotlib.pyplot as plt  
  
# 肘部法则确定K值  
distortions = []  
K = range(1, 10)  
  
for k in K:  
    kmeanModel = KMeans(n_clusters=k).fit(X)  
    distortions.append(kmeanModel.inertia_)  
  
# 绘制肘部图  
plt.plot(K, distortions, 'bx-')  
plt.xlabel('k')  
plt.ylabel('Distortion')  
plt.title('The Elbow Method showing the optimal k')  
plt.show()

  在上面的代码中,我们计算了不同K值下的畸变程度(inertia),即每个样本与其所属聚类中心的距离之和。然后,我们绘制了K值与畸变程度的曲线图。根据肘部法则,我们选择畸变程度开始趋于平稳的K值作为最佳聚类数。通过上面的代码,我们知道当K=4时,loss产生的比较大幅度变化,所以这一份数据集KMeans聚类的最优的K就选择4;
在这里插入图片描述

  一旦确定了K值,我们就可以使用K-means算法对数据进行聚类,并可视化结果:

# 使用确定的K值进行聚类  
optimal_k = 4  # 假设通过肘部法则确定的最佳K值为4  
kmeans = KMeans(n_clusters=optimal_k, random_state=0)  
kmeans.fit(X)  
labels = kmeans.labels_  
centroids = kmeans.cluster_centers_  
  
# 可视化聚类结果  
plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis')  
plt.scatter(centroids[:, 0], centroids[:, 1], c='red', s=300, alpha=0.5)  
plt.title('K-means Clustering with Optimal K')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

  在上面的代码中,我们使用之前通过肘部法则确定的最佳K值来初始化KMeans对象,并对数据进行拟合。接着,我们获取每个数据点的聚类标签和聚类中心,并使用matplotlib库将聚类结果进行可视化。
在这里插入图片描述

  通过这个案例,我们展示了如何使用sklearn库实现K-means算法,并通过肘部法则来确定最佳的聚类数K。在实际应用中,你可以根据具体的数据集和需求调整参数和可视化方法,以获得更好的聚类效果。

七、总结与展望

1、K-means聚类算法总结

  K-means聚类算法是一种无监督学习方法,通过迭代优化将数据点划分为K个不相交的子集(即聚类)。算法的核心思想是通过初始化聚类中心,然后不断迭代更新每个聚类的中心点,直至聚类结果收敛。每个数据点被分配到距离最近的聚类中心所在的聚类中,而聚类中心则是其所属聚类中所有数据点的均值。

  K-means算法的优点在于其实现简单、计算效率高,并且能够处理大规模数据集。它不需要预先定义复杂的模型,而是通过数据自身的分布特性进行聚类。此外,K-means算法对于球形或凸形的数据集聚类效果较好。

  然而,K-means算法也存在一些缺点。首先,它对于初始聚类中心的选择非常敏感,不同的初始选择可能导致截然不同的聚类结果。其次,K-means算法需要预先设定聚类数K,而选择合适的K值通常是一个挑战。此外,算法对噪声和异常值也比较敏感,因为它们可能会显著影响聚类中心的位置。

K-means算法在许多领域都有广泛的应用场景。例如,在市场营销中,它可以用于客户细分,帮助企业更好地理解不同客户群体的需求和行为模式。在图像处理中,K-means算法可以用于图像分割,将图像划分为不同的区域或对象。此外,它还可以用于生物信息学、社交网络分析等领域。

  为了优化K-means算法的性能和稳定性,研究者们提出了多种改进方法。这包括使用更好的初始聚类中心选择策略(如K-means++)、改进距离度量方式(如使用余弦相似度或曼哈顿距离)、采用加速技巧(如利用KD树或球树加速最近邻搜索),以及自适应确定聚类数K的方法(如通过轮廓系数或肘部法则确定K值)。

2、K-means聚类算法展望

  随着机器学习和大数据技术的不断发展,K-means聚类算法仍有广阔的研究和应用前景。未来,K-means算法可能会在以下几个方面得到进一步的发展:

  首先,随着深度学习技术的兴起,研究者们可能会探索将K-means算法与深度学习模型相结合,以提高聚类的准确性和鲁棒性。例如,可以利用深度学习模型提取数据的深层次特征,然后将这些特征作为K-means算法的输入进行聚类。

  其次,针对K-means算法对初始聚类中心敏感的问题,未来可能会研究更加鲁棒的初始化方法,以减少不同初始选择对聚类结果的影响。此外,研究者们还可以探索自适应确定聚类数K的方法,以更好地适应不同数据集的特点和需求。

  最后,随着数据规模的不断增大和计算资源的日益丰富,K-means算法的高效实现和并行化计算也将成为研究的重点。通过利用分布式计算平台或GPU加速技术,可以进一步提高K-means算法的处理速度和效率,使其能够更好地应对大规模数据集的挑战。

  综上所述,K-means聚类算法作为一种经典的无监督学习方法,在未来仍有很大的发展潜力和应用空间。通过不断优化和改进算法性能,我们可以期待K-means算法在更多领域发挥更大的作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/522592.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

使用Springfox Swagger实现API自动生成单元测试

目录 第一步:在pom.xml中添加依赖 第二步:加入以下代码,并作出适当修改 第三步:在application.yaml中添加 第四步:添加注解 第五步:运行成功之后,访问相应网址 另外:还可以导出…

ES学习日记(七)-------Kibana安装和简易使用

前言 首先明确一点,Kibana是一个软件,不是插件。 Kibana 是一款开源的数据分析和可视化平台,它是 Elastic stack 成员之一,设计用于和Elasticsearch 协作。您可以使用 Kibana 对 Elasticsearch 索引中的数据进行搜索,…

python文件打包找不到文件路径

引用:【将Python代码打包成exe可执行文件】 https://www.bilibili.com/video/BV1P24y1o7FY/?p4&share_sourcecopy_web&vd_sourced5811f31a0635dfc69a182c7bf1adb8b 在代码中,我们想读取文件a,一般使用如下方法。 import osdir os…

Spring Boot Mockito (三)

Spring Boot Mockito (三) 这篇文章主要是讲解Spring boot 与 Mockito 集成测试。 前期项目配置及依赖可以查看 Spring Boot Mockito (二) - DataJpaTest Spring Boot Mockito (一) - WebMvcTest Tag("Integration") SpringBootTest // TestMethodOrder(MethodOr…

安科瑞直流电表在光伏储能行业中的应用-安科瑞黄安南

双碳”背景下,储能产业站上市场风口,全球储能市场需求迅猛爆发。作为储能产业链的中游环节,系统集成商上承设备提供商,下接储能系统业主,已经成为储能行业最受关注的“焦点”。对于储能系统集成商来说,技术…

【研发日记】白话解读UDS协议(一)——19 04读取快照服务

文章目录 前言 19服务 04子服务 19 04协议 快照存储设计 快照发送设计 功能验证 分析和应用 总结 前言 近期在一个嵌入式软件开发项目中,要按照UDS标准开发相关功能,期间在翻阅UDS标准时,周围同事都说很多地方晦涩难懂。所以利用晚上…

大创项目推荐 深度学习 大数据 股票预测系统 - python lstm

文章目录 0 前言1 课题意义1.1 股票预测主流方法 2 什么是LSTM2.1 循环神经网络2.1 LSTM诞生 2 如何用LSTM做股票预测2.1 算法构建流程2.2 部分代码 3 实现效果3.1 数据3.2 预测结果项目运行展示开发环境数据获取 最后 0 前言 🔥 优质竞赛项目系列,今天…

【前端】CSS(引入方式+选择器+常用元素属性+盒模型+弹性布局)

文章目录 CSS一、什么是CSS二、语法规范三、引入方式1.内部样式表2.行内样式表3.外部样式 四、选择器1.选择器的种类1.基础选择器:单个选择器构成的1.标签选择器2.类选择器3.id 选择器4.通配符选择器 2.复合选择器1.后代选择器2.子选择器3.并集选择器4.伪类选择器 五…

一文教你配置 Tomcat 9.0.19 + Java 12.0.2,并启用 SSL——以 Windows Server 2019 平台为例

Tomcat 的运行依赖 JAVA 环境!安装的时候会让你选择 JDK 所在路径。 Linux 下的安装教程已更新: 操作系统:Windows Server 2019 Datacenter JAVA 版本:12.0.2 Tomcat 版本:9.0.19 GeoServer 版本:2.23.2 …

【机器学习入门】使用YOLO模型进行物体检测

系列文章目录 第1章 专家系统 第2章 决策树 第3章 神经元和感知机 识别手写数字——感知机 第4章 线性回归 第5章 逻辑斯蒂回归和分类 第5章 支持向量机 第6章 人工神经网络(一) 第6章 人工神经网络(二) 卷积和池化 第6章 使用pytorch进行手写数字识别 文章目录 系列文章目录前…

LeetCode-51. N 皇后【数组 回溯】

LeetCode-51. N 皇后【数组 回溯】 题目描述:解题思路一:回溯, 回溯三部曲。验证是否合法只需要检查:1.正上方;2. 左上方;3.右上方。因为是从上到下,从左到右遍历的,下方不可能有皇后。解题思路…

计算机网络基础(一)

目录 一.互联网和因特网 二.因特网的发展历程 三.因特网的功能 3.1边缘部分 3.1.1:客户服务器方式(C/S方式) 3.1.2:对等方式 3.2.核心部分 3.2.1:电路交换 3.2.2.报文交换 3.2.3:分组交换 四.计…

Python | Leetcode Python题解之第11题盛最多水的容器

题目&#xff1a; 题解&#xff1a; class Solution:def maxArea(self, height: List[int]) -> int:l, r 0, len(height) - 1ans 0while l < r:area min(height[l], height[r]) * (r - l)ans max(ans, area)if height[l] < height[r]:l 1else:r - 1return ans

基于Python的自然语言的话题文本分类(V2.0),附源码

博主介绍&#xff1a;✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&#x1f3…

Java 哈希表

一、哈希表的由来 我们的java程序通过访问数据库来获取数据&#xff0c;但是当我们对数据库所查询的信息进行大量分析后得知&#xff0c;我们要查询的数据满足二八定律&#xff0c;一般数据库的数据基本存储在磁盘当中。这使得每次查询数据将变得无比缓慢。为此我们可以将经常…

逆向案例十二——看准网企业信息json格式的信息

网址&#xff1a;【全国公司排行|排名榜单|哪家好】-看准网 打开开发者工具——刷新——网络——XHR——下滑页面加载新的页面——找到数据包 发现参数加密&#xff0c;返回的数据也进行了加密 按关键字在下方搜索 kiv进入第一个js文件 ctrlf打开文件里面的搜索框继续搜kiv找到…

多模态系列-综述Video Understanding with Large Language Models: A Survey

本文是LLM系列文章,针对《Video Understanding with Large Language Models: A Survey》的翻译。 论文链接:https://arxiv.org/pdf/2312.17432v2.pdf 代码链接:https://github.com/yunlong10/Awesome-LLMs-for-Video-Understanding 大型语言模型下的视频理解研究综述 摘要…

替换空格(替换特定字符)

&#x1f600;前言 在字符串处理中&#xff0c;经常会遇到需要替换特定字符的情况。本文将介绍一道经典的字符串替换问题&#xff1a;将字符串中的空格替换成 “%20”。我们将探讨一种高效的解决方法&#xff0c;通过倒序遍历字符串来实现原地替换&#xff0c;避免额外空间的开…

吴恩达:AI 智能体工作流

热门文章推荐&#xff1a; &#xff08;1&#xff09;《为什么很多人工作 3 年 却只有 1 年经验&#xff1f;》&#xff08;2&#xff09;《一文掌握大模型提示词技巧&#xff1a;从战略到战术巧》&#xff08;3&#xff09;《AI 时代&#xff0c;程序员的出路在何方&#xff1…

Python+Yolov8框选位置目标识别人数统计计数

程序示例精选 PythonYolov8框选位置目标识别人数统计计数 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对《PythonYolov8框选位置目标识别人数统计计数》编写代码&#xff0c;代码整洁&#…