机器学习中线性回归和逻辑回归:
机器学习的分类:
监督学习和无监督学习,半监督学习
监督学习(Supervised Learning):
监督学习是一种利用带有标签(标记)的数据进行训练的机器学习方法。
在监督学习中,训练数据包含输入样本和对应的标签(预期输出)。
学习的目标是通过训练数据构建一个模型,该模型能够对新的未标记数据进行预测或分类。
监督学习的典型应用包括分类(如垃圾邮件识别)和回归(如房价预测)等。
无监督学习(Unsupervised Learning):
无监督学习是一种在没有标签(标记)的数据中发现模式和结构的机器学习方法。
在无监督学习中,训练数据只包含输入样本,没有相应的标签或预期输出。
学习的目标是从数据中推断出隐藏的结构、关系或规律。
无监督学习的典型应用包括聚类(将数据划分为类别)、降维(减少数据的维度)和关联规则挖掘等。
我们学到的例子是对花的分类,具体过程如下:
1,加载数据。我们用到了鸢尾花(Iris)数据集,这是机器学习和统计学中一个经典的数据集。该数据集包含 5 个属性下的 150 条记录 - 花瓣长度、花瓣宽度、萼片长度、萼片宽度和类别(物种)。
2,分析和可视化数据集。将 75% 的行数据及对应标签作为训练集,剩下 25% 的数据及其标签作为测试集。训练集与测试集的分配比例可以是随意的,但使用 25% 的数据作为测试集是很好的经验法则。(存在标签,是监督学习),重点(利用伪随机数生成器将数据集打乱。)。绘制训练集中特征的散点图矩阵。数据点的颜色与鸢尾花的品种相对应。
3,模型训练。
4,做出预测。
5,评估模型。这里需要用到之前创建的测试集。这些数据没有用于构建模型,但我们知道测试集中每朵鸢尾花的实际品种。因此,我们可以对测试数据中的每朵鸢尾花进行预测,并将预测结果与标签(已知的品种)进行对比。我们可以通过计算精度(accuracy)来衡量模型的优劣,精度就是品种预测正确的花所占的比例。
线性回归:处理数值问题,最后预测结果是数字,例如房价。
逻辑回归:属于分类问题,预测结果是离散分类,监督学习,在统计概率过程中是回归,最后判断决定概率值是分类。如上述的花的分类。
语义网络表示不多说,注意ISA和AKO的用处,分别是isa和a kind of。注意隐晦的表达,孙老师包含两个信息,孙老师(语义网络主题)ISA老师(属性)。
归结法证明,细节之一是量词辖域 :
证明B是A的逻辑结论,是要将B取反然后和A进行或运算,如果结果是永真,即证明完成。
以这个为例:
第一步是取消蕴含式符号,第二步是减少否定符号的辖域。实行变量标准化,用w来更新变量。然后消去存在量词,化为前束式。化为合取范式。消去全称量词和连接词。