阅读笔记(arXiv2022)Submodularity In Machine Learning and Artificial Intelligence

次模性在机器学习和人工智能中的应用

Bilmes, J. (2022). Submodularity in machine learning and artificial intelligence. arXiv preprint arXiv:2202.00132.

本文的核心内容概述:

1. **次模函数的基本概念**:
   - 次模函数是定义在有限集合上的集合函数,具有减少回报(diminishing returns)的特性。
   - 次模函数可以是单调的,也可以是非单调的,但它们必须满足特定的次模性质。
   - 次模函数在组合优化问题中非常有用,因为它们允许在多项式时间内找到近似最优解。

2. **次模函数的性质和优化**:
   - 次模函数具有多种等价的定义,包括减少回报性质和四点性质。
   - 次模函数的优化问题,包括最大化和最小化问题,可以通过贪婪算法等方法有效求解。
   - 次模函数的连续扩展和多面体结构也被讨论,这些扩展有助于在连续空间中处理次模优化问题。

3. **次模函数在机器学习和人工智能中的应用**:
   - 次模函数在数据总结、特征选择、聚类、主动学习和概率建模等领域有广泛应用。
   - 次模函数可以用于设计核心集(coresets)和简化数据集,以便更有效地训练机器学习模型。
   - 次模优化可以用于提高算法的鲁棒性和减少数据的冗余性。

4. **历史应用和算法**:
   - 次模函数在经济学、博弈论、组合优化等领域有悠久的应用历史。
   - 文章讨论了多种次模优化算法,包括贪婪算法、Frank-Wolfe算法和Fujishige-Wolfe算法等。
   - 次模函数的学习和近似方法也被探讨,包括如何从数据中学习和构造次模函数。

5. **结论**:
   - 次模函数为机器学习领域提供了一种强大的工具,可以用于多种复杂问题的优化。
   - 次模优化的研究成果不断涌现,预示着这一领域未来将有更多的发展和应用。

正文:

0. 摘要

在本文中,我们提供了次模性和超模性及其属性的简要回顾。我们提供了大量次模性定义;许多示例次模函数及其推广的完整描述;离散约束的示例;基本算法的讨论,包括最大化、最小化和其他操作;对连续次模扩展的简要概述;以及一些历史应用。然后我们转向次模性在机器学习和人工智能中的用途,包括总结,我们提供了在自然语言处理中的抽取式和抽象式总结、数据蒸馏和凝聚、数据子集和特征选择之间的差异和共性的完整说明。我们讨论了多种生成次模函数的方法,包括启发式手工制作、学习或近似学习次模函数或其部分,并讨论了使用次模函数作为核心集生产者的一些优势。我们讨论了次模组合信息函数,以及次模性在聚类、数据划分、并行机器学习、主动和半监督学习、概率建模和结构化范数和损失函数中的用途。

1. 引言

机器学习中的许多(如果不是大多数)问题都涉及某种形式的优化。 “学习”本身的问题可以简单地看作是一个在一组参数上优化指定目标的问题,其中目标也由数据参数化。 典型的例子是 \min_{\theta}J_\theta(D),其中\theta是一个连续值参数向量,D是一个采样(训练)数据集。众所周知,凸优化是机器学习理论和许多机器学习应用中使用的重要数学策略。 许多看似不同的优化问题,如非线性分类[SS02],聚类[LG07]和降维[WPS 05]可以转换为凸规划。 当最小化凸损失函数时,我们可以保证有效地找到最优解,即使是对于大问题,也是可行的。 凸优化是内在连续优化问题空间中目标的结构性质。然而,有许多机器学习问题本质上是离散的,优化必须在离散参数空间上进行,而不是在连续参数空间上。

然而,机器学习中有许多问题本质上是离散的,其中优化必须发生在离散参数空间而不是连续参数空间上。 在这种情况下,目标提供了一个值超过可数或有限(虽然往往是指数大)的可能性。 例如,给定一组可能用作分类器输入的特征,应该如何选择有用的子集? 如果有100个特征,那么就有200个可能的子集,太多了,无法在穷举搜索中考虑所有子集。 这是机器学习中的标准特征选择问题,有许多可能的解决方案。 我们可能希望选择训练数据的一个子集,而不是选择特征。这样做的原因有很多:训练数据可能太大,或者可能是冗余的,因此使用所有数据会产生不必要的成本。一种选择是选择一个随机子集,但这可能会错过角落案例。 也许有一种更好的方法来选择在某种程度上是好的子集,即, 它保证忠实地表示所有数据。 另一个例子是人工标记和注释训练数据集,这一过程通常是昂贵,耗时,繁琐且容易出错的。 与其对所有数据进行标记,人们或许可以选择一个好的子集,在该子集上具有标签与在整体上具有标签一样好。 批量主动学习就是一个例子。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/473333.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

手机运营商二要素检测:重塑信任基石,筑牢信息安全屏障

随着移动互联网的普及和数字经济的快速发展,用户信息安全的重要性日益凸显。运营商二要素检测作为一种强大的安全验证机制,以其精准匹配与实时验证的特性,为各类应用场景提供了一种可靠的身份识别解决方案,正在成为众多企业和服务…

【Web应用技术基础】HTML(3)——表格

目录 题目1:原始表格 题目2:width、height 题目3: cellpadding 题目4:cellspacing、cellpadding 题目5:caption 题目6:rowspan 题目7:colspan 题目8:汇总题 题目1&#xff1…

Fetch、Axios 和 jQuery(Ajax) 三种常用的网络请求技术

Fetch、Axios 和 jQuery(Ajax) 是三种常用的网络请求技术,它们各自有着不同的特点和优势。本文将对这三种技术进行详细的介绍和比较,以帮助开发者更好地选择和使用合适的网络请求技术。 一、Fetch Fetch(浏览器自带) 是一种现代的网络请求 API&#xff…

Linux CentOS 7.6安装Redis 6.2.6 详细保姆级教程

1、安装依赖 //检查是否有依赖 gcc -v //没有则安装 yum install -y gcc2、下载redis安装包 //进入home目录 cd /home //通过wget下载redis安装包 wget https://download.redis.io/releases/redis-6.2.6.tar.gz //解压安装包 tar -zxvf redis-6.2.6.tar.gz3、编译 //进入解压…

CSS学习笔记:transform属性实现元素的位移、旋转、缩放

位移 实现居中的两种方法 绝对定位的盒子在父盒子中实现居中效果有两种方法 法一:margin 其中,left和top的值分别为子盒子自身宽高的一半 法二:translate 实现过渡效果 translate常常配合hover和transition使用,以实现鼠标悬停…

流畅的 Python 第二版(GPT 重译)(二)

第三章:字典和集合 Python 基本上是用大量语法糖包装的字典。 Lalo Martins,早期数字游牧民和 Pythonista 我们在所有的 Python 程序中都使用字典。即使不是直接在我们的代码中,也是间接的,因为dict类型是 Python 实现的基本部分。…

uniapp、vue2.6、H5,利用腾讯TRTC,快速跑通1v1视频功能

多人视频聊天室搭建,官网已有相关demo和案例,需要快速搭建多人聊天室直接进入以下网站: 实时音视频 Web & H5 (Vue2/Vue3)-视频通话(含 UI)-文档中心-腾讯云说明:https://cloud.tencent.com/document/…

Python 深度学习第二版(GPT 重译)(三)

七、使用 Keras:深入探讨 本章涵盖 使用 Sequential 类、功能 API 和模型子类创建 Keras 模型 使用内置的 Keras 训练和评估循环 使用 Keras 回调函数自定义训练 使用 TensorBoard 监控训练和评估指标 从头开始编写训练和评估循环 您现在对 Keras 有了一些经…

uni-app 中两个系统各自显示不同的tabBar

最近在一个uni-app项目中遇到一个需求,在登录页面成功登录以后需要判断身份,不同的身份的进入不同的tabBar页面,但是在uni-app项目中pages.json中的tabBar的list数组只有一个,且不能写成动态的,那如何实现这个需求呢?答案是需要我们自定义tabBar。 目录 1、我们确…

四、HarmonyOS应用开发-ArkTS开发语言介绍

目录 1、TypeScript快速入门 1.1、编程语言介绍 1.2、基础类型 1.3、条件语句 1.4、函数 1.5、类 1.6、模块 1.7、迭代器 2、ArkTs 基础(浅析ArkTS的起源和演进) 2.1、引言 2.2、JS 2.3、TS 2.4、ArkTS 2.5、下一步演进 3、ArkTs 开发实践…

【C语言】循环语句(语句使用建议)

文章目录 **while循环****while循环的实践****补充:if语句与while语句区别****for循环(使用频率最高)****for循环的实践****while循环和for循环的对比****Do-while循环****break和continue语句****循环的嵌套****goto语句(不常用)****循环语句的效率(来自于高质量的C/C编程书籍…

竞赛 GRU的 电影评论情感分析 - python 深度学习 情感分类

1 前言 🔥学长分享优质竞赛项目,今天要分享的是 🚩 GRU的 电影评论情感分析 - python 深度学习 情感分类 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分工作量:3分创新点:4分 这…

Excel使用VLOOKUP函数

VLOOKUP(lookup_value,table_array,col_index_num,range_lookup) 释义: lookup_value:要查找的值,包括数字,文本等 table_array:要查找的值以及预期返回的内容所在的区域 col_index_num:查找的区域的列…

mysql配置

MySQL数据库的介绍 MySQL是一个关系型数据库管理系统,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件,它是由瑞典MySQL AB 公司开发,目前属于 Oracle 旗…

拿来就能用 | ESP AI音箱方案介绍

本案例使用ESP-BOX和OpenAI API开发一款语音控制的聊天机器人(chatbot)。 猜猜我是谁?ESP AI音箱方案体验 ESP-BOX AI音箱方案介绍 本案例将介绍如何使用ESP-BOX和OpenAI API开发一款语音控制的聊天机器人。该系统可以接收用户的语音指令,将其展示在屏幕…

敏捷开发最佳实践:学习与改进维度实践案例之会诊式培养敏捷教练

自组织团队能够定期反思并采取针对性行动来提升人效,但2022年的敏捷调研发现,70%的中国企业在学习和改进方面仍停留在团队级。本节实践案例将分享“会诊式培养敏捷教练”的具体做法,突出了敏捷以人为本的学习和改进,强调了通过人员…

阿里云轻量应用服务器和ECS服务器有啥区别?2024年整理对比表

阿里云服务器ECS和轻量应用服务器有什么区别?轻量和ECS优缺点对比,云服务器ECS是明星级云产品,适合企业专业级的使用场景,轻量应用服务器是在ECS的基础上推出的轻量级云服务器,适合个人开发者单机应用访问量不高的网站…

简介:使用TensorFlow实现python简版神经网络模型

如果你想进一步深入AI编程的魔法世界,那么TensorFlow和PyTorch这两个深度学习框架将是你的不二之选。它们可以帮助你构建更加复杂的神经网络模型,实现图像识别、语音识别等高级功能。 模型原理:神经网络是一种模拟人脑神经元结构的计算模型&a…

抖音视频批量下载软件可导出视频分享链接|手机网页视频提取|视频爬虫采集工具

解锁抖音视频无水印批量下载新姿势! 在快节奏的生活中,抖音作为时下最热门的短视频平台之一,吸引着广大用户的目光。而如何高效地获取喜欢的视频内容成为了许多人关注的焦点。Q:290615413现在,我们推出的抖音视频批量下载软件&…

【概念】神马是分布式?

SueWakeup​​​​​ 个人主页:SueWakeup 系列专栏:学习Java框架 个性签名:保留赤子之心也许是种幸运吧 本文封面由 凯楠📷 友情赞助播出! 目录 前言 1. 系统架构的演变 2. SOA 与微服务的关系 3. 分布式核心知识…