【推荐系统】MMOE笔记 20231126

【推荐系统】MMOE笔记 20231126

article2025/3/7 11:09:34/文章来源:https://blog.csdn.net/weixin_31866177/article/details/134629130

paper阅读

任务差异带来的固有冲突实际上会损害至少某些任务的预测，特别是当模型参数在所有任务之间广泛共享时。（在说ESMM）

共享底层参数可以减少过拟合风险，但是会遇到任务差异引起的优化冲突，因为所有任务都需要在共享底层上使用相同的参数。（在说ESMM）

对于任务是否相关，MMOE不敏感，而ESMM和OMOE很敏感。
在两个任务相同的极端情况下，MMoE 模型和 OMoE 模型的性能几乎没有差异；
当任务之间的相关性降低时，OMoE 模型的性能明显下降，而对 MMoE 模型的影响很小。

5.2 Trainability

探讨MMOE是否容易训练。举了个例子，认为比普通 RNN 表现更好的一些门控 RNN 模型（如 LSTM 和 GRU）只是更容易训练，而不是具有更好的模型能力。

6.2 mmoe可以调整的参数
MMOE：Number of experts, number of hidden units per expert（专家数量，每个专家的隐藏单元数量）
利用验证集中，主要任务的AUC来做参数调整。

实验部分

table1的解释
鉴于任务相关性（通过皮尔逊相关性粗略测量）在两组中都不是很强，共享底部模型几乎总是多任务模型中最差的（张量因子化除外）。 L2-Constrained 和 Cross-Stitch 对于每个任务都有单独的模型参数，并添加了如何学习这些参数的约束，因此比 Shared-Bottom 表现更好。

然而，对模型参数学习的约束很大程度上依赖于任务关系假设，这不如 MMoE 使用的参数调制机制灵活。因此，MMoE 在第 2 组中的所有方面都优于其他多任务模型，其中任务相关性甚至比第 1 组更小。
？？？皮尔逊相关系数越大越相关？是越大越相关。
那不是group2更相关吗？

单任务可以对辅助任务进行单独调参，所以辅助任务在多任务中没有单任务效果好，这种情况也会发生。

table4 说明

参与度（黏性）任务样本多，满意度任务样本少。

table4说明MMOE可以在大幅提高满意任务的同时，还能轻微调整参与任务，在置信区间水平为95%时。

indicates confidence interval level 95% 表示置信区间水平为95%

而esmm在提高满意度（辅助任务）时，会降低参与任务（主要任务）的指标。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/197859.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

Django二转Day02

Django二转Day02

http #1 http 是什么#2 http特点#3 请求协议详情 -请求首行---》请求方式，请求地址，请求协议版本 -请求头---》key:value形式 -referer：上一次访问的地址 -user-agenet：客户端类型 -name&#x…

阅读更多...

JSP迭代标签之 forEach循环标签基本使用讲解

JSP迭代标签之 forEach循环标签基本使用讲解

好之前我们讲完了我们的条件动作标签那么我们来继续说迭代标签所谓迭代就是将某个主体循环多次也可以循环集合对象 map 这个标签叫 forEach items 就是我们要循环的数据注意这里操作的也是域对象中的值 begin 开始说例如 i 0;i<x;i begin 就是开始数当前…

阅读更多...

1.Spring源码解析-ClassPathXmlApplicationContext

1.Spring源码解析-ClassPathXmlApplicationContext

此类是读取spring的xml配置文件并解析。也是源码入口之一。我们调试即将开始。传递给父类设置值经调试我们得到是给AbstractApplicationContext设置默认的应用上下文父级的值，很明显是空给父类AbstractRefreshableConfigApplicationContext设置属性刷新容器…

阅读更多...

AMESim|学习记录

AMESim|学习记录

此文记录AMESim学习过程中的各种情况。目录 01 王佳. AUV 浮力调节系统设计及控制策略研究[D]. 天津大学, 2017.01 王佳. AUV 浮力调节系统设计及控制策略研究[D]. 天津大学, 2017. 01 王佳. AUV 浮力调节系统设计及控制策略研究[D]. 天津大学, 2017. 开始步入正文 01 王佳.…

阅读更多...

Open AI宫斗始末：董事会开除CEO再复职，这场闹剧终于结束了！

Open AI宫斗始末：董事会开除CEO再复职，这场闹剧终于结束了！

老哥们，作为一名在科技圈吃瓜前线的程序员，这几天open ai的瓜都吃到了吗？反转反转再反转，堪称职场版的《甄嬛传》！ 惊呆了，CEO被解雇又回归…… 在梳理open ai时间线之前，给大家先介绍一下这个…

阅读更多...

C++基础 -9- 函数的默认参数

C++基础 -9- 函数的默认参数

函数默认格式(图片代码段呈现) #include "iostream"using namespace std;void rlxy(int a100) {cout << a << endl; }int main() {rlxy();rlxy(99); }函数默认参数注意事项函数的默认参数从左开始推导错误写法正确写法

阅读更多...

029 - STM32学习笔记 - ADC（三）独立模式单通道DMA采集

029 - STM32学习笔记 - ADC（三）独立模式单通道DMA采集

029 - STM32学习笔记 - 单通道DMA采集（三） 单通道ADC采集在上节中学习完了，这节在上节的内容基础上，学习单通道DMA采集。程序代码以上节的为基础，需要删除NVIC配置函数、中段服务子程序、R_ADC_Mode_Config()函数中使能…

阅读更多...

UE 事件分发机制 day9

UE 事件分发机制 day9

观察者模式原理观察者模式通常有观察者与被观察者，当被观察者状态发生改变时，它会通知所有的被观察者对象，使他们能够及时做出响应，所以也被称作“发布-订阅模式”。总得来说就是你关注了一个主播，主播的状态改变会通…

阅读更多...

Osg线程模型（选择不当，会引发崩溃）

Osg线程模型（选择不当，会引发崩溃）

来自《最长的一帧》

阅读更多...

西南科技大学C++程序设计实验二（类与对象一）

西南科技大学C++程序设计实验二（类与对象一）

C++最大的特点就是面向对象，掌握它的几种基本性质还是好理解的，可以看我C++专栏的期末速成，希望对你们学习C++有帮助。一、实验目的 1.理解简单类的定义、说明与使用 2.理解类中不同属性数据成员的访问特点 3.理解构造函数、析构函数的作用重点：掌握类的定义与实现，…

阅读更多...

成为AI产品经理——模型评估指标

成为AI产品经理——模型评估指标

目录一、模型评估分类 1.在线评估 2.离线评估二、离线模型评估 1.特征评估 ① 特征自身稳定性 ② 特征来源稳定性 ③ 特征成本 2.模型评估 ① 统计性评估覆盖度最大值、最小值分布形态 ② 模型性能指标分类问题回归问题 ③ 模型的稳定性模型评估指标分…

阅读更多...

Java高级技术（反射：获取类）

Java高级技术（反射：获取类）

一，认识反射二， 反射第一步三，案例

阅读更多...

数据库的增删查改（CRUD）基础版

数据库的增删查改（CRUD）基础版

CRUD: create增加、retrieve查询、update更新、delete删除注意一点：MySQL对大小写是不敏感的目录新增（create） 全列插入指定列插入多行插入查询（Retrieve） 列查询全列查询指定列查询表达式查询 …

阅读更多...

$【问题解决！】OSError: [WinError 1455] 页面文件太小，无法完成操作。Error loading “c:\Anaconda3\lib$

【问题解决！】OSError: [WinError 1455] 页面文件太小，无法完成操作。Error loading “c:\Anaconda3\lib

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录问题描述问题原因二、解决方法问题描述在使用pytorch跑深度学习的时候报错OSError: [WinError 1455] 页面文件太小，无法完成操作。Error loading “c…

阅读更多...

vivado产生报告阅读分析27

vivado产生报告阅读分析27

1、设计 QoR 汇总命令行选项 -qor_summary 可用于为流程中每个步骤生成 QoR 汇总信息。该选项只能从 Tcl 控制台使用。该选项可按两种格式生成： 基于文本的报告或 JSON 格式。要生成基于文本的格式 ， 请运行以下命令 ： report_des…

阅读更多...

0005Java程序设计-ssm基于微信小程序的校园求职系统

0005Java程序设计-ssm基于微信小程序的校园求职系统

文章目录摘要目录系统设计开发环境编程技术交流、源码分享、模板分享、网课分享企鹅🐧裙：776871563 摘要随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据…

阅读更多...

小白必知：AIGC 和 ChatGPT 的区别

小白必知：AIGC 和 ChatGPT 的区别

原文 ： https://openaigptguide.com/chatgpt-aigc-difference/ AIGC 和 ChatGPT 都是人工智能技术，但它们的功能和应用场景不同。 AIGC（AI-GeneratedContent，人工智能自动生成内容）是人工智能、计算机图形学和深度学…

阅读更多...

dbvisual editor 显示中文乱码

dbvisual editor 显示中文乱码

打开如下的页面就可以选择中文相关的字体就可以正常显示中文了。

阅读更多...

spring-boot对rabbitMQ的操作

spring-boot对rabbitMQ的操作

一、安装rabbitMQ 1、直接使用docker拉取镜像 docker pull rabbitmq:3.82、启动容器 docker run \-e RABBITMQ_DEFAULT_USERadmin \-e RABBITMQ_DEFAULT_PASS123456 \-v mq-plugins:/plugins \--name rabbit01 \--hostname rabbit01 --restartalways \-p 15672:15672 \-p 5672:…

阅读更多...

11-28渗透

11-28渗透

用nmap扫描靶机1进行主机发现已知靶机1的主机在172.16.17.0/24下扫描结果如下根据扫描结果看开启的服务怀疑172.16.17.177是靶机1 浏览器访问172.16.17.177页面得到如下我们知道织梦cms系统默认管理路径是dede，登陆管理后台可以通过地址172.16.17.177/dede/i…

阅读更多...

最新文章