首页HF粗排模型优化

[work@ rus_env]$ pwd
/home/work/xx/du-rus/offline-tools/du_rus/rus_env

[work@ rus_env]$

python buildenv_rus.py  5a0e771e938a486df3b8b3e1cde1a39c2006882d 5f3241963a3e39a8e1eae05d7075fc5b9278a7c7

打开日志级别

[work@xx conf]$

vim /home/work/xx/du-rus/du_rus_offline/conf/log.conf

第31行rpc.log 追加,TRACE,DEBUG

     31 RPC_SELFLEVEL : NOTICE,TRACE,DEBUG

重启服务

/home/work/xx/du-rus/du_rus_offline/bin

./server_control stop  暂停服务

./server_control start  启动服务

小流量

模型预测:506987_507013

recaller分布不变:507017_507013

source_type分布不变:506985_507013

recaller_source_type分布不变:507016_507013

对照组:507013

模块验证

前置规则(pre_process)

  1. debug信息
    postman连接测试环境,请求体中isDebug设置为true,在response中搜索homefeed_items_feature

[work@nj02-ps-wwwda13-n1.nj02.baidu.com log]$ vim /home/work/xx/du-rus/du_rus_offline/log/rpc.log

日志查询  

模型预测

 1. 无法排序资源跳过模型预测
小流量输入506987_507013
postman连接测试环境,日志中搜索"before extract_specific_sourcetype_cands cands len is" → A   日志结果为579

  

2. 日志中搜索"after extract_specific_sourcetype_cands cands len is" → B  日志结果为537

3. 日志中搜索"target_cands len is" → C
必须保证A-B=C

  


且资源的source_type为vod和news是会跳过预测,即这两种情况下日志中会出现"this item has been move to target_cands"

​4. 模型预测
小流量输入506987_507013
日志中
不会出现"model_manager->regress fail"
日志中搜索"candidate_id:"查看每个candidate的打分


排序

1. 基于模型预测/recaller分布不变的结果排序(单纯按照分数排序)小流量输入模型预测对应小流量506987_507013,查看排序前candidates

日志搜索"pre rough_ranking is"分数无序​

日志搜索"post rough_ranking is",分数一定是降序排序

2. 基于recaller_source_type分布不变507017_507013的结果排序(同recaller+source_type下的资源进行排序)

流量输入模型预测对应小流量,查看排序前candidates,日志搜索"pre rough_ranking is",同上
分数无序

日志搜索"post rough_ranking is",对应排序前和排序后资源的排序方式是同recaller+source_type下的排序
分数降序

3. 基于source_type分布不变506985_507013的结果排序(根据recaller_min_quota_conf读取每个recaller quota,保证quota内资源排序前后source_type分布不变)

小流量输入模型预测对应小流量,日志中搜索"cands len is",即输入排序模块的Candidate个数

日志中搜索"global_source_type_distribution is",查看排序前topk资源的分布

日志中搜索"top_reserve_num_candidates len is",查看排序后资源数量总和,一定保证总和和上面topk资源数量总和相同

4. 日志中搜索"check_source_type_distribution is",查看排序后topk资源的source_type分布,一定保证和排序前topk资源的分布是相同的
 

quota

1. 基于模型预测/source_type分布不变的quota配置
小流量输入模型预测对应小流量506987_507013,日志中搜索不到"in select_topk"

2. 基于recaller分布不变/recaller_source_type分布不变的quota配置   
小流量输入模型预测对应小流量,日志中搜索到"in select_topk"

测试结论

通过

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/501400.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

代码随想录算法训练营DAY11|C++栈和队列Part.2|LeetCode:20.有效的括号、 1047.删除字符串中所有相邻重复项、150.逆波兰表达式

文章目录 20.有效的括号思路CPP代码 1047.删除字符串中所有相邻重复项思路CPP代码 150.逆波兰表达式思路什么是逆波兰表达式本题的思路 CPP代码 20.有效的括号 力扣题目链接 文章链接:20.有效的括号 视频链接:LeetCode:20. 有效的括号 状态&a…

Github profile Readme实现小游戏[github自述游戏]

Github profile Readme常用于个人主页介绍,将它与action自动化流程结合,可以实现一些小游戏 例如:2048、五子棋 2048实现 losehu (RUBO) GitHub 五子棋 https://github.com/losehu/losehu/tree/main 通过python/C编写可执行文件&#xf…

搜索与图论——Prim算法求最小生成树

在最小生成树问题里&#xff0c;正边和负边都没问题 朴素版prim算法 时间复杂度O(n^2) 生成树&#xff1a;每一次选中的t点&#xff0c;它和集合的距离对应的那条边&#xff0c;就是生成树的一条边 算法流程和dijkstra算法非常相似 #include<iostream> #include<cs…

浏览器工作原理与实践--栈空间和堆空间:数据是如何存储的

对于前端开发者来说&#xff0c;JavaScript的内存机制是一个不被经常提及的概念 &#xff0c;因此很容易被忽视。特别是一些非计算机专业的同学&#xff0c;对内存机制可能没有非常清晰的认识&#xff0c;甚至有些同学根本就不知道JavaScript的内存机制是什么。 但是如果你想成…

039—pandas 不规则表头转换为规整DataFrame

使用步骤 读入数据 代码如下&#xff08;示例&#xff09;&#xff1a; import pandas as pd import numpy as np df pd.DataFrame({0: [姓名, 性别],1: [张三, 男],2: [年龄,np.nan],3: [18,np.nan]}) dfdf.values.reshape([4,2])r len(df.columns)(pd.DataFrame(df.valu…

全国产数据采集卡定制,24位八通道以太网数据采集卡 labview 100K采样

XM702是一款以太网型高速数据采集卡&#xff0c;具有8通 道真差分输入&#xff0c;24位分辨率&#xff0c;单通道最高采样率100ksps八通 道同步共计800ksps、精密前置增益放大、集成IEPE/ICP硬件 支持的特点。本产品采用了多个高精度24位ADC单元及配合本 公司多年积累开发的前置…

24.WEB渗透测试-BurpSuite关于app抓包

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 内容参考于&#xff1a; 易锦网校会员专享课 上一个内容&#xff1a;23.WEB渗透测试-BurpSuite&#xff08;二&#xff09; 方法一&#xff1a;使用模拟器&am…

时序预测 | Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测

时序预测 | Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测 目录 时序预测 | Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测&#xff08;完整源码和数据…

工作常用设计模式

设计模式分类 创建者模式&#xff08;5种&#xff09; 单例模式原型模式工厂方法模式抽象工厂模式建造者模式 结构型模式&#xff08;7种&#xff09; 代理模式适配器模式桥接模式装饰者模式外观模式享元模式组合模式 行为型模式&#xff08;11种&#xff09; 模板方法模…

qdrant

文章目录 一、关于 qdrantFeaturesFiltering and PayloadHybrid Search with Sparse Vectors Vector Quantization and On-Disk StorageDistributed DeploymentHighlighted Features Integrations 二、快速上手1、下载和运行安装 qdrant-clientdocker 2、初始化 client3、创建 …

在.Net6中用gdal实现第一个功能

目录 一、创建.NET6的控制台应用程序 二、加载Gdal插件 三、编写程序 一、创建.NET6的控制台应用程序 二、加载Gdal插件 Gdal的资源可以经过NuGet包引入。右键单击项目名称&#xff0c;然后选择 "Manage NuGet Packages"&#xff08;管理 NuGet 包&#xff09;。N…

用docker搭建的Vulfocus镜像管理界面不能同步解决办法

之前拉取的Vulfocus镜像同步功能失效&#xff0c;最简单的解决办法就是换一个能同步的版本 # 修改镜像源 sudo mkdir -p /etc/dockersudo tee /etc/docker/daemon.json <<-EOF {"registry-mirrors": ["https://dockerproxy.com/"] } EOFsudo syste…

EasyDarwin 、ffmpeg 音视频推流拉流;OBS视频推理软件、obs-rtspserver服务器

参考&#xff1a;https://blog.csdn.net/N71FS1/article/details/130019563 一、EasyDarwin ffmpeg ffmpeg 推送音视频流到rtsp流服务器 EasyDarwin 作为rtsp流服务器 &#xff08;下载&#xff1a;https://www.easydarwin.org/p/easydarwin.html&#xff09;OBS 直播音视频录…

N9010A安捷伦N9010A信号分析仪

181/2461/8938产品概述&#xff1a; Keysight N9010A EXA 信号分析仪是最大限度提高生产线吞吐量的最快方法。从测量速度到代码兼容性&#xff0c;它让每一毫秒都很重要&#xff0c;并帮助您降低总体测试成本。 我们无法预测未来&#xff0c;但安捷伦可以利用我们面向未来的测…

test7

欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C、Python、Matlab&#xff0c;机器人运动控制、多机器人协作&#xff0c;智能优化算法&#xff0c;滤波估计、多传感器信息融合&#xff0c;机器学习&#xff0c;人工智能等相关领域的知识和技术。关…

Hive on Spark 配置

目录 1 Hive 引擎简介2 Hive on Spark 配置2.1 在 Hive 所在节点部署 Spark2.2 在hive中创建spark配置文件2.3 向 HDFS上传Spark纯净版 jar 包2.4 修改hive-site.xml文件2.5 Hive on Spark测试2.6 报错 1 Hive 引擎简介 Hive引擎包括&#xff1a;MR&#xff08;默认&#xff09…

bert 适合 embedding 的模型

目录 背景 embedding 求最相似的 topk 结果查看 背景 想要求两个文本的相似度&#xff0c;就单纯相似度&#xff0c;不要语义相似度&#xff0c;直接使用 bert 先 embedding 然后找出相似的文本&#xff0c;效果都不太好&#xff0c;试过 bert-base-chinese&#xff0c;be…

浪潮信息极致存储 助力垦丰破解种子密码

近几年&#xff0c;我国育种行业迈向数字化转型新阶段&#xff0c;以北大荒垦丰种业为代表的育种企业&#xff0c;正持续通过前沿技术赋能&#xff0c;打造研发创新体系&#xff0c;为中国育种行业的高质量发展贡献力量。值得一提的是&#xff0c;在应对存储问题期间&#xff0…

Linux ssh免密登录配置

步骤 在本地机器上生成公钥和私钥对。将本地公钥复制到远程机器的~/.ssh/authorized_keys文件中。 实现1 在服务器上生成SSH密钥对 ssh-keygen -t rsa -f /home/id_rsa1ssh-keygen: 这是一个用于生成、管理和转换 SSH 密钥的 OpenSSH 工具。-t rsa: 用于指定要生成的密钥类…

Centos安装部署

Centos安装部署 linux安装JDK 下载地址&#xff1a;https://www.oracle.com/java/technologies/oracle-java-archive-downloads.html 创建文件夹&#xff0c;输入命令&#xff1a; mkdir /usr/local/jdk 查看JDK信息&#xff0c;输入命令&#xff1a; java -version 将下载的…