推荐系统,“广告Match底层技术”中的名词(TDM、HNSW、PQ)

召回:匹配

TDM:"树状深度模型"(Tree-based Deep Model),是一种结合了树状结构和深度学习的模型,主要用于解决大规模推荐系统中的候选项生成(candidate generation)问题。在推荐系统中,候选项生成是一个关键步骤,其目的是从庞大的物品集合中快速有效地筛选出一小部分与用户可能感兴趣的物品

TDM 的核心功能和特点包括:

  1. 大规模候选项筛选:TDM 能够处理数百万甚至数十亿级别的物品库存,有效地从中筛选候选项。

  2. 结合树状结构和深度学习:TDM 使用树状结构来组织物品,通过层级分解的方式将大规模的推荐问题转化为一系列局部的二分类问题。每个节点在树中代表一组物品,而深度学习模型则用于评估用户对这些物品组的兴趣

  3. 高效性和准确性:通过这种结构,TDM 不仅提高了计算效率(因为在树的高层可以快速过滤掉大量不相关的物品),同时也保持了推荐的准确性(通过在树的低层进行更细致的筛选)。

  4. 动态更新:TDM 支持动态更新,能够适应用户兴趣的变化以及新物品的加入。

  5. 适用于复杂特征:TDM 能够处理各种类型的用户和物品特征,包括用户的历史行为、物品的属性等。

HNSW 检索图:来源于“【TPAMI 2020】Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs”,HNSW(分层导航式小世界)检索图是一种用于高效相似性搜索的数据结构,尤其适用于在大规模数据集中查找最近邻(nearest neighbors)。这种方法是基于“小世界”网络的概念,其中任意两个节点可以通过相对较短的路径相互连接。HNSW 利用这个概念来加速搜索过程,通过构建多层索引结构来优化路径寻找过程。

在 HNSW 中,数据被组织成多层结构,每一层都是一个图,图中的节点代表数据点。顶层图包含较少的节点,可以快速遍历,而底层图包含所有数据点。搜索时,首先在顶层图中找到最接近查询点的节点,然后逐层向下,每层都更精确地搜索直到达到底层。

HNSW 的关键特点包括:

  1. 分层结构:通过多层索引结构,从宏观到微观逐步缩小搜索范围。
  2. 效率和准确性的平衡:相比其他近似最近邻搜索算法,HNSW 在效率和准确性之间取得了很好的平衡。
  3. 适应大规模数据集:特别适用于高维数据和大规模数据集的情况。

HNSW 检索图因其出色的性能和灵活性,在机器学习和数据检索领域被广泛应用。

Product Quantization:向量量化PQ

降低内存使用量:128维 --> 8维

丢失很多的信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/238043.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

多种DC电源模块的比较和评价

多种DC电源模块的比较和评价 BOSHIDA DC电源模块是一种重要的电子零件,可以将交流电转换为直流电,并为相应的电路提供所需的电能。随着技术的进步,市场上的DC电源模块种类越来越多,不同类型的DC电源模块有着不同的特点和优缺点。 …

数据结构-05-跳表SkipList

1-什么是跳表 跳表SkipList是一种随机化的数据结构,基于并联的链表,实现简单,插入、删除、查找的复杂度均为 O(logN)(大多数情况下,因为是实现上是概率问题),因为其性能匹敌红黑树且实现较为简单…

jetpack compose 学习(-)

年底了,无聊的时间总是缓慢的,找个事情做一做,打发打发时间,刚好看到jetpack compose 学习学习,毕竟androidStudio 默认创建的项目都带上了这个,学习网站:https://developer.android.com/jetpack/compose/modifiers?hlzh-cn 1. 首先androidStudio创建一个新项目 喜欢kotlin的,…

面向工业物联网的5G机器学习研究综述

源自:信息与控制 作者:柴浩轩 金曦 许驰 夏长清 摘 要 随着计算机技术不断应用于工业物联网,工业系统中的数据传输愈加需要支持高实时、高可靠、高带宽以及海量连接的特性。传统的网络已经无法满足这些需求,5G网络因其高速率…

ASO优化之如何在应用商城突围

再好的内容没有营销也很难成功。评判一个APP是否在应用市场获得关注的一个重要标准就是下载量。但是,光被人发现你的APP应用是没有用的,还要精确定位有需要的目标群体才能更好的推销出去。在制定合适的优化策略的,一定要对市场行情有一个比较…

C# 图解教程 第5版 —— 第18章 泛型

文章目录 18.1 什么是泛型18.2 C# 中的泛型18.3 泛型类18.3.1 声明泛型类18.3.2 创建构造类型18.3.3 创建变量和实例18.3.4 使用泛型的示例18.3.5 比较泛型和非泛型栈 18.4 类型参数的约束18.4.1 Where 子句18.4.2 约束类型和次序 18.5 泛型方法18.5.1 声明泛型方法18.5.2 调用…

青少年CTF-Misc(持续更新中)

FLAG:当觉得自己很菜的时候,就静下心来学习 专研方向:Web安全,CTF 每日emo:听一千遍反方向的钟,我们能回到过去吗? 1.StegoTXT: 解压缩文件。发现字母中存在覆盖。使用0宽隐写在线解密得到flag…

Slate基础使用说明

目录 Slate基础使用说明 1. 简单教程 2. 要点说明 2.1 TCommands以及TCommands基类 2.2 FUICommandInfo 2.3 FUICommandList 2.4 FUIAction 2.5 UICommand 3. 代码源码 4. 工具使用 4.1 Display Ul Extension Points 4. 参考文章 Slate基础使用说明 1.…

设计模式02创建者模式

创建者模式 参考网课:黑马程序员Java设计模式详解 博客笔记 创建型模式的主要关注点是“怎样创建对象?”,它的主要特点是“将对象的创建与使用分离”。 这样可以降低系统的耦合度,使用者不需要关注对象的创建细节。 创建型模式分为&#…

下一代Wi-Fi技术:Wi-Fi 7(IEEE 802.11be EHT)

文章目录 Wi-Fi 7名词解释Wi-Fi 7的产生背景Wi-Fi 7的发布时间Wi-Fi 7的技术优势Wi-Fi 7 vs Wi-Fi 6Wi-Fi 7支持的新特性支持最大320MHz带宽引入更高阶的4096-QAM调制技术MIMO 1616引入Multi-Link多链路机制Multi-RUPreamble Puncturing Wi-Fi 7的应用场景推荐阅读 Wi-Fi 7名词…

DevEco Studio 生成HPK文件

DevEco Studio 生成HPK文件 一、安装环境 操作系统: Windows 10 专业版 IDE:DevEco Studio 3.1 SDK:HarmonyOS 3.1 二、生成HPK文件 生成的HPK文件存放在entry文件夹下。下图是未生成HPK的样式。 生成HPK:菜单Build->Build Hap(s)/APP(s)->Build Hap(s)…

Python使用分段函数拟合数据

Python使用分段函数拟合数据 前言前提条件相关介绍实验环境使用分段函数拟合数据代码实现输出结果 前言 由于本人水平有限,难免出现错漏,敬请批评改正。更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏…

HCIA-H12-811题目解析(3)

1、【单选题】 以下关于路由器的描述,说法错误的是? 2、【单选题】某网络工程师在输入命令行时提示如下信息:Error:Unrecognized command foun at position.对于该提示信息说法正确的是? 3、【单选题】如下图所示的网络&#xf…

Vue3-03-reactive() 响应式基本使用

reactive() 的简介 reactive() 是vue3 中进行响应式状态声明的另一种方式; 但是,它只能声明 【对象类型】的响应式变量,【不支持声明基本数据类型】。reactive() 与 ref() 一样,都是深度响应式的,即对象嵌套属性发生了…

数据科学工作的20个Pandas函数(备忘)

Pandas 是数据科学社区中使用最广泛的库之一,它是一个强大的工具,可以进行数据操作、清理和分析。 本文将提供最常用的 Pandas 函数以及如何实际使用它们的样例。我们将涵盖从基本数据操作到高级数据分析技术的所有内容,到本文结束时&#xf…

还在为论文焦虑?免费AI写作大师帮你三分钟搞定

先来看1分钟的视频,对于要写论文的你来说,绝对有所值! 还在为写论文焦虑?免费AI写作大师来帮你三步搞定 第一步:输入关键信息 第二步:生成大纲 稍等片刻后,专业大纲生成(由于举例&am…

WPS没保存关闭了怎么恢复数据?3个方法,完成数据恢复!

“我今天在使用WPS时,突然有点急事出去了一趟,但是我忘记保存文档了,回来之后发现电脑自动关机了,我的文档也没了!这可怎么办呢?有什么办法可以找回这些数据吗?” 在快节奏的工作中,…

PyQt6 表单布局Form Layout (QFormLayout)

锋哥原创的PyQt6视频教程: 2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~共计43条视频,包括:2024版 PyQt6 Python桌面开发 视频教程(无废话版…

Phong vs. BRDF

在深入探讨 BRDF 和照明模型的概念之前,我们将介绍一种用于模拟有光泽(glossy)表面(例如塑料球)外观的技术。 从那里开始,推广该技术将变得更加容易,这就是 BRDF 和照明或反射模型概念的全部内容…

mysql:用SHOW COLUMNS FROM显示一个表的列信息

可以使用命令SHOW COLUMNS FROM table_name;显示一个表的列信息,例如: