(二)当人工智能是一个函数,函数形式怎么选择?ChatGPT的函数又是什么?

在上一篇文章中,我们通过二次函数的例子,讲解了如何训练人工智能。今天,让我们进一步探讨:面对不同的实际问题,应该如何选择合适的函数形式?

一、广告推荐系统中的函数选择

1. 业务目标

想象一下,你正在刷抖音,突然看到一个运动鞋的广告。巧的是,你最近正在对比各种跑鞋,这个广告简直像是读懂了你的心!这就是智能广告推荐系统的魔力。

广告推荐的核心目标是:

  • 向用户推送最适合的广告
  • 提高广告点击率
  • 最大化广告收益

2. 数据输入(特征工程)

A. 用户基础属性
  • 人口统计学特征
    • 年龄
    • 性别
    • 地理位置
    • 职业
    • 收入水平
# 用户基础属性示例
import pandas as pd

user_base_features = {
    'user_id': ['u001', 'u002', 'u003'],
    'age': [25, 35, 28],
    'gender': ['F', 'M', 'F'],
    'location': ['北京', '上海', '广州'],
    'occupation': ['学生', '工程师', '设计师']
}

df_user = pd.DataFrame(user_base_features)
print("用户基础特征示例:")
print(df_user)
B. 用户行为特征
  • 历史互动数据
    • 最近30天点击的品类
    • 最近7天的购买记录
    • 收藏的商品类型
    • 停留时长

请添加图片描述

C. 广告特征
  • 广告属性
    • 商品类别
    • 价格区间
    • 品牌信息
    • 广告创意类型(图片/视频)
    • 历史点击率

3. 函数选择:Logistic回归(LR)

A. 为什么选择LR?
  • 输出范围在[0,1]之间,完美契合概率预测
  • 计算速度快,适合在线服务
  • 模型可解释性强
B. 函数形式
def logistic_function(x, weights):
    """
    x: 输入特征向量
    weights: 模型权重
    返回: 点击概率
    """
    z = np.dot(x, weights)
    probability = 1 / (1 + np.exp(-z))
    return probability

请添加图片描述

C. 实际应用示例

请添加图片描述

4. 函数输出

  • 预测值:用户点击广告的概率(0~1之间的数值)
  • 实际应用:
    • 概率 > 0.7:优先推荐
    • 0.3 < 概率 < 0.7:次优推荐
    • 概率 < 0.3:不推荐

在这里插入图片描述

5. 效果评估

  • 在线指标:
    • CTR(点击率)
    • CVR(转化率)
    • ROI(投资回报率)
  • 离线指标:
    • AUC
    • Log Loss

在这里插入图片描述

这样的广告推荐系统就像一个智能客服,它通过分析用户的各种特征和行为,预测用户对不同广告的兴趣程度,从而实现精准推送,既提升了用户体验,也最大化了广告收益。

二、人脸识别中的函数选择

2.1 人脸识别要解决什么问题?

想象你走进一个高科技大厦,门禁系统的摄像头对准你的脸:

  • 0.1秒后,门开了:“张先生,早上好!”
  • 系统刚刚做了什么?它解决了"这个人是谁?"的问题

本质上,人脸识别就是一个函数,输入是"一张人脸照片",输出是"这个人的身份"。

2.2 输入:人脸图像数据

2.2.1 原始输入
  • 一张普通的人脸照片
  • 数据格式:224×224×3的像素矩阵
    • 224×224:图片的宽和高
    • 3:RGB三个颜色通道
2.2.2 输入预处理

就像你拍证件照时,摄影师会要求你"正对镜头"、"不要歪头"一样,原始照片需要标准化处理:

  • 人脸检测:找到照片中的人脸区域
  • 人脸对齐:调整人脸角度,使其正对镜头
  • 尺寸统一:缩放到224×224像素
  • 像素归一化:将0-255的像素值转换为0-1之间

2.3 函数:深度卷积神经网络(CNN)

2.3.1 CNN如何工作?

想象你在认人时的过程:

  • 先看整体轮廓(是胖是瘦)
  • 再看局部特征(眼睛大小、鼻子形状)
  • 最后综合判断(这是张三!)

CNN就是模仿这个过程的数学函数:

  • 卷积层:提取局部特征(眼睛、鼻子、嘴巴等)
  • 池化层:抓住重要特征(眼睛很大、鼻子很挺等)
  • 全连接层:综合判断,生成"身份证"(特征向量)

2.4 输出:身份特征向量

2.4.1 特征向量
  • 一个512维的数值数组
  • 每个数值代表一个抽象的人脸特征
  • 可以理解为人脸的"数字指纹"
2.4.2 身份判断
  • 计算特征向量之间的相似度
  • 如果相似度超过阈值(如0.8),则认为是同一个人

2.5 整体流程总结

人脸识别 = 特征提取函数 + 相似度比较

  1. 输入:224×224×3的人脸图片
  2. 函数处理:
    • CNN提取特征
    • 生成512维特征向量
  3. 输出:
    • 与数据库中的特征向量比较
    • 找到最相似的人脸
    • 返回身份信息

就像每个人的指纹都是独一无二的,CNN会为每个人的脸生成独特的"数字指纹",通过比对这些"指纹"来识别身份。这就是人脸识别的核心原理!

三、ChatGPT的函数又是什么?

3.1 ChatGPT要解决什么问题?

想象你在和一个无所不知的朋友聊天:

  • “帮我写一个请假条”
  • “解释下量子力学的基本原理”
  • “给我的短篇小说提些修改建议”

ChatGPT就是要解决"如何像人类一样理解和生成文本"的问题。本质上,它是一个复杂的函数,输入是"用户的问题或需求",输出是"连贯且符合上下文的回答"。

在这里插入图片描述

3.2 输入:文本序列

3.2.1 基本输入形式
  • 自然语言文本
  • 可以包含多轮对话历史
  • 支持多种语言
  • 可以包含代码、数学公式等特殊格式

在这里插入图片描述

3.2.2 输入预处理
  • 文本标准化
  • 分词(Tokenization)
  • 添加特殊标记(如开始符、结束符)
  • 转换为模型可理解的数字序列

在这里插入图片描述

3.3 函数:Transformer架构

3.3.1 核心组件
  • 注意力机制(Attention):理解单词之间的关系
  • 自注意力层:捕捉上下文信息
  • 前馈神经网络:处理特征转换

3.3.2 工作流程

  1. 输入编码:将文本转换为向量
  2. 多头注意力:同时关注多个特征维度
  3. 特征处理:通过多层转换提取深层特征
  4. 输出生成:逐个生成输出词汇

3.4 输出:生成的文本序列

3.4.1 输出形式
  • 自然语言回答
  • 代码片段
  • 创意写作
  • 格式化文档
3.4.2 输出特点
  • 上下文连贯性
  • 语法正确性
  • 逻辑合理性
  • 风格一致性

3.5 整体流程总结

ChatGPT = 超级语言理解函数 + 智能文本生成器

  1. 输入处理:

    • 用户输入文本
    • 分词和编码
    • 添加位置编码
  2. 函数处理:

    • 注意力计算
    • 上下文理解
    • 特征提取
    • 知识应用
  3. 输出生成:

    • 词语概率预测
    • 序列解码
    • 文本生成

ChatGPT就像一个超级对话助手,它通过复杂的Transformer架构,将我们的输入文本转化为有意义的回答。这个过程就像是一个超级翻译官,不仅要理解我们说什么,还要用最恰当的方式回答我们的问题!

总结

选择合适的函数形式是AI工程中的关键步骤。我们需要:

  1. 深入理解问题本质
  2. 权衡不同模型特点
  3. 考虑工程实现约束

记住:没有最好的函数形式,只有最适合的选择!

参考资料

[1] 推荐系统中的CTR预估模型详解 (https://zhuanlan.zhihu.com/p/35465875). 知乎专栏.

[2] 特征工程:从理论到实践 (https://zhuanlan.zhihu.com/p/105912713). 知乎专栏.

[3] Logistic回归原理与应用 (https://blog.csdn.net/qq_22210253/article/details/104452244). CSDN博客.

[4] Logistic回归的直观理解与实现 (https://zhuanlan.zhihu.com/p/111725866). 知乎专栏.

[5] 广告推荐系统中的机器学习模型 (https://www.jianshu.com/p/5a6e5e7b0d7c). 简书.

[6] 推荐系统性能评估指标详解 (https://blog.csdn.net/wangweiwei1992/article/details/103724165). CSDN博客.

[7] 人脸识别技术综述 (https://zhuanlan.zhihu.com/p/144576990). 知乎专栏.

[8] 深度学习中的图像预处理 (https://zhuanlan.zhihu.com/p/49785817). 知乎专栏.

[9] 人脸检测与对齐技术解析 (https://blog.csdn.net/qq_34337272/article/details/103005027). CSDN博客.

[10] 卷积神经网络(CNN)的原理与应用 (https://zhuanlan.zhihu.com/p/37065752). 知乎专栏.

[11] 深度学习在身份识别中的应用 (https://blog.csdn.net/qq_43557591/article/details/113302566). CSDN博客.

[12] 人脸识别中的特征向量与相似度计算 (https://zhuanlan.zhihu.com/p/34267502). 知乎专栏.

[13] ChatGPT:从原理到应用 (https://zhuanlan.zhihu.com/p/588257865). 知乎专栏.

[14] NLP中的文本预处理技术详解 (https://zhuanlan.zhihu.com/p/101264285). 知乎专栏.

[15] 图解Transformer:注意力机制的核心 (https://jalammar.github.io/illustrated-transformer/). Jalammar博客.

[16] Transformer在NLP中的应用 (https://zhuanlan.zhihu.com/p/54503186). 知乎专栏.

[17] GPT模型的文本生成原理 (https://zhuanlan.zhihu.com/p/484713322). 知乎专栏.


下期预告:我们将深入探讨如何训练这些不同形式的函数。敬请期待!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/948904.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

“知识图谱AI教学辅助系统:点亮智慧学习的新灯塔

嘿&#xff0c;各位教育界的小伙伴们&#xff01;今天咱们来聊聊一个超级有料的话题——知识图谱AI教学辅助系统。想象一下&#xff0c;如果有一个智能导师能根据你的需求定制专属的学习路径&#xff0c;还能像百科全书一样随时解答疑问&#xff0c;是不是感觉学习变得更高效、…

Linux C编程——文件IO基础

文件IO基础 一、简单的文件 IO 示例二、文件描述符三、open 打开文件1. 函数原型2. 文件权限3. 宏定义文件权限4. 函数使用实例 四、write 写文件五、read 读文件六、close 关闭文件七、Iseek 绍 Linux 应用编程中最基础的知识&#xff0c;即文件 I/O&#xff08;Input、Outout…

Flink源码解析之:Flink on k8s 客户端提交任务源码分析

Flink on k8s 客户端提交任务源码分析 当我们需要在代码中提交Flink job到kubernetes上时&#xff0c;需要如何做呢&#xff1f;要引入什么第三方依赖&#xff1f;需要提供什么内容&#xff1f;flink是如何将job提交到k8s上的&#xff1f;经过了什么样的流程&#xff0c;内部有…

kubernetes学习-Service

kubernetes学习-Service 1. Service说明2. 功能3.Service类型3.1 NodePort3.1.1 创建web-service.yaml3.1.2 创建web-pod.yaml3.1.3 部署3.1.4 验证 3.2 ClusterIP3.2.1 创建web-clusterIp-service.yaml3.2.2 创建web-clusterIp-pod.yaml3.2.3 部署3.2.4 验证 3.3 LoadBalancer…

使用WebSocket 获取实时数据

回车发送数据&#xff0c;模拟服务器发送数据 效果图&#xff1a; 源码&#xff1a; <template><div><h1>WebSocket 实时数据</h1><input type"text" v-model"ipt" keyup.enter"sendMessage(ipt)"><div v-if…

NeurIPS 2024 | SHMT:通过潜在扩散模型进行自监督分层化妆转移(阿里,武汉理工)

当前的妆容转移技术面临两个主要挑战&#xff1a; 缺乏成对数据&#xff0c;导致模型训练依赖于低质量的伪配对数据&#xff0c;从而影响妆容的真实感&#xff1b; 不同妆容风格对面部的影响各异&#xff0c;现有方法难以有效处理这种多样性。 今天给大家介绍的方法是由阿里联…

Mongo高可用架构解决方案

Mongo主从复制哪些事(仅适用特定场景) 对数据强一致性要求不高的场景,一般微服务架构中不推荐 master节点可读可写操作,当数据有修改时,会将Oplog(操作日志)同步到所有的slave节点上。那么对于从节点来说仅只读,所有slave节点从master节点同步数据,然而从节点之间互相…

JVM对象内存分配

1 栈上分配 栈空间随着方法执行完毕而回收通过栈上分配对象内存空间的方式&#xff0c;减少对堆空间的使用&#xff0c;从而减少gc的压力&#xff0c;提升程序性能 逃逸分析&#xff1a;分析对象的作用域&#xff0c;判断对象所需内存是否可以在栈上分配当对象没有被外部方法或…

性能测试04|JMeter:连接数据库、逻辑控制器、定时器

目录 一、连接数据库 1、使用场景 2、直连数据库的关键配置 3、案例 ​编辑 二、逻辑控制器 1、if控制器 2、循环控制器 3、ForEach控制器 三、定时器 1、同步定时器 2、常数吞吐量定时器&#xff08;用的少&#xff0c;了解即可&#xff09; 3、固定定时器 一、连…

国内Ubuntu环境Docker部署 SenseVoice

国内Ubuntu环境Docker部署 SenseVoice 趁热搞定了 docker 部署 SenseVoice。在这里记录一下相关的文件。 SenseVoice是一个大模型语音识别库, 支持多种语言识别&#xff0c;速度快&#xff0c;准确率高&#xff0c;详细介绍请参考GitHub官网&#xff1a; https://github.com/Fu…

1.2.1-2部分数据结构的说明02_链表

&#xff08;1&#xff09;链表数据结构&#xff1a; 概念&#xff1a; 将列表中相互连接的节点不连续的存储在内存中。与数据不同&#xff0c;我们无法再恒定时间内访问任何元组&#xff0c;如果遍历所有则花费时间与元素总数n成正比。插入和删除1个元素的时间复杂度都是O(n…

什么是.net framework,什么是.net core,什么是.net5~8,版本对应关系

我不知道有多少人和我一样&#xff0c;没学习过.netCore&#xff0c;想要学习&#xff0c;但是版本号太多就蒙了&#xff0c;不知道学什么了&#xff0c;这里解释下各个版本的关系 我们一般开始学习微软的时候&#xff0c;都是开始学习的.netframework&#xff0c;常用的就是4…

网站常用功能模块-鉴权

一&#xff1a;JWT是什么&#xff1f; 常用鉴权方式有很多种&#xff0c;今天主要介绍基于token的鉴权方式JWT&#xff08;Json JSON Web Token&#xff09;。因为这种方式实现起来方便快捷。整体实现逻辑如下 第一次登陆时&#xff0c;前端携带账号和密码请求登录接口。服务…

S32K144 UDSdoCAN 升级刷写实现笔记

文章目录 1. 摘要2. 开发环境搭建2.1 开发板2.2 IDE 安装2.3 更新扩展包2.4 烧录仿真测试2.4.1 新建工程2.4.2 导入已有工程2.4.3 编译工程2.4.4 硬件连接2.4.5 Debug2.4.6 添加 .c .h 文件2.5 串口配置2.5.1 时钟2.5.2 GPIO2.5.3 定时器2.5.4 uart 工程2.5.5 烧录验证3. 升级原…

《信息收集是这样吗?》

信息收集 前置&#xff1a;渗透思路&#xff1a; 1&#xff0c; 信息收集 2&#xff0c; 漏洞扫描 3&#xff0c; 漏洞挖掘 4&#xff0c; 开始攻击 5&#xff0c; 权限维持&#xff08;持久化&#xff09; 6&#xff0c; 权限提升 7&#xff0c; 免杀隐藏 8&#xff…

[深度学习] 大模型学习1-大语言模型基础知识

大语言模型&#xff08;Large Language Model&#xff0c;LLM&#xff09;是一类基于Transformer架构的深度学习模型&#xff0c;主要用于处理与自然语言相关的各种任务。简单来说&#xff0c;当用户输入文本时&#xff0c;模型会生成相应的回复或结果。它能够完成许多任务&…

用matlab调用realterm一次性发送16进制数

realterm采用PutString接口进行发送&#xff0c;需要注意的是发送的16进制数前面要加入0x标志。只有这样&#xff0c;realterm才能将输入的字符串识别为16进制数的形式。 另外,PutString函数支持两个参数输入&#xff0c;第一个参数为字符串&#xff0c;第二个参数为发送形式&…

【C++】B2099 矩阵交换行

博客主页&#xff1a; [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 &#x1f4af;前言&#x1f4af;题目描述题目描述输入格式输出格式输入输出样例输入 #1输出 #1 &#x1f4af;题目分析&#x1f4af;不同解法分析我的做法实现步骤&#xff1a;优点&#xff1a;不足&#…

HTML5实现好看的博客网站、通用大作业网页模板源码

HTML5实现好看的博客网站、通用大作业网页模板源码 前言一、设计来源1.1 主界面1.2 列表界面1.3 文章界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载结束语 HTML5实现好看的博客网站、通用大作业网页模板源码&#xff0c;博客网站源码&#xff0c;HTML模板源码&#xff0…

动态规划六——两个数组的dp问题

目录 题目一——1143. 最长公共子序列 - 力扣&#xff08;LeetCode&#xff09; 题目二——1035. 不相交的线 - 力扣&#xff08;LeetCode&#xff09; 题目三——115. 不同的子序列 - 力扣&#xff08;LeetCode&#xff09; 题目四—— 44. 通配符匹配 - 力扣&#xff08;…