揭开ChatGPT面纱(3):使用OpenAI进行文本情感分析(embeddings接口)

文章目录

  • 一、embeddings接口解析
  • 二、代码实现
    • 1.数据集dataset.csv
    • 2.代码
    • 3.运行结果

openai版本==1.6.1
本系列博客源码仓库:gitlab,本博客对应文件夹03

在这一篇博客中我将使用OpenAI的embeddings接口判断21条服装评价是否是好评。

  • 首先来看实现思路:

在这里插入图片描述

一、embeddings接口解析

在上一篇博客中说过了,OpenAI主要有11个接口,其中embeddings接口用于生成文本嵌入。下面通过解读参数来学习下这个接口的用法。

  • 在这个接口中,最主要使用的就是这个create()方法:

在这里插入图片描述

  • 参数解析:

input: 要嵌入的输入文本,可以是字符串、字符串列表、整数列表或整数数组列表。输入必须不超过模型的最大输入令牌数。
model: 要使用的模型ID。
encoding_format: 返回嵌入的格式,可以是float或base64。
user: 代表终端用户的唯一标识符,可以帮助OpenAI监控和检测滥用行为。
extra_headers: 发送额外的HTTP头。
extra_query: 在请求中添加额外的查询参数。
extra_body: 在请求中添加额外的JSON属性。
timeout: 覆盖客户端级别的默认超时时间,单位为秒。

二、代码实现

1.数据集dataset.csv

评价,标签
这件衣服的面料非常舒适,穿上去感觉很好,好评
款式时尚,颜色也很正,非常满意的一次购物体验,好评
衣服质量超出预期,非常满意,好评
穿上这件衣服,感觉整个人都精神了,好评,好评
质量很好,做工精细,好评,好评
颜色很鲜亮,非常喜欢,好评
尺码很准,穿上很合身,好评
衣服的版型很好,穿上很有型,好评
面料柔软,手感很好,好评
非常满意的一次购物,衣服质量非常好,好评
穿上很显瘦,非常喜欢,好评
颜色和图片一样,没有色差,好评
衣服的质感很好,穿上很有档次,好评
款式新颖,穿上很有气质,好评
衣服有质量问题,线头多,不满意,差评
颜色和图片有色差,感觉被欺骗了,差评
尺码不准确,穿上不合身,差评
面料很硬,穿上不舒服,差评
衣服做工粗糙,有很多线头,差评
款式一般,没有图片上看起来好看,差评
衣服有异味,洗了好几次还是有味道,差评

2.代码

from openai import OpenAI
import json
import httpx
import numpy as np

# 读取配置,在上传gitlab时配置文件ignore了
with open('../config/openai.json') as config_file:
    config = json.load(config_file)

client = OpenAI(
    base_url=config['base_url'],
    api_key=config['key'],
    http_client=httpx.Client(
        base_url=config['base_url'],
        follow_redirects=True,
    ),
)

# 指定模型
MODEL = "text-embedding-ada-002"

# 读取数据集,忽略表头行
dataset = open('dataset.csv', 'r', encoding='utf-8').readlines()[1:]
reviews = []
labels = []
for row in dataset:
    items = row.split(',')
    reviews.append(items[0])
    labels.append(items[1])


# 实现文本转embedding方法
def get_embedding(text, model=MODEL):
    return client.embeddings.create(input=[text], model=model).data[0].embedding


# 将”好评“和”差评“转换为embedding
positive = get_embedding("好评")
negative = get_embedding("差评")

# 把数据集的评论转为embedding
review_embeddings = []
for review in reviews:
    review_embeddings.append(get_embedding(review))


# 实现余弦相似度算法
def cosine_similarity(vec_a, vec_b):
    # 计算两个向量的点积
    dot_product = np.dot(vec_a, vec_b)
    # 计算两个向量的欧几里得范数(即长度)
    norm_a = np.linalg.norm(vec_a)
    norm_b = np.linalg.norm(vec_b)
    # 计算余弦相似度
    cos_similarity = dot_product / (norm_a * norm_b)
    return cos_similarity


# 计算每条评论是好评还是差评
for i in range(len(reviews)):
    print("第" + str(i) + "条评论为:" + reviews[i])
    pos_score = cosine_similarity(review_embeddings[i], positive)
    neg_score = cosine_similarity(review_embeddings[i], negative)
    print("该评论与好评的相似度为:" + str(pos_score))
    print("该评论与差评的相似度为:" + str(neg_score))
    print("判断结果为:" + ("好评" if pos_score>neg_score else "差评"))
    print("实际标签为:"+labels[i])

3.运行结果

21条评论,只计算错误3条,正确率高达85.7%。

D:\setup\tensorflow\envs\openaidemo\python.exe "D:/0 project/openaidemo/03/sentiment_analysis.py"0条评论为:这件衣服的面料非常舒适,穿上去感觉很好
该评论与好评的相似度为:0.7866600025796906
该评论与差评的相似度为:0.7340914289400244
判断结果为:好评
实际标签为:好评

第1条评论为:款式时尚,颜色也很正,非常满意的一次购物体验
该评论与好评的相似度为:0.8116062681356471
该评论与差评的相似度为:0.7592264307269887
判断结果为:好评
实际标签为:好评

第2条评论为:衣服质量超出预期,非常满意
该评论与好评的相似度为:0.835177254990754
该评论与差评的相似度为:0.7910031400363514
判断结果为:好评
实际标签为:好评

第3条评论为:穿上这件衣服,感觉整个人都精神了,好评
该评论与好评的相似度为:0.8479253083790808
该评论与差评的相似度为:0.7992275199715745
判断结果为:好评
实际标签为:好评

第4条评论为:质量很好,做工精细,好评
该评论与好评的相似度为:0.8804815052105072
该评论与差评的相似度为:0.8202060552575923
判断结果为:好评
实际标签为:好评

第5条评论为:颜色很鲜亮,非常喜欢
该评论与好评的相似度为:0.8122908056959066
该评论与差评的相似度为:0.7453758474352993
判断结果为:好评
实际标签为:好评

第6条评论为:尺码很准,穿上很合身
该评论与好评的相似度为:0.8095639635935163
该评论与差评的相似度为:0.7542509575575985
判断结果为:好评
实际标签为:好评

第7条评论为:衣服的版型很好,穿上很有型
该评论与好评的相似度为:0.8029880472359789
该评论与差评的相似度为:0.752721443961377
判断结果为:好评
实际标签为:好评

第8条评论为:面料柔软,手感很好
该评论与好评的相似度为:0.8202393074180623
该评论与差评的相似度为:0.7715710993474748
判断结果为:好评
实际标签为:好评

第9条评论为:非常满意的一次购物,衣服质量非常好
该评论与好评的相似度为:0.8304340790084418
该评论与差评的相似度为:0.7686974883325032
判断结果为:好评
实际标签为:好评

第10条评论为:穿上很显瘦,非常喜欢
该评论与好评的相似度为:0.7845954204223071
该评论与差评的相似度为:0.7344546937738867
判断结果为:好评
实际标签为:好评

第11条评论为:颜色和图片一样,没有色差
该评论与好评的相似度为:0.7889487515789574
该评论与差评的相似度为:0.7629094836325928
判断结果为:好评
实际标签为:好评

第12条评论为:衣服的质感很好,穿上很有档次
该评论与好评的相似度为:0.8103547992920661
该评论与差评的相似度为:0.7626423966774464
判断结果为:好评
实际标签为:好评

第13条评论为:款式新颖,穿上很有气质
该评论与好评的相似度为:0.7940717784875954
该评论与差评的相似度为:0.7563715210341154
判断结果为:好评
实际标签为:好评

第14条评论为:衣服有质量问题,线头多,不满意
该评论与好评的相似度为:0.7944173838386458
该评论与差评的相似度为:0.800127661438339
判断结果为:差评
实际标签为:差评

第15条评论为:颜色和图片有色差,感觉被欺骗了
该评论与好评的相似度为:0.7822516772149408
该评论与差评的相似度为:0.7907092043951234
判断结果为:差评
实际标签为:差评

第16条评论为:尺码不准确,穿上不合身
该评论与好评的相似度为:0.7697819579113206
该评论与差评的相似度为:0.7768264577324818
判断结果为:差评
实际标签为:差评

第17条评论为:面料很硬,穿上不舒服
该评论与好评的相似度为:0.7652704470138616
该评论与差评的相似度为:0.7608743799318946
判断结果为:好评
实际标签为:差评

第18条评论为:衣服做工粗糙,有很多线头
该评论与好评的相似度为:0.748231684611617
该评论与差评的相似度为:0.7604407281022945
判断结果为:差评
实际标签为:差评

第19条评论为:款式一般,没有图片上看起来好看
该评论与好评的相似度为:0.7825934944171562
该评论与差评的相似度为:0.7738324828014607
判断结果为:好评
实际标签为:差评

第20条评论为:衣服有异味,洗了好几次还是有味道
该评论与好评的相似度为:0.7546261044756783
该评论与差评的相似度为:0.7442435431393303
判断结果为:好评
实际标签为:差评

Process finished with exit code 0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/563357.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

视频教程下载:用ChatGPT的 API 开发AI应用指南

通过这门关于 OpenAI API 和 ChatGPT API 的全面课程,在您的应用中释放人工智能的力量。随着人工智能技术的快速发展,比以往任何时候都更重要的是保持领先地位,并为您的项目利用这些尖端工具。在本课程中,您将深入了解人工智能驱动…

每日论文推荐:Prismatic VLMs VLM设计经验总结

📌 元数据概览: 标题:“Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models”作者:Siddharth Karamcheti, Suraj Nair, Ashwin Balakrishna, Percy Liang, Thomas Kollar, Dorsa Sadigh&a…

LLM学习笔记-2

在未标记数据上进行预训练 本章概要 在上节的笔记中,因为训练出的效果,并不是特别理想,在本节中,会用数据进行训练,使得模型更加的好; 计算文本生成损失 inputs torch.tensor([[16833, 3626, 6100],…

SpringBoot 操作 Redis

导入对应版本的依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId> </dependency>修改配置文件中的信息 spring:redis:host: 127.0.0.1port: 8888注意: 我这里 xsh…

springboot注解开发如何映射对象型数据

创作灵感 最近在帮学校写一款小程序时&#xff0c;有这样一个数据需要展示&#xff1a;一条申请记录&#xff0c;里面包含了申请时间、申请状态、申请所提供的六条活动记录等待&#xff0c;其中&#xff0c;申请所提供的六条活动记录为一个数组&#xff0c;数组中的每个元素又…

面板数据门槛归回分析,xthreg的安装,xthreg2安装包

我用的是Stata17,数据是不平衡的面板数据,需要用到xthreg2,虽然我找到了xthreg2.ado,但是还需要安装xthreg,因为运行xthreg2需要xthreg包顺带安装的lxthreg.mlib文件。但是!我后来发现还是不行,最后是去买了一个真正能用到xthreg2的lxthreg.mlib文件,才可以运行。 一、…

[图解]软件开发中的糊涂用语-04-为什么要追究糊涂用语

0 00:00:00,030 --> 00:00:05,620 今天呢&#xff0c;我们来说一个为什么要追究糊涂用语的问题 1 00:00:06,310 --> 00:00:06,548 2 00:00:06,548 --> 00:00:11,077 大家知道我们前些天都发了好几个视频 3 00:00:11,077 --> 00:00:13,461 追究这个糊涂用语 4 00…

2024免费专为Mac用户设计的清理和优化工具CleanMyMac X

CleanMyMac X是一款专为Mac用户设计的清理和优化工具。以下是对CleanMyMac X的详细介绍&#xff1a; 一、主要功能 系统清理&#xff1a;CleanMyMac X能够智能扫描Mac的磁盘空间&#xff0c;识别并清理各种垃圾文件&#xff0c;这些垃圾文件包括重复文件、无用的语言安装包、i…

五.音视频编辑-音频混合-应用

引言 音频混合技术是一项强大的工具&#xff0c;可以为应用程序增添丰富的功能和用户体验。在前一篇博客中&#xff0c;我们深入探讨了AVFoundation框架中的音频混合基础知识和实现方法。现在&#xff0c;让我们进一步探索&#xff0c;看看如何将这些技术应用到实际项目中。 …

Django项目无法安装python-ldap依赖解决方案

最近工作中安排了一个Python web项目&#xff0c;使用Pycharm从git拉取代码后&#xff0c;配置号Python的解释器和pip后&#xff0c;Pycharm自动下载安装项目所需的依赖&#xff0c;但是有一个依赖django-auth-ldap4.1.0安装始终失败&#xff0c;最初的异常信息提示是&#xff…

Java客户端如何直接调用es的API

Java客户端如何直接调用es的API 一. 问题二. withJson 前言 这是我在这个网站整理的笔记,有错误的地方请指出&#xff0c;关注我&#xff0c;接下来还会持续更新。 作者&#xff1a;神的孩子都在歌唱 一. 问题 今天做项目的时候&#xff0c;想要直接通过java客户端调用es的api…

解决Django中调页面时出现“Did you forget to register or load this tag”报错

解决Django中调页面时出现“Did you forget to register or load this tag?”报错 1.问题收录 2.分析问题 在HTML文件中&#xff0c;{{title}}&#xff0c;{{lanyy}}&#xff0c;django 默认规定的语法&#xff0c;用{{}}包起来的变量叫做模板变量。 django渲染模板时会将大…

2.1K Star微软开源的高质量 iot库

功能描述 该项目是一个开源的 .NET Core 实现&#xff0c;旨在帮助开发者构建适用于物联网(IoT)设备和场景的应用程序。它提供了与传感器、显示器和输入设备等相互作用所需的 GPIO 引脚、串口等硬件的接口。该仓库包含 System.Device.Gpio 库以及针对各种板卡&#xff08;如 Ra…

论文笔记:Time-LLM: Time Series Forecasting by Reprogramming Large Language Models

iclr 2024 reviewer 评分 3888 1 方法 提出了 Time-LLM&#xff0c; 是一个通用的大模型重编程&#xff08;LLM Reprogramming&#xff09;框架将 LLM 轻松用于一般时间序列预测&#xff0c;而无需对大语言模型本身做任何训练 为什么需要时序数据和文本数据对齐&#xff1a;时…

vi, vim,data,wc,系统常用命令-读书笔记(十)

vi 文本编辑器 基本上 vi 共分为三种模式&#xff0c;分别是“一般指令模式”、“编辑模式”与“命令行命令模式”。这三种模式的作用分别是&#xff1a; 一般指令模式&#xff08;command mode&#xff09;以 vi 打开一个文件就直接进入一般指令模式了&#xff08;这是默认的…

分类预测 | Matlab实现CNN-LSTM-SAM-Attention卷积长短期记忆神经网络融合空间注意力机制的数据分类预测

分类预测 | Matlab实现CNN-LSTM-SAM-Attention卷积长短期记忆神经网络融合空间注意力机制的数据分类预测 目录 分类预测 | Matlab实现CNN-LSTM-SAM-Attention卷积长短期记忆神经网络融合空间注意力机制的数据分类预测分类效果基本描述程序设计参考资料 分类效果 基本描述 1.Mat…

frp改造Windows笔记本实现家庭版免费内网穿透

文章目录 前言frp原理Windows服务端IP检验IP固定软件下载端口放行端口映射开机启动 NAS客户端端口查询软件下载端口检验穿透测试自启设置 Ubuntu客户端软件下载后台启动 后记 前言 之前一直用花生壳远程控制一个服务器&#xff0c;但最近内网的网络策略似乎发生了变化&#xf…

java中的异常机制

异常原理分析 在我们编写一个代码的时候必然会出现这样那样的问题&#xff0c;这些问题可能是明显的&#xff0c;也有可能是不明显的。从理论上来说&#xff0c;一个程序员应当具备处理代码出现的大多数问题的能力&#xff0c;但是这并不意味着程序员要思考处理所有的代码问题。…

硬盘日常使用中的注意事项

硬盘是计算机中的重要存储设备,负责存储大量的数据。为了确保数据的完整性和硬盘的寿命,日常使用中需要注意以下几点: 避免震动和撞击:硬盘在工作时,内部的磁盘正在高速旋转,任何轻微的震动或撞击都可能导致磁盘损坏或数据丢失。因此,使用硬盘时应确保计算机放置稳定,避…

Python图像处理【24】面部变形(face morphing)

面部变形 0. 前言1. 网格变形算法2. 实现面部变形小结系列链接 0. 前言 面部变形 (face morphing) 的目的是在计算图像中两个面部之间的平均值&#xff0c;它并不是计算两张图像的平均值&#xff0c;而是计算面部区域的平均值。可以将该过程分解为以下两步&#xff1a; 对齐两…