kaggle笔记：对推理函数inference(df, model, tokenizer, device)的分析

article2024/11/27 18:57:08/文章来源:https://blog.csdn.net/weixin_64911856/article/details/144065095

代码：

def inference(df, model, tokenizer, device):
    batch_size = 64
    max_length = 512
    sentences = list(df['query_text'].values) # 问题列表

    all_embeddings = []
    # 对句子列表按长度降序排序，以优化内存使用和处理速度。
    length_sorted_idx = np.argsort([-len(sen) for sen in sentences])
    sentences_sorted = [sentences[idx] for idx in length_sorted_idx]
    for start_index in trange(0, len(sentences), batch_size, desc="Batches", disable=False):
        sentences_batch = sentences_sorted[start_index: start_index + batch_size]
        features = tokenizer(sentences_batch, max_length=max_length, padding=True, truncation=True,
                             return_tensors="pt")
        features = batch_to_device(features, device)
        with torch.no_grad(): # 在不计算梯度的情况下运行模型，以节省内存和计算资源。
        # 使用双星号 ** 来传递参数是一种常见的做法，它允许你将字典中的键值对作为关键字参数传递给函数
            outputs = model.model

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/923742.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

ARM架构 AArch64 基础知识介绍

介绍 aarch64是 ARM 架构的 64 位版本，它是 ARMv8 架构的一部分，被设计用来提供更高的性能和更大的地址空间，同时保持与 32 位 ARM 架构的兼容性。AArch64 是 ARMv8 的 64 位指令集架构（ISA），它提供了丰富的…

Rust中Tracing 应用指南

欢迎来到这篇全面的Rust跟踪入门指南。Rust 的tracing是一个用于应用程序级别的诊断和调试的库。它提供了一种结构化的、异步感知的方式来记录日志和跟踪事件。与传统的日志记录相比，tracing能够更好地处理复杂的异步系统和分布式系统中的事件跟踪，帮助开…

极狐GitLab 17.6 正式发布几十项与 DevSecOps 相关的功能【三】

GitLab 是一个全球知名的一体化 DevOps 平台，很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版，专门为中国程序员服务。可以一键式部署极狐GitLab。学习极狐GitLab 的相关资料： 极狐GitLab 官网极狐…

WinFrom调用webapi接口另一个方法及其应用实例

1.调用接口方法代码如下： public class WebAPI{#region WebAPI调用 public async Task<string> Call_Webapi(string Url, string Json) //url传入的是接口名称，json传入的是接口参数{string responseBody string.Empty; //responseBod…

elasticsearch的索引模版使用方法

5 索引模版⭐️⭐️⭐️⭐️⭐️ 索引模板就是创建索引时要遵循的模板规则索引模板仅对新创建的索引有效，已经创建的索引并不受索引模板的影响 5.1 索引模版的基本使用 1.查看所有的索引模板 GET 10.0.0.91:9200/_index_template2.创建自定义索引模板 xixi &…

从零开始学GeoServer源码（二）添加支持arcgis切片功能

文章目录参考文章环境背景1、配置打包好的程序1.1、下载GeoServer的war包1.2、下载GeoWebCache1.3、拷贝jar包1.4、修改配置文件1.4.1、拷贝geowebcache-arcgiscache-context.xml1.4.2、修改geowebcache-core-context.xml1.4.3、修改geowebcache-servlet.xml 1.5、配置切片信息…

Redis 可观测最佳实践

Redis 介绍 Redis 是一个开源的高性能键值对（key-value）数据库。它通常用作数据库、缓存和消息代理。Redis 支持多种类型的数据结构，Redis 通常用于需要快速访问的场景，如会话缓存、全页缓存、排行榜、实时分析等。由于其高性能和…

HarmonyOs鸿蒙开发实战(21)=＞组件间通信@ohos/liveeventbus

1.简介 LiveEventBus是一款消息总线，具有生命周期感知能力，支持Sticky，支持跨进程，支持跨APP发送消息。 2.下载安装 ohpm install ohos/liveeventbus 3.订阅，注册监听 4.发送事件 5. 完成 > 记得关注博主&#xff…

深度学习使用LSTM实现时间序列预测

大家好，LSTM是一种特殊的循环神经网络（RNN）架构，它被设计用来解决传统RNN在处理长序列数据时的梯度消失和梯度爆炸问题，特别是在时间序列预测、自然语言处理和语音识别等领域中表现出色。LSTM的核心在于其独特的门控机…

用Tauri框架构建跨平台桌面应用：1、Tauri快速开始

Tauri 是一个构建适用于所有主流桌面和移动平台的轻快二进制文件的框架。开发者们可以集成任何用于创建用户界面的可以被编译成 HTML、JavaScript 和 CSS 的前端框架，同时可以在必要时使用 Rust、Swift 和 Kotlin 等语言编写后端逻辑。 Tauri 是什么？ |…

Elasticsearch对于大数据量（上亿量级）的聚合如何实现？

大家好，我是锋哥。今天分享关于【Elasticsearch对于大数据量（上亿量级）的聚合如何实现？】面试题。希望对大家有帮助； Elasticsearch对于大数据量（上亿量级）的聚合如何实现？ 1000道 …

C语言：C语言实现对MySQL数据库表增删改查功能

基础DOME可以用于学习借鉴； 具体代码 #include <stdio.h> #include <mysql.h> // mysql 文件，如果配置ok就可以直接包含这个文件//宏定义连接MySQL必要参数 #define SERVER "localhost" //或 127.0.0.1 #define USER "roo…

Learn Git Branching 学习笔记

网址：Learn Git Branching 一、基础篇 1.1 git commit 1.1.1 示例（git commit） git commit 1.1.2 题目（两次提交记录） git commit git commit 前后 1.2 git branch 1.2.1 示例（git branch <>、git …

设计模式：责任链实现数据流风格的数据处理

数据流风格数据流风格是软件架构中的一种风格，主要是面向数据，用于进行流式的数据处理；数据流风格的代表有管道-过滤器风格和批处理序列风格，这里主要是指管道-过滤器风格。管道-过滤器风格就像其名字一样，是以一个…

BERT简单理解；双向编码器优势

目录 BERT简单理解一、BERT模型简单理解二、BERT模型使用举例三、BERT模型的优势双向编码器优势 BERT简单理解（Bidirectional Encoder Representations from Transformers）模型是一种预训练的自然语言处理（NLP）模型，由Google于2018年推出。以下是对BERT模型的简…

摄像头原始数据读取——V4L2(mmap模式,V4L2_MEMORY_MMAP)

摄像头原始数据读取——V4L2(mmap模式,V4L2_MEMORY_MMAP) 内存映射模式，是将设备在内核态申请的用于存储视频数据的物理内存映射到用户空间，使得用户应用程序可以直接访问和操作设备数据物理内存，避免了数据的拷贝。因此采集速度较快&#x…

SpringCloud框架学习（第五部分：SpringCloud Alibaba入门和 nacos）

目录十二、SpringCloud Alibaba入门简介 1. 基本介绍 2.作用 3.版本选型十三、 SpringCloud Alibaba Nacos服务注册和配置中心 1.简介 2.各种注册中心比较 3.下载安装 4.Nacos Discovery服务注册中心 （1） 基于 Nacos 的服务提供者 &#xf…

Ubuntu下用Docker部署群晖系统---Virtual DSM --zerotier实现连接

Ubuntu下用Docker部署群晖系统—Virtual DSM --zerotier实现连接 1. Docker 安装安装最新docker curl -fsSL get.docker.com -o get-docker.sh sudo sh get-docker.sh sudo docker run hello-world2.docker-compose 安装 sudo pip install docker-compose测试安装是否成功…

【排版教程】Word、WPS 分节符(奇数页等) 自动变成分节符(下一页) 解决办法

毕业设计排版时，一般要求每章节的起始页为奇数页，空白页不显示页眉和页脚。具体做法如下： 1 Word 在一个章节的内容完成后，在【布局】中，点击【分隔符】，然后选择【奇数页】这样在下一章节开始的时&…

241125学习日志——[CSDIY] [InternStudio] 大模型训练营 [17]

CSDIY：这是一个非科班学生的努力之路，从今天开始这个系列会长期更新，（最好做到日更），我会慢慢把自己目前对CS的努力逐一上传，帮助那些和我一样有着梦想的玩家取得胜利！！&…

kaggle笔记：对推理函数inference(df, model, tokenizer, device)的分析

相关文章