如何使用Python + 百度翻译API 自动大批量免费翻译Excel文件中的外语内容

手里有一个Excel文件,包括了大量的亚马逊德语搜索词(关键词),每个单元格1个,需要翻译为中文。但是文件大小超过了10M,不能使用百度或Google免费的文档功能,如果手工一个个的翻译然后粘贴又太麻烦,于是想到用Python加免费翻译API完成。

一、openpyxl库

用Python编辑处理Excel文件主要有两个最流行的库是openpyxl和pandas,因为我处理的Excel文件我不想改变它的格式,仅想改变部分单元格内容,于是采用了openpyxl库。
openpyxl是一个用于读写Excel文件(.xlsx格式)的库,适用于简单的Excel文件操作。
安装方式:可以使用pip安装它,命令如下:

pip install openpyxl

其他辅助库:os,requests,hashlib,time。 requests用于发送网络请求,将要翻译的关键词发送到百度并接收来自百度翻译云服务器的翻译结果。hashlib 是 Python 标准库的一部分,不需要使用 pip 单独安装。这个库用于处理哈希函数,如 MD5、SHA-1 等,发送请求API需要用到,因为它用于计算 sign 参数。os用于设定文件夹等,time库用于设定定时请求,不是必须的。

二、百度翻译API

现在常用的网络翻译有Google和百度翻译。要使用Python调用Google翻译(https://translate.google.com.hk/)或Baidu翻译(https://fanyi.baidu.com/)的翻译服务,需要先申请一个开发者API,开始打算使用Google的API,结果在Google网站(https://cloud.google.com/translate/docs/reference/rest)上转了一圈,从一堆英文文档中没有快速找到需要的API,就果断跳到了百度翻译API(https://fanyi-api.baidu.com/,之前有注册百度账号,快速找到了百度翻译的API。2022年8月1日起,通用翻译API标准版免费调用量调整为5万字符/月,足够用了。
百度翻译API

百度翻译API介绍文档:
https://fanyi-api.baidu.com/product/113

百度通用翻译API文档
申请完API后最重要的信息在这里,查看自己的API值:
在这里插入图片描述

三、Python代码

3.1 主要思路

用openpyxl库来读取和修改及保存要翻译的Excel文件。要翻译的德语关键词位于Excel文件的A列,用for循环里的openpyxl读取单元格的内容后用requests发送网络请求,将要翻译的关键词发送到百度并接收来自百度翻译云服务器的翻译结果,然后再用openpyxl写入Excel文件并保存。

3.2 几个注意事项及程序特点:

3.2.1 批量间隔发送:

如果一个单元格的一个关键词请求1次百度翻译服务器,快速大量的请求会超过限额而被服务器拒绝,所以使用time库每个for循环定时间隔等待10秒,同时一次读取50个词再向百度翻译服务器发送一次请求。这样可以减少调用次数。

3.2.2 仅翻译可见单元格:

原始Excel里包括了上万个关键词,但是我并不想全部都翻译,所以用了Excel的数据筛选功能隐藏掉了很多行,我不希望翻译这些隐藏的行,所以在程序里有判断某个行是否是隐藏了,如果是就跳过。

3.2.3 翻译语种:

百度支持几十种语言的相互翻译,注意选择的语言代码正确。本例子程序翻译的是德语到中文。

3.3 程序代码:

<

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/373805.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Zookeeper】what is Zookeeper?

官网地址&#xff1a;https://zookeeper.apache.org/https://zookeeper.apache.org/ 以下来自官网的介绍 ZooKeeper is a centralized service for maintaining configuration information, naming, providing distributed synchronization, and providing group services. A…

【产品经理进阶】也许这就是复盘的意义

目录 简介 复盘 内容情况 1. 华为流程体系入门课 2. 产品经理进阶课 3. BLM 战略方法论进阶课 4. IPD 进阶 100 例专栏 作者简介 简介 随着春节的临近&#xff0c;所有人都开始了一场奔赴。 春节对于国人是含有一种情感的。 更大的意义在于他的这种辞旧迎新的承接性…

IDEA创建SpringBoot+Mybatis-Plus项目

IDEA创建SpringBootMybatis-Plus项目 一、配置Maven apache-maven-3.6.3的下载与安装&#xff08;详细教程&#xff09; 二、创建SpringBoot项目 在菜单栏选择File->new->project->Spring Initializr&#xff0c;然后修改Server URL为start.aliyun.com&#xff0c…

centos 7.6 安装 openldap 2.5.17

centos 7.6 安装ldap 1、下载ldap2、安装ldap2.1、官方参考文档2.2、安装前准备2.2.1、安装gcc2.2.2、安装Cyrus SASL 2.1.272.2.3、安装OpenSSL 1.1.12.2.3.1、下载openssl 3.02.2.3.2、安装依赖包2.2.3.3、编译安装openssl 3.0 2.2.3、安装libevent 2.1.82.2.4、安装libargon…

【webpack】优化提升

webpack优化提升 安装webpack相关内容向下兼容游览器-babel/polyfill进一步优化babel/polyfill模块联邦-共享模块如何提升构建性能通用环境下1&#xff0c;webpack更新到最新版本2&#xff0c;将loader应用于最少数量的必要模块3&#xff0c;引导&#xff08;每个额外的loader/…

如何正确理解和获取S参数

S参数是网络参数&#xff0c;定义了反射波和入射波之间的关系&#xff0c;给定频率的S参数矩阵指定端口反射波b的矢量相对于端口入射波a的矢量&#xff0c;如下所示&#xff1a; bS∙a 在此基础上&#xff0c;如下图所示&#xff0c;为一个常见的双端口网络拓扑图&#xff1a;…

Mysql索引优化建议

1&#xff0c;最左前缀法则 如果为一张表创建了多列的组合索引&#xff0c;要遵守最左前缀法则。就是指查询从索引的最左前列开始并且不要跳过索引中的列。&#xff08;因为Mysql的InnoDB引擎的索引树是一个按顺利排序存储的数据结构&#xff08;BTREE&#xff09;&#xff0c…

Java-并发高频面试题-2

接着之前的Java-并发高频面试题 7. synchronized的实现原理是怎么样的&#xff1f; 首先我们要知道synchronized它是解决线程安全问题的一种方式&#xff0c;而具体是怎么解决的呢&#xff1f;主要是通过加锁的方式来解决 在底层实现上来看 是通过 monitorenter、monitorexit…

goland中快捷关键词forr、main等不生效的问题记录

平时用的较多的一些快捷关键词&#xff0c;如forr会提示range循环并通过回车可自动打出来&#xff0c;main会提示main函数并通过回车可自动打出来&#xff0c;这种快捷处理能极大的提高编码效率。 但由于之前更改了一些配置&#xff0c;可能有的被覆盖失效了&#xff0c;重新修…

第1节、电路连接【51单片机+L298N步进电机系列】

↑↑↑点击上方【目录】&#xff0c;查看本系列全部文章 摘要&#xff1a;本节介绍如何搭建一个51单片机L298N步进电机控制电路&#xff0c;所用材料均为常见的模块&#xff0c;简单高效的方式搭建起硬件环境。 一、硬件清单 ①51单片机模块 ②恒流模块 ③开关电源 ④L298N模…

7.0 Zookeeper 客户端基础命令使用

zookeeper 命令用于在 zookeeper 服务上执行操作。 首先执行命令&#xff0c;打开新的 session 会话&#xff0c;进入终端。 $ sh zkCli.sh 下面开始讲解基本常用命令使用&#xff0c;其中 acl 权限内容在后面章节详细阐述。 ls 命令 ls 命令用于查看某个路径下目录列表。…

Innodb索引页文件结构

Innodb索引页文件结构 首先Mysql的基本存储结构是页&#xff0c;Mysql中的存取数据是按照页进行存取的&#xff0c;在查找数据的时候是需要先定位到记录所在页&#xff0c;再从所在页中查找到相应的记录 数据页以一个双向链表维持着顺序&#xff0c;每个数据页以单向链表的格式…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之RichText组件

鸿蒙&#xff08;HarmonyOS&#xff09;项目方舟框架&#xff08;ArkUI&#xff09;之RichText组件 一、操作环境 操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、RichText组件 鸿蒙&#xff08;HarmonyOS&#xff09;富文本组件&#xff0c;…

CentOS基于volatility2的内存取证实验

CentOS&#xff0c;Redhat和Fedora 都是Red Hat体系&#xff0c;采用yum管理器&#xff0c;不同于Debian、Ubuntu作为Debian体系使用apt 本文以CentOS为例&#xff0c;采用avml制作内存镜像&#xff0c;并利用volatility官方所给工具制作profile符号文件&#xff0c;进行简单的…

synchronized内部工作原理

作者简介&#xff1a; zoro-1&#xff0c;目前大二&#xff0c;正在学习Java&#xff0c;数据结构&#xff0c;javaee等 作者主页&#xff1a; zoro-1的主页 欢迎大家点赞 &#x1f44d; 收藏 ⭐ 加关注哦&#xff01;&#x1f496;&#x1f496; synchronized内部工作原理 syn…

kafka-splunk数据通路实践

目的&#xff1a; 鉴于目前网络上没有完整的kafka数据投递至splunk教程&#xff0c;通过本文操作步骤&#xff0c;您将实现kafka数据投递至splunk日志系统 实现思路&#xff1a; 创建kafka集群部署splunk&#xff0c;设置HTTP事件收集器部署connector服务创建connector任务&a…

前缀和算法

【模板】前缀和 题目链接&#xff1a;前缀和 算法思路 先预处理出来⼀个「前缀和」数组&#xff1a; ⽤ dp[i] 表⽰&#xff1a; [1, i] 区间内所有元素的和&#xff0c;那么 dp[i - 1] ⾥⾯存的就是 [1, i - 1] 区间内所有元素的和&#xff0c;那么&#xff1a;可得递推公式…

docker安装etherpad文档系统

效果 安装 1.创建并进入目录 mkdir -p /opt/etherpad cd /opt/etherpad 2.修改目录权限 chmod -R 777 /opt/etherpad 3.创建并启动容器 docker run -d --name etherpad --restart always -p 10054:9001 -v /opt/etherpad/data:/opt/etherpad-lite/var etherpad/etherpad:la…

YOLO-World——超级轻量级开放词汇目标检测方法

前言 目标检测一直是计算机视觉领域中不可忽视的基础挑战&#xff0c;对图像理解、机器人技术和自主驾驶等领域具有广泛应用。随着深度神经网络的发展&#xff0c;目标检测方面的研究取得了显著进展。尽管这些方法取得了成功&#xff0c;但它们存在一些限制&#xff0c;主要体…

业务架构设计之汽配供应链与实现的实践总结

随着汽车行业的不断发展&#xff0c;汽配供应链的规模和复杂度也在不断增加。为了满足市场需求&#xff0c;建立一个高效、可靠的汽配供应链业务系统至关重要。本文将总结一些关键的实践经验&#xff0c;帮助读者了解如何设计和实现一个稳定且高效的汽配供应链业务系统。 1. 业…