自然语言处理(第16课 机器翻译4、5/5)

一、学习目标

1.学习各种粒度的系统融合方法

2.学习两类译文评估标准

3.学习语音翻译和文本翻译的不同

4.学习语音翻译实现方法

二、系统融合

        以一个最简单的例子来说明系统融合,就是相当于用多个翻译引擎得到不同的翻译结果,然后选择其中最好的作为最终结果:

        不同于分类方法中的系统融合,因为分类方法中,各引擎的输出结果是类别,可以使用投票法(少数服从多数)、取均值等方法,机器翻译的结果是译文,是不能使用投票法、取均值法来得到结果的。

        于是在机器翻译中,针对不同粒度的系统融合方法,需要对输出们“加和”的操作中进行变动,包括:(1)句子级系统融合;(2)词语级系统融合;(3)词语级系统融合;(4)基于深度学习的系统融合。

        1.句子级系统融合

        其核心思想是计算一个输出与其它输出的相似度,加和取平均。然后每个输出都有一个对其他输出的相似度加和平均结果,最好的结果就是相似度最大的那个,例子如下:

        优点:只需要计算就能得到结果,方便。

        缺点:如果每个翻译引擎都翻译得不好,最终结果也不好。

        2.短语级系统融合

        如果能回想起前面讲过的短语级的机器翻译,就是像它那样使用对齐一致性的词语划分方法来对翻译结果进行划分,然后选取出其中出现次数多的短语组合形成新的结果。例子如下:

        优点:能找到比句子级系统融合更优的结果。

        缺点:需要足够多的翻译引擎才能有提升。

        3.词语级系统融合

        我们先看其一个例子:(其中null表示为空)

 

         显然,词语级系统融合的关键在于构建上面的有向图,从而可以找到得分最高的路径作为最优结果,而构建有向图的基础是对齐操作。所以对齐是其重中之重。其整体模型运行过程如下:

        4.基于深度学习的系统融合
 

        其重点在于使用了注意力机制,就相当于分类模型系统融合中的adaboost,给每个系统都分配权值,从而能汇聚所有翻译引擎的信息。整体结构如下:

三、译文评估方法

         不像分类任务,直接统计模型输出结果是否分类成功,从而得到正确率或者错误率去评判模型的好坏。机器翻译翻译的结果是文本,标签也是文本,无法直接进行比较,而且文本也有同意性,不同句子可以表达同种意思。于是机器翻译特别地设计了各种译文评估方法。

        1.主观评测

        主观评测就是让双语翻译专家来打分,考察标准分三类:流畅度、充分性、语义保持性。三个标准的评分表如下:

 

 

        以一个例子来说明:

 

         显然,主观评测的结果是十分准确且合理的。但确点也很明显,对于上百万条翻译语句,让人工去评判,消耗的时间和资源是不等价的。

        2.客观评测

        客观评测就是让程序自己根据模型输出结果和参考译文来计算正确率和错误率。几个常见的是:

        一个十分常用的评价法是BLEU评价法:

        我们用一个例子来理解它:

        如果n=1,则系统译文的词集合为{the},由于the在参考译文中出现,故得分为1/1=1;

        再取n=2,则系统译文的词集合为{'the the'},而'the the'未在参考译文中出现,故得分0/1=0;

        同理n=3、4,(一般n取到4)得分都为0,综合得分为1+0+0+0=1。(当然这里可以归一化一下,甚至给不同的n的得分分配不同权重)。

        于是我们可以有最后的计算公式:(w就是上面说的权重,p是各个得分,BP是惩罚项,用于惩罚过短的句子,原因可见红字部分)

        3.基于深度学习的客观评测

         其主要思想是通过注意力机制来计算得分。以例子来说明:

        网格左边是原文,下面是译文(这里是英译英,但理解其思想就行)。网格中就是左边词与下边词的注意力度,相当于联系性,所以取最大的得分,认为其联系性最大(可以互相翻译),网格之外还有一排数据,是说明句子各词的重要性(权重),网格红色得分乘上权重,最后就可以得到总分,继而可求召回率、准确率、F1。

四、语音翻译

        1.语音翻译的定义

        语音翻译的基本原理相比大家都能猜到:将源语言识别出源文本、源文本转目标文本、目标文本转目标语音:(但是,要注意的是,源语言和目标语言的转换应该是双向的)

        2.语音翻译与文本翻译的不同

        语音翻译是肯定比文本翻译难的,

        在语音识别上,有:(1)系统工作环境的多样、(2)复杂的口语习惯、(3)语音库收集难。(显然还有:杂音、集外词、缺少标点符号)

        在语言表示上,口语翻译还有的特点:

         在语言使用上,有省略、冗余等问题。

        在语音合成上,有自然、流畅、清楚、有情感、与说话人语音一致等要求。

        此外,手势和表情也会对语言的表达有辅助作用。

五、语音翻译实现

        1.重点问题

        现有的语音翻译基本都没做这些问题的解决方法。

        2.级联方法

        级联方法就是前面说的语音识别-机器翻译-语音合成三步结合的方法。过程如下:

        如上面所说,其有三个重要的问题:时间延迟、错误累计、参数冗余。于是提出端到端的方法。

        3.端到端方法

        端到端的思想是,直接将源语言语音输入到模型中,模型输出目标语言的文本,通过语音合成输出目标语音:

        二者比较,各有优缺点:

        

六、本章小结

1.机器翻译的系统融合方法,并由于问题不同引起的融合方法的不同和评估方法的不同

2.语音翻译与文本翻译的不同,语音翻译的两种实现方法。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/277722.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网页设计期末 建筑博物馆首页 HTML+CSS+js 完整代码(轮播图+瀑布流)

文章目录 前言:完整代码在总结处跳转!!! 描述:结果展示:部分代码演示:(完整代码在总结处跳转)总结:(完整代码在此处跳转) 前言&#x…

Spring高手之路-@Autowired和@Resource注解异同点

目录 相同点 不同点 1.来源不同。 2.包含的属性不同 3.匹配方式(装配顺序)不同。 ​编辑 4.支持的注入对象类型不同 5.应用地方不同 相同点 都可以实现依赖注入,通过注解将需要的Bean自动注入到目标类中。都可以用于注入任意类型的Bean…

Unity3D 安装和下载指南及汉化

Unity3D是一款强大的游戏开发引擎,为开发者提供了丰富的工具和资源,使得游戏制作变得更加简单和高效。本文将介绍Unity3D的安装和下载步骤,以帮助初学者迅速入门。 步骤一:访问Unity官网 首先,打开浏览器&#xff0c…

小型企业网设计-课设实验-爆款实验

可以按照我的配置依次配置&#xff0c;成品打包文件&#xff0c;请&#xff1a;Ensp888 <Huawei>sys Enter system view, return user view with CtrlZ. [Huawei]un in en Info: Information center is disabled. [Huawei]# [Huawei]sysname SW5 [SW5]# [SW5]vlan batch…

限流,熔断,降级分析

写在前面 本文一起看下限流&#xff0c;熔断&#xff0c;降级的概念。 1:限流 限制单位时间内的请求数&#xff0c;超过的则拒绝或其他。常用的算法有滑动时间窗口&#xff0c;漏桶算法&#xff0c;令牌桶算法。 2:熔断 在分布式的场景中&#xff0c;一个请求可能涉及到多…

【滑动窗口】【二分查找】C++算法:和至少为 K 的最短子数组

作者推荐 动态规划 多源路径 字典树 LeetCode2977:转换字符串的最小成本 本题涉及知识点 滑动窗口 有序向量 二分查找 LeetCode862:和至少为 K 的最短子数组 给你一个整数数组 nums 和一个整数 k &#xff0c;找出 nums 中和至少为 k 的 最短非空子数组 &#xff0c;并返回…

ffmpeg 解码文件时的时间戳问题

实时流和普通文件 1 实时流 实时流编码时&#xff0c;我们一般不进行b帧编码&#xff0c;但是文件存储时为了减小大小&#xff0c;会增加b帧&#xff0c;实时流只带了I&#xff0c;P帧&#xff0c;那就会好很多 2 普通文件 很多文件带了b帧&#xff0c;所以要使用解码时间去同…

nginx+rsyslog+kafka+clickhouse+grafana 实现nginx 网关监控

需求 我想做一个类似腾讯云网关日志最终以仪表方式呈现&#xff0c;比如说qps、p99、p95的请求响应时间等等 流程图 数据流转就像标题 nginx ----> rsyslog ----> kafka —> clickhouse —> grafana 部署 kafka kafka 相关部署这里不做赘述&#xff0c;只要创…

爬虫工作量由小到大的思维转变---<第三十四章 Scrapy 的部署scrapyd+Gerapy>

前言: scrapy-redis没被部署,感觉讲起来很无力;因为实在编不出一个能让scrapy-redis发挥用武之地的案子;所以,索性直接先把分布式爬虫的部署问题给讲清楚!! 然后,曲线救国式地再在部署的服务器上,讲scrapy redis我感觉这样才好! 正文: 现在还有不少人在用scrapy web进行爬虫管…

JProfiler for Mac/win中文版:Java性能分析工具的首选

JProfiler是一款功能强大的Java性能分析工具&#xff0c;它可以帮助开发人员快速定位和解决应用程序中的性能问题。无论是在开发阶段还是在生产环境中&#xff0c;JProfiler都能提供全面的性能分析和优化功能。 首先&#xff0c;JProfiler提供了一系列强大的分析工具&#xff…

[鹏城杯 2022]简单包含

[鹏城杯 2022]简单包含 wp 题目代码如下&#xff1a; <?php highlight_file(__FILE__); include($_POST["flag"]); //flag in /var/www/html/flag.php; 直接 POST 传参&#xff1a; flag/var/www/html/flag.php 会触发 waf 。 尝试用伪协议读取&#xff1a; …

IP地址SSL证书

IP地址SSL证书是一种专门针对公网IP地址颁发的数字证书。与常规的域名SSL证书类似&#xff0c;其主要目标是提供数据加密和身份验证。以下几点概述了IP地址SSL证书的重要特性及其申请过程&#xff1a; 1. 保护直接IP访问&#xff1a; 当用户直接通过IP地址访问服务时&#xff…

家庭记账本,记账项目图表分析

随着生活的节奏加快&#xff0c;财务的数字化、透明化成为了越来越多人的需求。而在这背后&#xff0c;记账成为了实现这一需求的关键所在。一个好的记账软件可以在深度上为我们提供了更多的数据参考&#xff0c;帮我们理清财务管理的思路&#xff0c;进而做到开源节流。 所需…

RabbitMQ 核心概念(交换机、队列、路由键),队列类型等介绍

RabbitMQ 核心概念(交换机、队列、路由键)&#xff0c;队列类型等介绍 RabbitMQ 是一个消息队列系统&#xff0c;它的核心概念包括交换机&#xff08;Exchange&#xff09;、队列&#xff08;Queue&#xff09;和路由键&#xff08;Routing Key&#xff09;&#xff0c;它们一起…

C# ASP.NET 实验室 检验中心 医疗LIS源码

LIS系统能够自动处理大量的医学数据&#xff0c;包括样本采集、样本处理、检测分析、报告生成等。它能够快速、准确地进行化验检测&#xff0c;提高医院的运营效率。LIS系统还提供了丰富的数据分析功能&#xff0c;能够对医院化验室的业务流程进行全面、细致的监控。 LIS系统优…

【每日一题】收集巧克力

文章目录 Tag题目来源题目解读解题思路方法一&#xff1a;枚举操作数 写在最后 Tag 【枚举】【数组】【2023-12-28】 题目来源 2735. 收集巧克力 题目解读 有长度为 n, 下标从 0 开始的整数数组 nums, 表示收集不同类型的巧克力的成本. nums[i] 表示收集类型 i 巧克力的成本…

取证工具volatility插件版学习记录

更新时间&#xff1a;2023年12月18日11:48:29 1. 背景描述 在以前学习过volatility的基础功能&#xff0c;主要是使用volatility独立版进行学习的&#xff0c;前几天遇到一个ctf赛事&#xff0c;需要用到的是volatility的mimikatz模块&#xff0c;因为以前没使用过那个模块&…

腾讯云轻量应用服务器性能差吗?

腾讯云轻量应用服务器性能如何&#xff1f;轻量服务器CPU采用什么型号&#xff1f;处理器计算性能如何&#xff1f;轻量应用服务器会不会比云服务器CVM性能差&#xff1f;腾讯云服务器网txyfwq.com详解轻量CPU型号主频、处理器性能、内存、公网带宽、月流量、不同地域速度测试、…

腾讯云价格计算器,一键计算精准报价,好用!

腾讯云价格计算器&#xff1a;可以计算腾讯云服务器不同CVM实例规格、CPU内存、公网带宽和系统盘费用明细表&#xff0c;可以一键计算出精准报价明细表&#xff0c;腾讯云服务器网txyfwq.com分享大家腾讯云服务器价格计算器入口链接、使用方法及限制说明&#xff1a; 腾讯云服…

前端图片适配不同屏幕方案

预备知识&#xff1a; 设备独立像素,以下图的iphone12 Pro为例&#xff0c;390*844表示的就是设备独立像素&#xff08;DIP&#xff09;,也可以理解为CSS像素 物理像素&#xff08;设备像素&#xff09;&#xff0c;就是屏幕的分辨率&#xff0c;显示屏就是由一个个物理像素…