法律行业案例法模型出现,OPenAI公布与法律AI公司Harvey合作案例


c976dc89e5ea3069afac552c7d48ce9c.jpeg

Harvey与OpenAl合作,为法律专业人士构建了一个定制训练的案例法模型。该模型是具有复杂推理广泛领域知识以及超越单一模型调用能力的任务的AI系统,如起草法律文件、回答复杂诉讼场景问题以及识别数百份合同之间的重大差异。

Harvey公司由具有反垄断和证券诉讼背景的律师温斯顿-温伯格(Winston weinberg)和人工智能研究员加布-佩雷拉(Gabe Pereyra)共同创立,加布-佩雷拉曾为谷歌大脑(Google Brain)和 Meta 公司开发大语言模型(LLMs)。他们看到了使用LLMs综合信息并呈现给律师审查的机会。

在案例法研究方面,Harvey的团队设想了这样一种体验:你可以将客户问题复制粘贴进一个案例法模型,它会彻底回答这个问题并引用所有来源。他们首先尝试了明显的技术,如通过公共API微调基础模型和构建检索增强生成(RAG)系统。但他们遇到了独特的复杂、开放式用例的限制。

Harvey决定与OpenAI合作,建立一个定制训练模型,使他们能够将新知识和关于这些知识的推理方式注入基础模型。他们从德拉瓦州的案例法开始,然后扩展到包括所有美国案例法。他们向定制训练的案例法模型中添加了相当于100亿令牌的数据。

过去一年里,Harvey已经成为法律、税务和金融专业人士的安全生成式AI平台。他们的团队增长到100多人,2023年的收入增长了10倍以上,他们刚刚获得 Elad Gil、Kleiner Perkins、openAl和红杉8000 万美元 B轮融资,估值7.5亿美金。

4352a3c07c969fbb4a50fa0dd94a78bf.jpeg

功能特点

1.复杂推理能力: 模型具备处理需要复杂推理的任务的能力,这对于法律专业人士尤为重要,因为他们的工作经常涉及解决高度复杂的问题。

2.广泛的领域知识: 通过定制训练,模型获得了覆盖广泛法律领域的知识,能够理解和处理与法律相关的各种查询和任务。

3.文档起草和审查: 模型帮助法律专业人士起草和审查法律文档,显著提高了工作效率。

4.复杂诉讼场景分析: 能够回答关于复杂诉讼场景的问题,包括识别合同间的重大差异等。

5.高度准确且相关的结果: 相比传统模型,该定制模型能够提供更准确、更相关的法律信息和解决方案,并确保每个句子都有明确的来源引用。

训练方法

1.合作与知识共享: Harvey与OpenAl紧密合作,结合法律专业知识与AI技术。Harvey的律师和研究人员与OpenAl的团队共同探讨案例法研究的工作方式,并将这些知识应用于型训练。

2.数据注入: 从德拉瓦州案例法开始,最终扩展到全美案例法,向模型注入了相当于100亿令牌的数据量,帮助模型深入理解法律领域的知识和逻辑。

3.定制训练: 采用定制训练方法,超越了传统的检索增强生成系统(RAG)和通过公共API进行的基础模型微调,使模型能够整合新的知识和推理方式。

评估结果

为了测试案例法模型,Harvey与十家最大的律师事务所合作。他们向律师提供了定制案例法模型输出与相同问题的GPT-4输出的并排比较。结果,律师们对案例法模型的输出更加青睐,这是因为它提供了更长、更完整的答案,更深入地探讨了问题的细节,并涵盖了更多相关的案例法。

通过建立定制模型,Harvey减少了幻觉问题,并实现了与来源引用相关的高度准确结果。他们渴望将这一模型推广给更多用户,并探索如起草简报和动议,或帮助律师理解不同司法管区案例法如何变化等其他应用。

1.强烈的偏好选择: 当Harvey与十家最大的律师事务所合作进行模型测试时,律师们对比了定制案例法模型的输出与GPT-4对相同问题的输出。结果显示,在97%的情况下,律师们更倾向于选择定制案例法模型的输出。这一强烈偏好主要是因为定制模型提供的答案更长、更完整,更深入地探讨了问题的细节,并覆盖了更多相关的案例法。

2.答案的深度和完整性: 定制模型的输出不仅仅是回答问题,而是提供了长篇、完整的解答,深入到问题的各个细节,并广泛涵盖相关的案例法,这对法律专业人士来说极具价值。

3.减少幻觉(Hallucination): 减少幻觉是Harvey建立定制模型的一个主要动机。测试结果证明,定制模型不会编造案例,每一句话都有确切的案例引用支持,这大大提高了信息的可靠性和准确性。

Harvey的下一步重点是代理,或者如何将多个模型调用组合成一个单一的工作输出。这将简化用户体验,减少用户需要进行的提示工程和打字。Harvey的愿景是成为团队的支持成员,随着法律工作量的增长,助理们在复杂但常规的任务上花费了无数小时,我们拥有的机会不仅仅是法律,而是所有专业服务,即处理常规任务,以便专业人士可以将时间集中在客户互动上。

详细:https://openai.com/customer-stories/harvey

Harvey官网:harvey.ai


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/516250.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

阿里云服务器199元一年,ECS u1实例性能测评

阿里云服务器ECS u1实例,2核4G,5M固定带宽,80G ESSD Entry盘优惠价格199元一年,性能很不错,CPU采用Intel Xeon Platinum可扩展处理器,购买限制条件为企业客户专享,实名认证信息是企业用户即可&a…

树莓派部署yolov5实现目标检测(ubuntu22.04.3)

最近两天搞了一下树莓派部署yolov5,有点难搞(这个东西有点老,版本冲突有些包废弃了等等) 最后换到ubuntu系统弄了,下面是我的整体步骤: 1.烧完ubuntu镜像后,接显示器按系统流程进行系统部署(大于…

win10+Intel显卡安装配置stable-diffusion-webui绘画网页

系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 例如:第一章 Python 机器学习入门之pandas的使用 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目…

精准扶贫管理系统|基于Springboot的精准扶贫管理系统设计与实现(源码+数据库+文档)

精准扶贫管理系统目录 目录 基于Springboot的精准扶贫管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员模块的实现 (1)用户信息管理 (2)贫困户信息管理 (3)新闻类型管理 &a…

openGauss学习笔记-256 openGauss性能调优-使用Plan Hint进行调优-优化器GUC参数的Hint

文章目录 openGauss学习笔记-256 openGauss性能调优-使用Plan Hint进行调优-优化器GUC参数的Hint256.1 功能描述256.2 语法格式256.3 参数说明 openGauss学习笔记-256 openGauss性能调优-使用Plan Hint进行调优-优化器GUC参数的Hint 256.1 功能描述 设置本次查询执行内生效的…

程序员沟通之道:TCP与UDP之辩,窥见有效沟通的重要性(day19)

程序员沟通的重要性: 今天被师父骂了一顿,说我不及时回复他,连最起码的有效沟通都做不到怎么当好一个程序员,想想还挺有道理,程序员需要知道用户到底有哪些需求,用户与程序员之间的有效沟通就起到了关键性作…

图DP

目录 有向无环图DP 力扣 329. 矩阵中的最长递增路径 力扣 2192. 有向无环图中一个节点的所有祖先 有向有环图DP 力扣 1306. 跳跃游戏 III 有向无环图DP 力扣 329. 矩阵中的最长递增路径 给定一个 m x n 整数矩阵 matrix ,找出其中 最长递增路径 的长度。 对…

Golang | Leetcode Golang题解之第3题无重复字符的最长子串

题目: 题解: func lengthOfLongestSubstring(s string) int {// 哈希集合,记录每个字符是否出现过m : map[byte]int{}n : len(s)// 右指针,初始值为 -1,相当于我们在字符串的左边界的左侧,还没有开始移动r…

50道Java经典面试题总结

1、那么请谈谈 AQS 框架是怎么回事儿? (1)AQS 是 AbstractQueuedSynchronizer 的缩写,它提供了一个 FIFO 队列,可以看成是一个实现同步锁的核心组件。 AQS 是一个抽象类,主要通过继承的方式来使用&#x…

Linux系统——网络管理

此文章以红帽Linux9版本为例进行讲解。 红帽Linux9版本的网络管理十分全面,可在多处进行网络配置的修改,但需要注意的是,在9版本内,用户可在配置文件内进行网络配置的修改,但系统不会执行修改的命令,而在9之…

C语言中的结构体:高级特性与扩展应用

前言 结构体在C语言中的应用不仅限于基本的定义和使用,还包含一些高级特性和扩展应用,这些特性和应用使得结构体在编程中发挥着更加重要的作用。 一、位字段(Bit-fields) 在结构体中,我们可以使用位字段来定义成员…

小林coding图解计算机网络|基础篇01|TCP/IP网络模型有哪几层?

小林coding网站通道:入口 本篇文章摘抄应付面试的重点内容,详细内容还请移步: 文章目录 应用层(Application Layer)传输层(Transport Layer)TCP段(TCP Segment) 网络层(Internet Layer)IP协议的寻址能力IP协议的路由能力 数据链路层(Link Lay…

Hadoop Yarn

首先先从Yarn开始讲起,Yarn是Hadoop架构的资源管理器,可以管理mapreduce程序的资源分配和任务调度。 Yarn主要有ResourceManager、NodeManage、ApplicationMaster,Container ResourceMange负责管理全局的资源 NodeManage(NM&a…

阿里云2核2G服务器99元1年,3M固定带宽

阿里云服务器99元一年配置为云服务器ECS经济型e实例,2核2G配置、3M固定带宽和40G ESSD Entry系统盘,新用户和老用户均可买,续费不涨价依旧是99元一年,阿里云服务器网aliyunfuwuqi.com来详细说下阿里云99元服务器性能测评&#xff…

【学习】渗透测试有哪些重要性

随着信息技术的迅猛发展,网络安全问题日益凸显。渗透测试作为网络安全防御的重要手段之一,旨在模拟黑客攻击,发现并修复潜在的安全漏洞,提高网络系统的安全性。本文将介绍渗透测试的概念、重要性、实施步骤及实践案例,…

报错 | 2023新版IDEA/PyCharm连接远程服务器的Docker需使用密钥认证

文章目录 01 问题情景02 需求场景及工作原理03 解决步骤3.1 在本地生成密钥对3.2 将公钥保存至服务器3.3 本地连接时选择私钥文件 网上有很多文章讲怎么解决,但都要么写得很复杂,要么没有写明白原理或操作详情,造成我一头雾水。 01 问题情景…

NOIP2014提高组D1T2:联合权值

题目链接 NOIP2014提高组D1T2:联合权值 题目描述 无向连通图 G G G 有 n n n 个点, n − 1 n-1 n−1 条边。点从 1 1 1 到 n n n 依次编号,编号为 i i i 的点的权值为 W i W_i Wi​,每条边的长度均为 1 1 1。图上两点 ( u , v ) (…

腾讯云4核8G配置的服务器有哪些优惠?价格好不?

2024年腾讯云4核8G服务器租用优惠价格:轻量应用服务器4核8G12M带宽646元15个月,CVM云服务器S5实例优惠价格1437.24元买一年送3个月,腾讯云4核8G服务器活动页面 txybk.com/go/txy 活动链接打开如下图: 腾讯云4核8G服务器优惠价格 轻…

echarts快速入门

文章目录 一、echarts下载1.1、下载说明1.2、使用说明 二、绘制一个简单图表 一、echarts下载 echarts是百度研发团队开发的一款报表视图JS插件,功能十分强大,可在echart官网下载源码(一个echarts.min.js文件)进行使用。 1.1、…

Nest安装及使用~

前提条件 请确保您的操作系统上安装了 Node.js(版本 > 16) 📚要查看指南,请访问 https://docs.nestjs.com/ 📚要查看中文 指南, 请访问 https://docs.nestjs.cn/ $ node -v v16.18.1 $ npm -v 7.x.x安…