TruEra


文章目录

    • 关于 TruEra
    • 关于 TruLens


关于 TruEra

TruEra Gen AI Observability and LLM Evaluation​
Monitor, evaluate, and debug your LLM and Gen AI apps.
All part of Full Lifecycle AI Observability from TruEra.

  • 官网:https://truera.com
  • github : https://github.com/truera
    https://github.com/truera/truera-examples
  • trulens : https://www.trulens.org
    https://github.com/truera/trulens/
  • 论文:https://arxiv.org/abs/1802.03788

当您构建和部署ML模型时,TruEra会插入到您的ML堆栈中,让您测试、调试和监控您的项目,以确保每个模型都在做它应该做的事情——如果没有,为什么不呢?从帮助您完善数据的功能开发到高效培训和评估模型,再到验证最终的生产模型,TruEra为您提供了帮助。

要了解如何在TruEra中创建和接收您的第一个项目,请使用SDK Quickstart。
如果你想探索一个特定的人工智能质量概念,如性能、漂移或公平性,请从“入门示例”开始。
这些笔记本分为两部分,将引导您针对特定问题测试ML模型,以及如何沿该轴改进模型。最后,如果有一个特定的框架或环境需要集成,请查看“集成和扩展”部分!


TruEra是一家提供全面的机器学习模型测试、调试和监控软件的公司,推出了TruLens for LLM Applications,这是首个针对基于大型语言模型(如GPT)构建的应用程序的开源测试软件。
LLM正逐渐成为未来许多应用程序的关键技术,但人们也对其使用产生了越来越多的担忧,涉及LLM的幻觉、不准确性、有害性、偏见、安全性以及潜在的滥用等问题引起了广泛关注。

TruEra的联合创始人、总裁兼首席科学家Anupam Datta解释道:“TruLens反馈功能通过分析LLM应用程序生成的文本和元数据来评分。通过建立这种关系模型,我们可以自动将其应用于扩展模型评估。”


关于 TruLens

Evaluate and Track LLM Applications

  • trulens : https://www.trulens.org
  • github : https://github.com/truera/trulens/

TruLens provides a set of tools for developing and monitoring neural nets, including large language models.
This includes both tools for evaluation of LLMs and LLM-based applications with TruLens-Eval and deep learning explainability with TruLens-Explain.
TruLens-Eval and TruLens-Explain are housed in separate packages and can be used independently.


在这里插入图片描述


TruLens 在开发工作流的位置

Build your first prototype then connect instrumentation and logging with TruLens.
Decide what feedbacks you need, and specify them with TruLens to run alongside your app.
Then iterate and compare versions of your app in an easy-to-use user interface 👇
在这里插入图片描述


伊织 2024-03-05
慢慢载种你的树,耐心等待一切成熟

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/431946.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

时间序列分析技巧(一):根据ACF、PACF进行AR、MA、ARMA模型选择

程序员如何选择职业赛道? 🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一|统计学|干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项&#…

定时执行专家 - 自动截屏任务的设置步骤

以下是使用定时执行专家进行自动截屏的设置步骤: 下载并安装定时执行专家 从以下 官方博客 下载最新版本的定时执行专家,并按照提示进行安装。 BoomWorks软件的最新版-CSDN博客文章浏览阅读10w次,点赞9次,收藏42次。▉定时执行…

C语言数据结构与算法——深度、广度优先搜索(DFS、BFS)

目录 一、深度优先搜索(Depth-First-Search 简称:DFS) 无向图的深度优先搜索 有向图的深度优先搜索 二、广度优先搜索(Breadth-First-Search 简称:BFS) 无向图的广度优先搜索 有向图的广度优先搜索 深…

市场复盘总结 20240305

仅用于记录当天的市场情况,用于统计交易策略的适用情况,以便程序回测 短线核心:不参与任何级别的调整,采用龙空龙模式 一支股票 10%的时候可以操作, 90%的时间适合空仓等待 二进三: 进级率中 25% 最常用的…

CSS字体样式值,html注释标签

突破困境: 1. 提升学历 前端找工作,学历重要吗? 重要。谁要是告诉你不重要那一定是在骗你。现实情况是大专吃紧,本科够用,硕士占优,大专以下找到工作靠运气和真实力。 学历是硬伤,已经毕业的你…

(黑马出品_02)SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式

(黑马出品_02)SpringCloudRabbitMQDockerRedis搜索分布式 微服务技术栈治理 今日目标1.Nacos配置管理1.1.统一配置管理1.1.1.在nacos中添加配置文件1.1.2.从微服务拉取配置 1.2.配置热更新1.2.1.方式一1.2.2.方式二 1.3.配…

【Java设计模式】六、代理模式:静态代理、JDK + CGLIB动态代理

文章目录 1、代理对象2、代理模式结构3、静态代理4、JDK动态代理5、JDK动态代理的原理6、CGLIB动态代理7、三种代理的对比8、代理模式的总结 结构型设计是将类或者对象按某种布局(继承机制、组合聚合)来组成更大结构。包括七种: * 代理模式 …

代码随想录第51天|● 309.最佳买卖股票时机含冷冻期 ● 714.买卖股票的最佳时机含手续费 ●总结

文章目录 ● 309.最佳买卖股票时机含冷冻期思路代码 ● 714.买卖股票的最佳时机含手续费思路: ●总结 ● 309.最佳买卖股票时机含冷冻期 思路 代码 class Solution {public int maxProfit(int[] prices) {// 0.买入状态-(持有)// 1.保持卖出股票的状态// 2.今天…

JVM运行时数据区——堆

文章目录 1、堆的核心概述1.1、JVM实例与堆内存的对应关系1.2、堆与栈的关系1.3、JVM堆空间划分 2、设置堆内存大小与内存溢出2.1、设置堆内存大小2.2、内存溢出案例 3、新生代与老年代4、图解对象分配过程5、Minor GC、Major GC、Full GC5.1、GC的分类5.2、分代式GC策略的触发…

Sora:AI视频模型的无限可能与挑战

随着人工智能技术的突飞猛进,AI视频模型已成为科技领域的新焦点。OpenAI推出的AI视频模型Sora,凭借其卓越的技术性能和前瞻性,为AI视频领域的发展揭开了新的篇章。本文将从技术解析、应用场景、未来展望、伦理与创意以及用户体验与互动五个方…

【python基础学习09课_装饰器、模块、文件】

一、项目的日志 1、日志意义与级别 1、日志的意义:项目的日志 -- 开发编写的,日志记录 -- 测试就是去查看日志信息(为了协助我们进行问题的定位) 可以根据日志,看是哪个应用的哪台机器,出现了什么问题&…

Scala 之舞:林浩然与杨凌芸的 IDEA 冒险

Scala 之舞:林浩然与杨凌芸的 IDEA 冒险 The Dance of Scala: The IDEA Adventure of Lin Haoran and Yang Lingyun 在那个阳光明媚的日子里,林浩然如同一位英勇的探险家,踏入了 Scala 的 IntelliJ IDEA 开发环境的奇妙领域,他带着…

day7 字符数组

1:输入一个字符串,实现单词逆置 输入:"good good study" 输出:"study good good" 6 //单词逆置7 // good good study8 // study good good9 10 //整体逆置11 char str[50]"good good stu…

springboot集成logback打印彩色日志

一、logback介绍 Logback是由log4j创始人设计的另一个开源日志组件,官方网站: logback.qos.ch。它当前分为以下三个模块: logback-core:其它两个模块的基础模块。logback-classic:它是log4j的一个改良版本,同时它完整实…

C++基于多设计模式下的同步异步日志系统day6

C基于多设计模式下的同步&异步日志系统day6 📟作者主页:慢热的陕西人 🌴专栏链接:C基于多设计模式下的同步&异步日志系统 📣欢迎各位大佬👍点赞🔥关注🚓收藏,&am…

云手机运行在云端?安全性有保障吗

随着云计算技术的不断发展,云手机作为一种新兴的移动终端形态,逐渐成为人们关注的焦点。然而,对于许多人来说,云手机 是一个相对陌生的概念,安全性成为了他们最为关心的问题之一。本文将就云手机运行在云端的特点以及其…

JWT身份验证

在实际项目中一般会使用jwt鉴权方式。 JWT知识点 jwt,全称json web token ,JSON Web令牌是一种开放的行业标准RFC 7519方法,用于在两方安全地表示声明。具体网上有许多文章介绍,这里做简单的使用。 1.数据结构 JSON Web Token…

#include<ros/ros.h>头文件报错

快捷键 ctrl shift B 调用编译,选择:catkin_make:build)(要先在vscode上添加扩展:ros) 可以点击配置设置为默认,修改.vscode/tasks.json 文件 修改.vscode/tasks.json 文件,否则ros.h头文件会报错 内容修改为以下内…

鸿蒙Harmony应用开发—ArkTS声明式开发(通用属性:拖拽控制)

设置组件是否可以响应拖拽事件。 说明: 从API Version 10开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 ArkUI框架对以下组件实现了默认的拖拽能力,支持对数据的拖出或拖入响应,开发者只需要将这些组件…

残差网宽度残差网

目录 from # 从ResNet说起 # 更深的网络 # 理解shortcut # WRN之宽度残差块 # 退化现象 from WideResNet(宽残差网络)算法解析-鸟类识别分类-Pytorch实战-CSDN博客 # 前言 ResNet可以训练出更深的CNN模型ResNet模型的核心是建立前面层和后面层之间“短路链接”&#xff…