新品发布|灵雀云重磅推出大模型 LLMOps 平台

自即日起,灵雀云正式推出大模型 LLMOps 平台 Alauda Machine Learning (简称 AML),AML在整合传统 MLOps 解决方案的基础之上,为大模型/大语言模型场景提供更强大、更易用的功能。灵雀云意在将AML打造成全面覆盖传统 MLOps与LLMOps 场景的全栈式开发运维平台,以满足不同场景下机器学习模型的开发、部署和运维需求,为企业的创新与发展注入强大动力。

图片

图示:AML产品架构图

引言

在过往的系列文章中,灵雀云已向广大读者深入阐述了RAG、Agent、GPU虚拟化等前沿概念与技术。随着人工智能技术的高速发展,大型语言模型已然成为该领域发展的重要趋势。大模型凭借其强大的学习与泛化能力,在自然语言处理、机器翻译、图像生成等诸多领域均取得了卓越的成就。然而,传统的MLOps工作流在应对大模型时代的挑战时,已显得力不从心。于是,灵雀云归纳并总结了LLMOps的工作流,以更好地适应大模型时代的需求。

图片

图示:LLMOps的工作流

LLMOps 工作流始于预训练的大模型,是整个流程的基础,模型质量会直接影响业务应用效果。接下来,通过专业的 prompt 设计技巧,对大模型进行多角度、多场景的测试验证,确保满足业务需求。若验证成功,可选择直接发布或构建应用后发布。对于资源丰富的团队,还可对大模型进行微调,利用专业数据集训练以适应特定领域,再进行验证后发布供业务团队使用。

假设发布一个用于药物推荐的问答模型,用户可以直接向模型提问,如“感冒了,应该吃点什么药?”大模型在接收到这类问题时,可能会根据其训练数据直接回复一些药品名称。然而,感冒的症状和病因多种多样,因此,用户需要大模型进行细致的分析并提供针对性的药品推荐。

为了引导大模型从专业的角度思考问题并输出更详细、准确的回答,用户可以优化提示词,例如:“你是一个药学专家,请针对问题中的病情,从不同的病因、症状角度出发,进行用药推荐。问题:我感冒了,应该吃点什么药?”这样的提示有助于模型更深入地分析问题,并给出专业的建议。

如果用户期望大模型的回答更贴近老中医的语言风格,可以利用大量的中医对话文本数据对模型进行微调。这些数据应包含老中医在解答患者问题时的语言习惯和表达方式。经过微调后,再结合prompt工程进行优化,模型最终输出的内容可能如下:

老朽乃一介中药学之老朽,今见尔感冒之疾,愿以老朽所知,为尔指点迷津。感冒之症,或因风邪、或因寒邪、或因热邪,症状亦有不同,需辨证施治,方能药到病除……

AML 对 LLMOps 工作流的每个环节均提供了全面的工具及底层技术支持,接下来本文将深入探究 AML 的具体能力。

模型仓库

LLMOps工作流的首要步骤是准备大模型,这一过程中,模型仓库发挥着关键作用,它不仅为模型提供存储空间,还进行高效管理。在模型仓库中,用户可以轻松查看模型详情、管理文件、控制版本等。值得一提的是,AML自带的模型仓库与HuggingFace模型完全兼容,并支持多种自定义模型格式。AML在交付时,会根据用户要求内置相应模型,实现开箱即用的便捷体验。同时,支持用户自主创建模型仓库,手动上传模型文件,

并在发布推理 API 后,在模型仓库详情中直接查看模型效果。目前支持 transformers 框架文本生成、文本分类、文本到图像类型的模型,后续版本中将不断更新,丰富支持的模型类型。用户也可以通过此功能手动调整prompt 工程以及参数,优化模型效果。

图片

发布推理 API

 LLMOps 工作流中的一个关键步骤是模型的推理服务发布,它确保了模型能够高效、稳定地在实际业务场景中运行。

AML 使用 Kserve、Seldon MLServer 和 Triton 作为推理运行时框架,因此,发布的 API 服务均使用统一的 Kserve V2 HTTP REST API 接口协议。也可以通过自定义 preprocessor、postprocesser 完成自定义的格式转换。

模型的推理服务可以通过模型仓库快速将推理 API 发布到已部署 AML 平台的集群中。在边缘集群需要推理服务的场景下,也可以将推理 API 构建成镜像进行发布。推理 API 运行过程中,支持在推理 API 详情中查看运行日志,辅助故障排查,也可以支持模型的版本热更新、自动扩容配置等操作。

图片

应用仓库

AML 应用仓库支持使用 Gradio, Streamlit 开发的大模型应用,以及使用 Docker 定义的任意 AI 应用的版本化管理和自动构建发布。在 LLMOps 的工作流应用构建步骤中,可以在 AML 应用仓库中创建应用,将应用代码上传至应用仓库中进行版本化管理、镜像构建、发布应用。

图片

发布应用

在AML应用仓库页面中,支持将应用构建成镜像,并发布应用。由于部分应用需要进行环境变量或保密字典配置,因此支持创建应用配置,并以 Secrets 的方式挂载到应用中。在发布应用时也支持自定义配置环境变量。

图片

数据标注

AML 集成了 Label Studio 数据标注工具,可对接 S3 存储的各种训练数据类型。并支持多种类型数据和任务的协作标注工作,包含:机器视觉类模型、NLP、语音、音频、视频、对话 AI、Ranking 类模型、时间序列、结构化数据等。

图片

模型微调

大模型微调是使用专业领域的数据集对大模型进行进一步的训练,使其成为领域专家,在执行下游任务时,模型可以针对问题进行更专业的回答。AML提供了大模型微调的流程指导,包括:运行时镜像的构建、模型的下载、创建流水线任务等方法,帮助用户在模型仓库中快速启动微调任务。

图片

资产可视化

AML的概览页作为可视化的数据看板,清晰展示了用户资产统计信息。若ACP项目管理对AML平台命名空间设置了资源配额,概览页亦直观呈现配额与用量数据。同时,用户可便捷查看各集群中物理及虚拟GPU资源的使用情况,实现全面监控与高效管理。

图片

图片

结尾

AML v1.0 版本现已发布,全面涵盖上述各项功能及操作,满足基本的LLMOps场景需求。未来,灵雀云将致力于对LLMOps工作流中的其他关键环节进行持续迭代和优化,例如推出支持数据预览的数据集仓库、提供多样化的prompt方案、完善RAG和Agent功能,以及简化模型微调操作等。欢迎对AML及LLMOps工作流感兴趣的用户联系我们,扫描下方二维码,预约demo演示,共同探索更多可能性!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/495976.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《YOLOv9魔术师专栏》专栏介绍 专栏目录

《YOLOv9魔术师专栏》将从以下各个方向进行创新(更新日期24.3.28): 【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化 】【SPPELAN & RepNCSPELAN4优化】【…

Linux系统使用Docker部署Portainer结合内网穿透实现远程管理容器和镜像

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

PMO活动︱2024第十三届中国PMO大会将于5月在京召开

PMO站在企业高度进行组织级项目管理,工作虽然千头万绪但首当其冲的无疑是在企业中建立统一的、标准化的项目管理方法体系,“无规矩不成方圆”,根据项目管理行业标准结合企业实际情况制定一整套适合本企业的项目管理规范制度,这是P…

如何使用Excel创建一个物品采购表

在企业的日常运营中,物品采购是一个常见且重要的活动。有效的采购管理不仅可以确保企业及时获得所需物资,还可以控制成本、提高效率。Microsoft Excel是一个功能强大的工具,它可以帮助我们创建和管理物品采购表。本文将详细介绍如何使用Excel…

如何制定公平、客观的考核标准,避免主观偏见和人情因素的影响?

在企业管理中,考核标准的制定是确保员工绩效评价公正、客观的关键环节。然而,由于主观偏见和人情因素的影响,很多企业在考核过程中往往难以做到公平、公正。本文将探讨如何制定公平、客观的考核标准,以最大程度地减少主观偏见和人…

【Frida】【Android】04_Objection安装和使用

🛫 系列文章导航 【Frida】【Android】01_手把手教你环境搭建 https://blog.csdn.net/kinghzking/article/details/136986950【Frida】【Android】02_JAVA层HOOK https://blog.csdn.net/kinghzking/article/details/137008446【Frida】【Android】03_RPC https://bl…

在点集的新知识面前百年集论不堪一击

黄小宁 与x∈R相异(等)的实数均可表为yxδ(增量δ可0也可≠0),因各实数的绝对值都可是表示长度的数故各实数都可是数轴上点的坐标,于是x∈R变换为实数yxδ的几何意义可是:一维空间“管道”g内R…

ICP Hacker House 邀你共赴 IC 生态项目开发新风口

为了更好地探索区块链技术前沿,体验作为全面智能合约云平台的互联网计算机(Internet Computer Protocol),将数据、内容、计算和用户体验全部托管于链上,IC 生态致力于推动去中心化互联网的深度发展,并将更安…

为何云安全产品需区分四层与七层协议攻击:深入理解与应对策略

引言 随着云计算技术的发展和广泛应用,云安全产品的精细化与智能化需求日益凸显。其中,针对网络攻击的防御措施往往基于对传输协议层面的理解和处理,特别是四层(传输层)和七层(应用层)协议攻击…

1、动态数组

1、动态数组 一、什么是数据结构❓1、线性结构2、树形结构3、图形结构 二、线性表三、数组(Array)四、动态数组(Dynamic Array)1、接口设计2、动态数组的设计3、查(1) size、isEmpty(2) indexOf、contains(3) get、checkIndex 4、…

实力上榜 | 创新微MinewSemi再获“物联之星”年度企业投资价值50强

近日,由深圳市物联传媒有限公司、AIoT星图研究院、IOTE组委会、深圳市物联网产业协会主办的“物联之星”2023中国物联网行业年度榜单评选结果正式公布。经过层层筛选,创新微MinewSemi获评2023年度“中国物联网企业投资价值50强”,连续两年实力…

应急响应实战笔记04Windows实战篇(1)

第1篇:FTP暴力破解 0x00 前言 ​ FTP是一个文件传输协议,用户通过FTP可从客户机程序向远程主机上传或下载文件,常用于网站代码维护、日常源码备份等。如果攻击者通过FTP匿名访问或者弱口令获取FTP权限,可直接上传webshell&#…

Redis 不再“开源”:中国面临的挑战与策略应对

Redis 不再“开源”,使用双许可证 3 月 20 号,Redis 的 CEO Rowan Trollope 在官网上宣布了《Redis 采用双源许可证》的消息。他表示,今后 Redis 的所有新版本都将使用开源代码可用的许可证,不再使用 BSD 协议,而是采用…

WPF自定义Panel:让拖拽变得更简单

在 WPF 应用程序中,拖放操作是实现用户交互的重要组成部分。通过拖放操作,用户可以轻松地将数据从一个位置移动到另一个位置,或者将控件从一个容器移动到另一个容器。然而,WPF 中默认的拖放操作可能并不是那么好用。为了解决这个问…

http接口测试—自动化测试框架设计(超详细)

🍅 视频学习:文末有免费的配套视频可观看 🍅 关注公众号【互联网杂货铺】,回复 1 ,免费获取软件测试全套资料,资料在手,涨薪更快 一、测试需求描述 对服务后台一系列的http接口功能测试。 …

【Git篇】复习git

文章目录 🍔什么是git⭐git和svn的区别 🍔搭建本地仓库🍔克隆远程仓库🛸git常用命令 🍔什么是git Git是一种分布式版本控制系统,它可以追踪文件的变化、协调多人在同一个项目上的工作、恢复文件的旧版本等…

微信开发者工具创建一个小程序

创建项目 对于上面这个AppID可以自行选择是注册还是测试号,我是使用的测试号,之后再下面选择模板,我这里选择了JS-基础模板。 进入项目后在模拟器中可看到如下页面: 添加提交按钮进行页面跳转 添加需要跳转的文件夹,…

更新时间后OpenStack neutron 401 Unauthorized解决办法

发现时间跟现实时间有偏差,用 ntpdate cn.pool.ntp.org 更新时间后再用neutron 发现报错 401-{uerror: {umessage: uThe request you have made requires authentication., ucode: 401, utitle: uUnauthorized}} 而且用的是账号密码的认证,还是无法正…

跑通飞浆平台的MTMCT 跨镜跟踪示例

想跑通飞浆平台的MTMCT跨镜跟踪示例,真的是难上加难啊! 改了几处代码,可以顺利跑通了,特此记录: 第一处:不要拉主线的代码,改成 !git clone https://gitee.com/paddlepaddle/PaddleDetection…

Wagtail-基于Python Django的内容管理系统CMS实现公网访问

目录 ⛳️推荐 前言 1. 安装并运行Wagtail 1.1 创建并激活虚拟环境 2. 安装cpolar内网穿透工具 3. 实现Wagtail公网访问 4. 固定Wagtail公网地址 ⛳️推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给…