何使用本地 LLMs 为可观察性 AI 助手提供本地部署支持

作者:来自 Elastic David Hope

了解如何为私有或本地部署配置本地 LLM。更多阅读:使用 Elastic 和 LM Studio 的 Herding Llama 3.1。

智能大语言模型已经存在了一段时间,一些客户做的第一件事就是在发生了许多严重的数据泄露事件后采取措施阻止这些模型,例如:

遗憾的是,这也意味着这些企业错过了这些 LLMs 可以做的令人惊叹的事情,尤其是在可观察性领域。由 LLM 提供支持的 Elastic 可观察性 AI 助手可以帮助解决许多用例:

  • 更快、更准确的根本原因分析
    • 不仅仅是依靠启发式方法让你停留在 “CPU is busy” 作为根本原因。真正让你找到根本原因。
  • 可观察性的民主化
    • LLM 帮助新手和初级用户以自然语言交谈、进行数据分析并帮助他们学习和提升技能。初级 BCG 顾问使用 ChatGPT-4 的工作质量提高了 43%。
  • 不用来回切换工具
    • 能够在同一个界面内对问题进行讨论意味着几乎不需要进行上下文切换。
  • 随时掌握最新的专业知识
    • 借助基于 Search AI 的 RAG(检索增强生成)和 Elastic,你能够从工单系统中获取最新的信息,并将其纳入你的故障排查流程中。
  • 摆脱单调乏味的任务
    • Elastic AI Assistant 可以自动执行许多工作流程,自动调用 Elastic API 来生成可视化效果并采取补救措施。

由于这些好处被搁置,很明显企业需要一种替代方法来保护其业务,同时仍然能够使用 LLMs。

一种越来越流行的方法是使用本地可部署的 LLM,现在有许多这样的选项可用,其中最受欢迎的是 Mistral 和 LLAMA3。

在本博客中,我们将向你展示如何至少获得 8.14 版本的 Elastic AI Assistant 来连接到这些可私下部署的 LLM。

先决条件和配置

如果你计划关注此博客,以下是我们用于设置配置的一些组件和详细信息:

  • 确保你在 Elastic Cloud 上有一个帐户和一个已部署的堆栈(请参阅此处的说明)。
  • AWS 中的 g5.xlarge 实例(或其他云提供商的等效实例)用于运行 LLM。这些实例配备 NVIDIA A10 GPU,在成本和性能之间取得平衡。确保你使用默认的 Amazon Linux 操作系统。
  • 我也在我的环境中使用 otel 演示,所以我有一些数据可以使用,你也可以通过克隆存储库并按照此处的说明执行此操作。

设置 ollama

使用 Amazon Linux 启动 G5 实例,如下所示,模型往往相当大,因此你可能希望将磁盘空间增加到至少 200GB:

G5 实例启动后,你需要登录并首先运行命令:

    sudo dnf install kernel-modules-extra.x86_64

这将安装额外的库以使 GPU 支持在 Amazon Linux 上运行。

接下来安装 ollama:

    curl -fsSL https://ollama.com/install.sh | sh

运行 ollama:

    ollama run llama3

然后编辑 ollama 配置以允许其监听公共地址:

    sudo mkdir /etc/systemd/system/ollama.service.d
    sudo vi /etc/systemd/system/ollama.service.d/override.conf

添加以下几行:

    [Service]
    Environment="OLLAMA_HOST=0.0.0.0"

完成此操作后,重新启动服务:

    sudo systemctl daemon-reload
    sudo systemctl restart ollama

为了配置 Elastic,我们使用 ollama 博客中提到的配置来实现 OpenAI 兼容性:

如那里所述,我们需要打开端口 11434。要在你的 AWS 主机上打开端口 11434,请登录 AWS 管理控制台并导航到 EC2 仪表板。转到左侧菜单中的 “Instances” 并选择你的实例,找到你的 EC2 实例。在 “Description” 选项卡中,找到 “Security groups” 部分并单击安全组 ID。在安全组详细信息中,转到 “Inbound rules” 选项卡并单击 “Edit inbound rules”。添加一条新规则,类型为 “Custom TCP Rule”,协议为 “TCP”,端口范围为 “11434”。将源设置为所需的 IP 范围,然后单击 “Save rules” 以应用更改。

并运行测试:

    curl http://[YOUR EC2 PUBLIC DNS]:11434/v1/chat/completions \
        -H "Content-Type: application/json" \
        -d '{
            "model": "llama3",
            "messages": [
                {
                    "role": "system",
                    "content": "You are a helpful assistant."
                },
                {
                    "role": "user",
                    "content": "Hello!"
                }
            ]
        }'

结果应该包含:“Hello there! It's nice to meet you”

现在你已经成功运行了属于你自己的私有大型语言模型。

设置 Elastic

首先让我们从右上角的   图标访问 AI 助手。

接下来点击按钮 “Set up GenAI connector”:

使用 OpenAI 并按以下方式设置连接器,注意,API 密钥是 ollama,具体文档说明见此处:

接下来,AI 助手将为你设置知识库:

设置好 AI 助手后,你需要打开 “Simulated Function Calling”,如下所示。首先点击 “AI Assistant Settings”,如下所示。

接下来勾选 “Simulated Function Calling”:

完成后,我们可以像这样让 AI 助手工作:

总结

我们设置了 Elastic Observability AI Assistant 来使用其他模型,特别是私有或本地模型,在示例中我们使用 llama3。你可以配置 olama 来使用其他模型(例如 mistral)并进行测试,以查看哪些模型能为你提供最佳结果。

请注意,你的结果可能会因你使用的模型而异,并且 Elastic 无法支持此处的所有不同模型,我们的目标是支持那些能提供最高质量结果的模型,以便客户获得最佳体验。

原文:How to power Observability AI Assistant with local LLMs for on-prem deployments — Elastic Observability Labs

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/896054.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

nltk_data下载安装

gitee上下载zip下载后解压缩(三次)packages文件夹改名为nltk_data 找应该放在哪: 放到上面列出的任一位置: 放到正确位置后:

搭建Golang gRPC环境:protoc、protoc-gen-go 和 protoc-gen-go-grpc 工具安装教程

参考文章: 安装protoc、protoc-gen-go、protoc-gen-go-grpc-CSDN博客 一、简单介绍 本文开发环境,均为 windows 环境,mac 环境其实也类似 ~ ① 编译proto文件,相关插件 简单介绍: protoc 是编译器,用于将…

数据分析和可视化python库orange简单使用方法

Orange 是一个基于 Python 的数据挖掘和机器学习库,它提供了一系列可视化工具和算法,用于数据分析、机器学习和数据可视化等任务。 一、主要特点 可视化界面:Orange 提供了直观的可视化界面,使得用户可以通过拖放操作构建数据分…

HCIP-HarmonyOS Application Developer 习题(十五)

(判断)1、在HarmonyOs中发布带权限公共事件,发布者首先要在config.json中申请所需的权限。 答案:正确 分析:发布携带权限的公共事件:构造CommonEventPublishInfo对象,设置订阅者的权限。 &#…

nacos实现配置管理

项目结构 引入依赖 <!--统一配置管理--><dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-config</artifactId></dependency><!--读取bootstrap文件--><dependency>&l…

电机学习-Park变换

一、Park变换 坐标关系&#xff1a; I d I α ∗ c o s θ e I β ∗ s i n θ e I_d I_\alpha*cos\theta_e I_\beta*sin\theta_e Id​Iα​∗cosθe​Iβ​∗sinθe​ I q − I α ∗ s i n θ e I β ∗ c o s θ e I_q -I_\alpha*sin\theta_e I_\beta*cos\theta_…

Redis 常用指令详解

Redis是一款开源的、高性能的键值对存储数据库&#xff0c;常用于缓存、会话存储以及其他需要快速访问的数据场景。本文将介绍Redis的一些常用指令&#xff0c;并通过代码示例进行说明。 一、连接操作指令 1. 连接 Redis 服务器 ./redis-cli -h 127.0.0.1 -p 63792. 认证&a…

【基于Spring Boot+Unipp的古诗词学习小程序【原创】

一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构&#xff1a;B/S架构 运行环境&#xff1a;win10/win11、jdk17 前端&#xff1a; 技术&#xff1a;框架Vue.js&#xff1b;UI库&#xff1a;ElementUI&#xff1b; 开发工具&…

【纯前端excel导出】vue2纯前端导出excel,使用xlsx插件,修改样式、合并单元格

官网&#xff1a; 1、xlsx-js-style xlsx-js-style | xlsx-js-style homepage 2、xlsx SheetJS 中文网 一、使用第三方插件 1、安装 npm install xlsx-js-style 2、引入 import xlsx from xlsx-js-style xlsx插件是基础的导出&#xff0c;不可以修改样式&#xff0c;直接xlsx-s…

基于SSM校园拼车系统的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;学生管理&#xff0c;司机管理&#xff0c;订单信息管理&#xff0c;接单信息管理&#xff0c;留言信息管理 司机账号功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;订单信息管理&…

用Spring AI 做智能客服,基于私有知识库和RAG技术

Java智能客服系统运用RAG技术提升答疑精准度 基于Spring ai 的 RAG&#xff08;检索增强生成&#xff09;技术&#xff0c;Java智能客服系统能够利用私有知识库中的信息提供更准确的答疑服务。 它的核心思路是&#xff1a; 首先&#xff0c;将客服QA以Word形式导入到系统中&…

vr体验馆计时收银软件试用版下载 佳易王VR游戏厅计时计费管理系统使用操作教程

一、前言 【软件试用版资源文件下载可以点击文章最后卡片了解】 vr体验馆计时收银软件试用版下载 佳易王VR游戏厅计时计费管理系统使用操作教程 VR体验馆计时计费软件是专门为VR体验馆设计的管理工具&#xff0c;旨在提高服务效率和客户的满意度。软件能够记录客户使用设备的…

Windows 通过私钥远程连接 Linux 服务器【含密钥对制作】

在现代软件开发和系统管理中&#xff0c;远程连接 Linux 服务器是非常常见的任务。尤其在 Windows 系统下&#xff0c;使用 SSH 工具连接 Linux 服务器是开发者们不可或缺的技能之一。为了保证安全性&#xff0c;SSH 密钥对&#xff08;公钥和私钥&#xff09;的使用可以避免传…

STM32CUBEIDE FreeRTOS操作教程(七):queue队列

STM32CUBEIDE FreeRTOS操作教程&#xff08;七&#xff09;&#xff1a;queue队列 STM32CUBE开发环境集成了STM32 HAL库进行FreeRTOS配置和开发的组件&#xff0c;不需要用户自己进行FreeRTOS的移植。这里介绍最简化的用户操作类应用教程。以STM32F401RCT6开发板为例&#xff…

家用wifi的ip地址固定吗?换wifi就是换ip地址吗

在探讨家用WiFi的IP地址是否固定&#xff0c;以及换WiFi是否就意味着换IP地址这两个问题时&#xff0c;我们首先需要明确几个关键概念&#xff1a;IP地址、家用WiFi网络、以及它们之间的相互作用。 一、家用WiFi的IP地址固定性 家用WiFi环境中的IP地址通常涉及两类&#xff1a…

[Unity Demo]从零开始制作空洞骑士Hollow Knight第十四集:制作新的场景以及制作创建切换管理系统

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、制作新的场景 1.重新翻新各种Sprite2.制作地图前期应该做的事情3.疯狂的制作地图二、制作场景切换管理系统 1.制作场景切换点TransitionPoint2.切换场景时的…

【Linux内核】eBPF基础篇

系列综述&#xff1a; &#x1f49e;目的&#xff1a;本系列是个人整理为了学习ebpf机制的&#xff0c;整理期间苛求每个知识点&#xff0c;平衡理解简易度与深入程度。 &#x1f970;来源&#xff1a;材料主要源于–知乎ebpf专栏文章–进行的&#xff0c;每个知识点的修正和深…

【JavaEE初阶】深入理解TCP协议中的封装分用以及UDP和TCP在网络编程的区别

前言 &#x1f31f;&#x1f31f;本期讲解关于TCP/UDP协议的原理理解~~~ &#x1f308;上期博客在这里&#xff1a;【JavaEE初阶】入门视角-网络原理的基础理论的了解-CSDN博客 &#x1f308;感兴趣的小伙伴看一看小编主页&#xff1a;GGBondlctrl-CSDN博客 &#x1f525; …

前端算法:时间复杂度和空间复杂度

一、算法的重要性 1.为什么前端开发需要学习算法&#xff1f; 学习算法可以帮助培养逻辑思维能力&#xff0c;在面对复杂的问题时&#xff0c;能够系统性地分析问题、分解步骤并成功找到的正确的解决方案。 掌握基本的排序、查找算法和时间复杂度分析可以帮助编写更高效的代码…

移动网络知识

一、3G网络 TD-SCDMA&#xff08;时分同步码分多址接入&#xff09;、WCDMA&#xff08;宽带码分多址&#xff09;和CDMA2000三种不同的3G移动通信标准 TD-SCDMA&#xff08;时分同步码分多址接入&#xff09;&#xff1a;中国自主开发的一种3G标准主要用于国内市场&#xff…