我“开发“了一款大模型应用,AI门槛这么低了吗?

现在国产大模型多如牛毛。虽然可选的大模型产品很多,但普遍存在同质化、高分低能、实用性差、专业性不足的问题,哪怕是诸如ChatGPT、Gemini这样全球顶尖的大模型也会存在这种情况。

还有一点比较重要的是,由于大模型需要算力、算法、数据的基础支持,一般被大公司所把控,小企业和个人很难去参与,大公司普遍缺乏想象力的,而小企业和个人才是创新的底层动力。所以大模型需要有足够低的门槛让更多人参与进来,才能真正的走向商业化。

同时,也需要有硬实力。前段时间有粉丝和我说,他正在“BigModel开放平台”上在构建一款小说解读应用-小说神器,专门用来解读长篇小说,并提炼生成短篇故事脚本,然后再剪辑成自媒体视频,一整套的流程完全可以交给AI。我觉得这个还是蛮有意思的,让开发者自己去构建垂直应用。

他用的模型是GLM-4-Long,可以用于处理长文本。整个流程大概是:先构建知识库,比如各种小说文本。然后构建Ai应用,选择模型并微调,最后进行测试并上线。

长文本神器-GLM-4-Long模型

我特地查了下GLM-4-Long,这是智谱AI BigModel开放平台推出的一款专为处理超长文本和记忆型任务设计的大模型。

看了下文档介绍,GLM-4-Long具有高达100万字符的上下文长度支持,可以进行多文档分析、长篇幅内容生成等。

开发AI汽车选购应用

接下来,我尝试用GLM-4-Long模型构建了一个AI汽车选购建议工具-名叫“帮帮选车”,并提供一个具体的构建过程,包括使用Python接入API的示例代码。

  • 需求分析

每次构建AI应用首先确定应用的目标用户和核心功能,“帮帮选车”是为不同需求的用户提供个性化的汽车推荐,你只需要提出自己的买车需求,它就可以针对性的给出建议。

比如prompt: “我是一名刚毕业的大学生,想买一辆经济实惠且皮实的轿车,预算有限10万左右,用于平时上班代步,周末自驾短途出游。请你推荐一款符合我需求的车”。

  • 数据准备

“帮帮选车”是汽车类应用,所以必须学习汽车相关的知识,比如车型、参数、技术、价格、用户口碑等等,就需要收集汽车相关的长文本数据,如汽车说明书、用户评价、汽车参数等,用于GLM-4-Long大模型的学习。

  • 环境配置

这里需要注册BigModel开放平台账号并获取API Key,然后安装BigModel 的Python库,用于连接接口,进行数据交互。


  • 新建知识库

有了数据之后,可以新建一个知识库,由于我要搭建汽车选购类应用,因此新建了汽车类的知识库,里面包括我收集的汽车相关文档。


  • 新建AI应用

创建好知识库后,新建AI应用,这里选择问答机器人



接着配置prompt格式和选择模型,这里选择GLM-4-Long模型,你可以对模型进行微调,选择适合对话场景的配置。

最后发布应用。

  • 应用测试

模型发布后,可以在应用内进行测试,编写选车相关的prompt,看看它怎么回答。


以下是给到的提示和模型返回的答案。

  • 功能开发和用户界面设计

如果模型成熟的话,可以将其产品化,基于模型输出结果,开发汽车推荐、问答等功能,然后设计用户友好UI界面,允许用户输入他们的汽车选购需求。接着对应用进行测试,根据反馈进行优化。

最后将应用部署到服务器,供用户使用。

  • 模型API调用

在Python中使用API Key调用GLM-4-Long模型API,进行问答。

首先,确保你已经安装了BigModel的Python库-zhipuai,如果没有,你可以直接使用HTTP请求库(如requests)来调用API。

# 导入所需的库
import requests
import json
# 填写你的API Key
API_KEY = '你的API_KEY'
ENDPOINT = 'https://open.bigmodel.cn/api/paas/v4/chat/completions'
# 准备请求数据
headers = {
    'Authorization': f'Bearer {API_KEY}',
    'Content-Type': 'application/json'
}
data = {
    "model": "GLM-4-Long",
    "messages": [
        {"role": "system", "content": "你是一个汽车专家,能够提供购车建议。"},
        {"role": "user", "content": "我想要购买一辆家用轿车,预算在20万左右。"}
    ],
    "stream": True
}
# 发送请求
response = requests.post(ENDPOINT, headers=headers, json=data)
# 检查响应
if response.status_code == 200:
# 解析响应内容
    response_json = response.json()
    for chunk in response_json.get('choices', []):
        if chunk.get('finish_reason') == 'stop':
            print(f"汽车选购建议: {chunk['message']['content']}")
else:
    print(f"请求失败,状态码:{response.status_code}")

这里要注意下,以上代码只是示例,实际使用时需要根据BigModel开放平台提供的API文档进行相应的调整。然后有几个注意事项,确保处理好API Key,不要在公共代码库中暴露你的API Key。

另外,在生产环境中使用时,要考虑错误处理和日志记录,确保应用的稳定性和可维护性。

如何开发小说阅读神器呢?

前面讲了一个粉丝用BigModel开发了一款小说生成故事脚本并制作成视频的应用,这个是当前自媒体领域的热门项目,可以自动化的产出脚本。

首先创建知识库,我们上传小说合集到知识库里。


然后创建应用-小说神器,选择GLM-4-Long,并对模型进行微调。

最后测试模型的对话效果,让它解读一篇小说,并生成故事脚本。

prompt:总结小说《孔乙己》主要内容生成短视频解说文本,要求保留主要情节和人物,能体验冲突、转折和内涵,文本风格轻松有趣。


以下是给到的提示和模型返回的答案。

什么是BigModel开放平台?

前面讲了几个在BigModel开放平台上构建大模型应用的案例,这个平台和OpenAI GPTS、以及字节Coze有点类似,它是由智谱AI开发的大模型开发平台。

你可以把这类平台想象成一个大厨房,里面提供各种智能工具、模型、API接口、安全、财务管理等等一系列服务,开发者可以根据行业知识来构建自己的AI应用,就像厨师烧菜一样,锅碗瓢盆、油盐酱醋都给你准备好了,烧什么菜由你来决定。

比如说开发者关心的API接口,它能接入GLM-4、GLM-4V等主流模型,而且支持各种语言调用。你可以独立部署模型,进行模型微调。

每个行业都有一定的专业壁垒,垂直大模型也一样,需要专业知识库训练,BigModel开放平台支持注入开发者自己的专业知识,进行定制化训练。

总结

总的来说,如今国内的大模型行业还处于同质化较严重的阶段,大家都在卷算力算法,但应用创新比较少,我觉得可能是门槛太高,参与的人太少的缘故。

像BigModel这样的开放平台可能会起到一定的促进作用,毕竟作为个人或小企业开发者,你能用很低的成本能创建大模型应用,唯一需要担心的是数据和应用场景。但从整个行业来说参与的人越多越好,量变会产生质变。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/871546.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue+ckEditor5 复制粘贴wold文字+图片并保存格式

第一步在vue2项目下安装 npm install --save ckeditor/ckeditor5-build-decoupled-document 第二 项目下新建一个plugins的文件夹将这个包ckeditor5-build-classic放入 (包在页面最上方 有个下载按钮 可以下载) 刚开始时 ckeditor5-build-classic文件…

「字符串」前缀函数|KMP匹配:规范化next数组 / LeetCode 28(C++)

目录 概述 思路 核心概念:前缀函数 1.前缀函数 2.next数组 1.考研版本 2.竞赛版本 算法过程 构建next数组 匹配过程 复杂度 Code 概述 为什么大家总觉得KMP难?难的根本就不是这个算法本身。 在互联网上你可以见到八十种KMP算法的next数组…

SQL 布尔盲注 (injection 第六关)

简介 SQL注入(SQL Injection)是一种常见的网络攻击方式,通过向SQL查询中插入恶意的SQL代码,攻击者可以操控数据库,SQL注入是一种代码注入攻击,其中攻击者将恶意的SQL代码插入到应用程序的输入字段中&am…

26.删除有序数组中的重复项---力扣

题目链接: . - 力扣(LeetCode). - 备战技术面试?力扣提供海量技术面试资源,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/remove-duplicates-from-sorted-array/descript…

嵌入式学习——(Linux高级编程——线程)

线程 一、pthread 线程概述 pthread(POSIX threads)是一种用于在程序中实现多线程的编程接口。它与进程一样,可以用于实现并发执行任务,但与进程相比有一些不同的特点。 二、优点 1. 比多进程节省资源:进程在创建时…

PDPS软件 那智机器人 (丰田版)离线程序导出处理

在PDPS仿真软件中导出的那智机器人离线程序,一般是无法直接给TFD控制装置-那智机器人(丰田式样版)导入及识别使用。因此要对导出的程序进行转换编译处理,才能给TFD那智机器人(丰田式样版)导入离线程序。以下…

HarmonyOS 开发

环境 下载IDE 代码 import { hilog } from kit.PerformanceAnalysisKit; import testNapi from libentry.so; import { router } from kit.ArkUI; import { common, Want } from kit.AbilityKit;Entry Component struct Index {State message: string Hello HarmonyOS!;p…

类与对象(中(2))

开头 大家好啊,上一期内容我们介绍了类与对象中六大默认成员函数中的两种--->构造函数与析构函数,相信大家多少都形成了自己的独到见解。那么今天,我将继续就拷贝构造函数与运算符重载函数来展开讲解,话不多说,我们…

Python版《超级玛丽+源码》-Python制作超级玛丽游戏

小时候最喜欢玩的小游戏就是超级玛丽了,有刺激有又技巧,通关真的很难,救下小公主还被抓走了,唉,心累,最后还是硬着头皮继续闯,终于要通关了,之后再玩还是没有那么容易,哈…

十五年以来 — 战略性云平台服务的演进路径之全面呈现(含亚马逊、微软和谷歌)

Gartner每年都发布对全球IaaS平台进行评估的魔力象限报告。2023年底,Gartner将此项评估的名称改为“战略性云平台服务”(Strategic cloud platform services),尽管其核心仍为IaaS,但是,毫无疑问&#xff0c…

手机云电脑游戏测评:ToDesk、易腾云、达龙云、青椒云四款对比分析

文章目录 📑 引言一、背景概述测试目标 二、测试方案与评测标准2.1 测试设备2.2 评测标准 三、云电脑移动端实测3.1 ToDesk云电脑3.1.1 安装步骤与用户界面3.1.2 性能测试3.1.3 多场景适用性与兼容性3.1.4 性价比 3.2 易腾云电脑3.2.1 安装流程与用户界面3.2.2 帧率…

WebRTC为何成为视频开发领域的首选技术? EasyCVR视频转码助力无缝视频通信

随着互联网的飞速发展,视频通信已成为日常生活和工作中不可或缺的一部分。从在线教育、视频会议到远程医疗、在线直播,视频开发的需求日益增长。在这些应用场景中,选择何种技术来构建视频系统至关重要。 目前,在很多视频业务的开…

Golang | Leetcode Golang题解之第352题将数据流变为多个不相交区间

题目&#xff1a; 题解&#xff1a; type SummaryRanges struct {*redblacktree.Tree }func Constructor() SummaryRanges {return SummaryRanges{redblacktree.NewWithIntComparator()} }func (ranges *SummaryRanges) AddNum(val int) {// 找到 l0 最大的且满足 l0 < val…

Browserless 网页抓取:Playwright 中的 NodeJS

什么是 Playwright&#xff1f; Playwright 是一个用于 Web 测试和自动化的开源框架。基于 Node.js&#xff0c;由 Microsoft 开发&#xff0c;它通过单一 API 支持 Chromium、Firefox 和 WebKit。它可以在 Windows、Linux 和 macOS 上运行&#xff0c;并且兼容 TypeScript、J…

设计模式六大原则(一)--单一职责原则

摘要 单一职责原则是设计模式六大原则之一&#xff0c;强调一个类应该仅有一个引起它变化的原因&#xff0c;即每个类应仅负责一项职责。本文通过详细探讨单一职责原则的定义、实现方式、优缺点及其适用场景&#xff0c;揭示了其在软件设计中的核心地位。通过类的拆分、接口设…

TCP协议段中的六个标志位

目录 ACK SYN RST FIN PSH URG TCP报文格式中的六个标志位由6个比特构成&#xff0c;在通信双方基于TCP协议互相发送报文数据时可以通过报头中标志位来区别对方发送的报文数据的请示。 ACK 确认号是否有效。 接收端对所收到的报文进行检查&#xff0c;若未发现错误&…

周易测算系统开发:融合古典智慧与现代技术的创新实践

一、引言 周易&#xff0c;作为中国古代文化的瑰宝&#xff0c;蕴含着深邃的哲学思想与预测智慧&#xff0c;其独特的六十四卦体系及爻变原理&#xff0c;自古以来便被人们用于探索自然规律、人生哲理及未来趋势。随着科技的飞速发展&#xff0c;将周易智慧与现代计算机技术相结…

StackStorm自动化平台

1. StackStorm概述 1.1 StackStorm介绍 StackStorm是一个开源的事件驱动自动化平台&#xff0c;它允许开发者和系统管理员自动化IT和网络操作。StackStorm结合了IT运维、DevOps和网络安全团队的需求&#xff0c;提供了一个集中式的工作流自动化解决方案&#xff0c;包括事件响…

图像数据处理13

三、空域滤波 3.1滤波器的基本概念 什么是滤波&#xff1f; 简单来说就是从干扰信号中提取出有用的信号 3.1.1空域滤波&#xff08;Spatial Domain Filtering&#xff09; 空域滤波适用于简单的滤波任务&#xff0c;直接对图像的像素空间进行操作。它通过对图像中的每个像…