使用MongoDB 构建AI:轻松应对从预测式AI到生成式AI

毫无疑问,如今从生成式AI (GenAI )中获益最大的,是那些早已运用预测式AI (Predictive AI )的组织。

2023年6月,麦肯锡在2023年6月发布的《生成式人工智能的经济潜力》研究中也得出了与此相同的结论。

原因主要有以下几点:

  1. 内部文化决定组织是否愿意尝试和探索人工智能?

  2. 组织是否具备相关技能?(但必须强调的是相比预测式AI,生成式AI更依赖于开发者,而不是数据科学家)

  3. 组织是否拥有准确无误、精心挑选的数据,可随时输入到GenAI模型中?

但这并不意味着只有具备预测式AI使用经验的团队才能从生成式AI中获益。如果分析研究MongoDB “构建AI案例研究系列” 中的实例,不难发现,许多处于不同AI成熟度阶段的组织都在利用MongoDB进行人工智能创新。

本文将介绍两家企业,它们成功地构建了预测式AI应用程序,并朝着生成式AI的方向迈进:

  1. MyGamePlan助力职业足球运动员和教练提升球队表现。

  2. Ferret.ai利用公开数据进行背景调查,帮助企业和消费者之间建立信任。

在这两个案例中,预测式AI成为数据驱动型决策的核心。如今,这两家公司都正在探索生成式AI,希望通过推出新产品来扩展服务,以提高用户参与度。两者的共同之处是他们都选择了MongoDB Atlas,并将其灵活运用到各种AI用例中。

MyGamePlan:利用AI驱动的洞察力提升职业足球运动员的表现

利用数据和分析来提升职业运动员表现的做法并不新鲜。但是,解决方案往往极其复杂,需要集成来自多个数据提供者的数据,导致成本高昂且洞察时间长。MyGamePlan专注于协助职业足球俱乐部和球员改变这种状况。

很多欧洲优秀的球队工作人员和球员都正在使用MyGamePlan,其中包括勒沃库森足球俱乐部 (Bayer Leverkusen,目前位列德国足球甲级联赛第一名 )、桑德兰足球俱乐部 (AFC Sunderland,英冠联赛 )、卡斯特利翁足球俱乐部 (CD Castellón,目前位列西班牙第三级别联赛第一名 )及弗罗茨瓦夫西里西亚足球俱乐部 (Slask Wroclaw,目前位列波兰足球甲级联赛第一名 )。

据MyGamePlan首席技术官兼联合创始人Dries Deprest介绍,**MyGamePlan借助前沿分析、AI技术及用户友好型平台实现了赛事数据、球员跟踪数据和视频资源数据的无缝集成,并重新定义了足球分析的方式。**平台可以实现工作流程自动化,帮助教练和球员制定比赛战术、促进球员发展并推动卓越战略实施,从而助力球队取得胜利。

MyGamePlay平台的核心是基于Python的自定义预测式AI模型。这些模型托管在Amazon Sagemaker上,能够分析比赛的特定时刻,对球员的个人表现及其对球队的贡献进行评分。此外,这些模型还可以推測球员的表现和贡献,并与对手球队的球员进行比较,以帮助制定比赛日战术。

数据是确保模型和预测准确性的关键。该公司将MongoDB Atlas作为其数据库,用于存储:

  1. 每场比赛的元数据,包括比赛、球队和球员的数据。

  2. 每场比赛的事件数据,如传球、断球、犯规和射门等。

  3. 跟踪遥测数据,可每隔100毫秒捕捉每位球员在场的位置。

这些数据可从MongoDB迁移到Python DataFrames,与第三方数据流结合使用,共同训练公司的ML模型。同时,可从特定比赛序列中生成推论并将其存储回MongoDB Atlas,供教练和球员进行下游分析。

在这里插入图片描述
图1:利用MyGamePlan网页和手机应用,教练和球员可以即时评估比赛并制定战术。

Deprest表示,MyGamePlan正在使用AI模型持续丰富数据,并将这些数据用于洞察和分析,因此MongoDB非常适合这一用例。

两年前,MyGamePlan启动了开发项目,从那时起便开始采用MongoDB。数据涉及复杂的多向关系,需要将比赛与球员、事件和跟踪相互关联。为了更好地表示这种数据关系,MyGamePlan选择在丰富的文档结构中使用嵌套元素。这种方法不仅能够提高开发者的工作效率,还能够提升程序运行效率。如果使用外键创建关系模型,再连接关系数据库中的规范化表格,这样极为缓慢且低效。

在开发方面,Deprest表示,使用PyMongo driver将MongoDB与托管在Sagemaker的Python ML数据管道和MongoDB Node.js driver集成在一起,随后将其用于基于React、面向客户端的网页和移动应用程序。

Deprest认为,造成MongoDB与NoSQL数据之间差异的两个关键因素在于:

● 首先,MongoDB更受开发者的青睐,采用率更高。这就意味着团队能够快速熟悉它,并利用它来提高效率。

● 其次,用户可以直接在实时数据的基础上构建应用内部分析,无需花费时间和金钱将其移动到数据仓库或数据湖中。借助MongoDB的聚合管道,用户可以使用强大的滚动、变换和窗口函数来处理和分析数据,以根据需求对数据进行切片和切块。

除了预测式AI,MyGamePlan团队正在评估如何利用GenAI来进一步改善用户体验。

据Deprest介绍,MyGamePlan平台拥有丰富的数据和分析,希望让球员和教练能够更加轻松地从中获得洞见。为此,他们正在探索在数据之上进行自然语言处理,并通过聊天和问答界面来实现这一目标。借助GenAI,用户可以轻松地可视化并总结数据。

目前,团队正在评估将OpenAI旗下大型语言模型 (LLM )ChatGPT与复杂的提示工程方法相结合,同时利用LangChain进行编排,配合使用LlamaIndex和MongoDB Atlas Vector Search来实现检索增强生成 (RAG )的能力。

**基于MongoDB Atlas来构建应用,使MyGamePlan团队能够利用开发者数据平台的丰富功能,为未来的几乎所有应用和AI需求提供支持。**用Deprest的话来说,就是:“由于MyGamePlan的源数据保存在MongoDB Atlas数据库中,将其与向量存储及就地向量搜索结合使用为我们的开发者提供了一种非常高效且完美的解决方案。”

Ferret.ai:通过AI和MongoDB Atlas生成智能,解析关系以创建信任,同时降低成本达30%

无论在现实世界还是在数学世界,我们都在不断地与他人建立关系。不论是线上交易、厂商或专业人士与潜在客户,还是投资者与企业创始人或者其他方面,建立新的人际关系不可避免。在所有这些关系中,信任必不可少,然而建立信任却是一件非常具有挑战性的事情。Ferret.ai正是这样一款旨在帮助消除猜疑、建立信任的工具。

Ferret是一个AI平台,专注于为公司和个人提供实时、公正的情报,以识别风险并把握机遇。借助先进的预测式和生成式AI,结合成千上万的全球数据源及数十亿公开文件,Ferret.ai可提供精心策划的关系情报和监测服务 (这些服务以往仅限于金融行业使用 ),帮助树立透明度新标准。

Ferret首席技术官Al Basseri在谈及Ferret的工作原理时表示,Ferret.ai从公共来源中获取个人信息。这些来源包括社交网络、交易记录、法庭文件、新闻档案、公司所有权和注册商业利益等。相关数据通过Kafka管道传输到公司的Anyscale/Ray MLops平台,在这个平台上,再使用spaCy提取和机器学习模型来进行自然语言处理。Ferret.ai从数据源中获得的所有元数据 (接近30亿个文档 )及模型推断均存储在MongoDB Atlas中。用户可通过页面和移动客户应用程序、企业用户可通过即将推出的API来使用Atlas中的数据。

在这里插入图片描述
图2:人工智能+实时数据=来自Ferret.ai的关系智能

除了预测式AI之外,公司开发者目前正在尝试在Ferret平台上使用GenAI。Basseri表示,Ferret与英伟达的数据科学团队建立了紧密的合作关系,从而能够对所提供的数据来源和分析进行综合,以帮助客户更好地了解联系人,并建立良好的关系。实验表明,相比那些规模更大、更通用的大型语言模型,Mistral模型及其混合专家集成系统所需的资源开销更少。

除了托管来自Ferret的预测式和生成式AI模型数据外,客户数据和联系人列表也存储在MongoDB Atlas中。Ferret可对公共记录源进行持续监测和评分,及时检测个人身份信息的变化。

正如Basseri所介绍的,通过使用MongoDB Atlas Triggers,Ferret.ai可以监测评分的更新,并立即向消费应用程序发送警报,从而使客户能够实时了解关系网络动态。这是一种具有反应式的、完全基于事件驱动的程序,开发者只需进行设置即可轻松实现。

Basseri还介绍了MongoDB为其开发者带来的其它一些优势,其中包括:

● 借助Atlas,该服务以完全托管的形式提供,并融入了最佳实践。这使开发者和数据科学家可以从数据库运行工作中解脱出来,将精力投入到应用程序和AI创新上

● MongoDB Atlas是一种成熟的解决方案,已被广泛应用于许多高增长的企业

● 随着团队的迅速扩展,拥有了解MongoDB的工程师变得至关重要

除了数据库之外,Ferret正将其对MongoDB Atlas平台的应用扩展到文本搜索领域。随着公司进入谷歌云,其正在从现有的Amazon OpenSearch服务迁移到Atlas Search。

在谈及迁移的驱动因素时,Basseri表示:**“将数据库和搜索统一在同一个API有助于减少开发者的认知负荷,从而提高他们的工作效率,**加快新功能的构建。这样可以消除了数据库和搜索之间同步数据带来的不便,从而缩短了工程周期。”

“此外,这也意味着用户可以获得更好的体验,因为之前的延迟瓶颈已经消失,用户在Ferret平台上搜索联系人和内容时,可以得到最新的结果,而不是过时的数据。”

“从OpenSearch迁移到Atlas Search还可以节省资金成本,并获得更多的灵活性。通过消除数据库和搜索引擎之间不必要的数据冗余,可将每月的总云成本减少30%。由于Atlas是支持多云的开发者数据平台,因此可以根据需要在多个云提供商之间迁移。”

迁移完成后,Basseri及其团队将能够使用Atlas Vector Search进行开发,并继续构建Ferret平台的GenAI功能。

从以上两个案例可以看出,无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持。如需了解更多信息,欢迎持续关注MongoDB微信订阅号。

MongoDB Atlas

MongoDB Atlas 是 MongoDB 公司提供的 MongoDB 云服务,由 MongoDB 数据库的开发团队构建和运维,可以在AWS、Microsoft Azure、Google Cloud Platform 云平台上轻松部署、运营和扩展。MongoDB Atlas 内建了 MongoDB 安全和运维最佳实践,可自动完成基础设施的部署、数据库的构建、高可用部署、数据的全球分发、备份等即费时又需要大量经验运维工作。让您通过简单的界面和 API 就可以完成这些工作,由此您可以将更多宝贵的时间花在构建您的应用上。


👉点击访问 MongoDB中文官网
👉立即免费试用 MongoDB Atlas
☎️需要支持?欢迎联系我们:400-8662988
✅欢迎关注MongoDB微信订阅号(MongoDB-China),及时获取最新资讯。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/530186.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

顺序表(C语言实现)

什么是顺序表 顺序表和数组的区别 顺序表本质就是数组 结构体初阶进阶 系统化的学习-CSDN博客 简单解释一下,就像大家去吃饭,然后左边是苍蝇馆子,右边是修饰过的苍蝇馆子,但是那个好看的苍蝇馆子一看,这不行啊&a…

Harmony鸿蒙南向驱动开发-MIPI CSI

CSI(Camera Serial Interface)是由MIPI联盟下Camera工作组指定的接口标准。CSI-2是MIPI CSI第二版,主要由应用层、协议层、物理层组成,最大支持4通道数据传输、单线传输速度高达1Gb/s。 物理层支持HS(High Speed&…

kettle经验篇:取出一个字符串中的两个数值

项目场景 在一个数据清洗、同步的需求中;有一个要求是判断两个数值是否在正常范围内,并根据判断结果给出异常标记。但这两个数值是以XML的格式存储在Oracle的CLOB字段中,且在同一个XML节点中。该节点的内容如下: "OD: 17.4 mmHg O…

2024Peak码支付系统网站源码

系统简介 Peak码支付-是专为个人站长打造的聚合免签系统,拥有卓越的性能和丰富的功能。用全新轻量化的界面UI,让您可以更加方便快捷地解决知识付费和运营赞助的难题。同时,它基于高性能SpeedPHPLayuiPearAdmin架构,提供实时监控和…

https的配置和使用(以腾讯云为例)

1、注册域名 2、获取证书 3、下载证书 下载下来的证书所有格式 4、在服务器上下载nginx并配置 nginx的配置文件 如下 server {listen 80;listen 443 ssl;server_name delegate.letspiu.net.cn;ssl on; #开启ssl#指定证书位置ssl_certificate /etc/ss…

低代码ARM计算机在IIoT中的采集控制生产面板

工业4.0的大潮下工业物联网(IIoT)已成为推动制造业转型升级的重要动力。其中,低代码ARM嵌入式计算机凭借其出色的性能、灵活的配置以及高度集成化的特点,在工业设备远程监控、维护与诊断方面发挥着关键作用。 一、远程监控与维护 …

【配电网故障定位】基于二进制蝗虫优化算法的配电网故障定位 12节点配电系统故障定位【Matlab代码#75】

文章目录 【获取资源请见文章第5节:资源获取】1. 配电网故障定位2. 二进制蝗虫优化算法3. 部分代码展示4. 仿真结果展示5. 资源获取 【获取资源请见文章第5节:资源获取】 1. 配电网故障定位 配电系统故障定位,即在配电网络发生故障的时候&am…

ArcGIS Server 10发布要素服务时遇到的数据库注册问题总结(一)

工作环境: Windows 7 64 位旗舰版 ArcGIS Server 10.1 ArcGIS Desktop 10.1 IIS 7.0 开始的时候以为10.1发布要素服务和10.0一样,需要安装ArcSDE,后来查阅资料发现不需要,数据库直连方式就可以了。 首先我来说一下发布要素服…

用Wireshark工具对gRPC接口进行本地抓包

前言: 本人一名敲代码的程序员,突然领导安排研究gRPC接口,并且抓包分析, 抓包工具试了Charles、mitmproxy都不行,浪费很多时间,最后使用Wireshark工具对本地启动的gRPC接口成功抓包,关于安装W…

AI智能客服机器人在医疗健康行业中的应用

随着科技的飞速发展,AI智能客服机器人已经逐渐渗透到我们生活的各个领域,而在医疗健康行业中,它的应用更是为人们带来了很多便利。那么,AI智能客服机器人在医疗健康行业中的应用是怎么样的呢?今天,我们就来…

stack和queue模拟实现

前言 上一期我们介绍了stack和queue的使用,本期我们来模拟实现一下他们! 本期内容介绍 容器适配器 deque介绍 为什么stack和queue的底层选择deque为默认容器? stack 模拟现实 queue 模拟实现 什么是容器适配器? 适配器是一种设…

Flutter之TabBar篇

总结了一下项目中用到的几种TabBar,针对不同的样式,有采用系统提供的,也有三方插件提供的,也有自定义的,效果如下(后续如果遇到新的样式,会不间断地记录更新,避免重复造轮子…&#…

大创项目推荐 深度学习 机器视觉 车位识别车道线检测 - python opencv

0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习 机器视觉 车位识别车道线检测 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) …

Vue第三方组件使用

文章目录 一、组件传值二、elementui组件使用三、fontawesome图标 一、组件传值 1、父组件与孩子组件传值 在孩子组件中定义props属性,里面定义好用于接收父亲数据的变量。 孩子组件是Movie Movie.vue。注意看在Movie组件里面有props对象中的title和rating属性用…

2024 抖音欢笑中国年(三):编辑器技巧与实践

前言 本次春节活动中,我们大部分场景使用内部的 SAR Creator互动方案来实现。 SAR Creator 是一款基于 TypeScript 的高性能、轻量化的互动解决方案,目前支持了Web和字节内部跨端框架平台,服务于字节内部的各种互动业务,包括但不限…

C++string类的实现

string类 string不属于STL,早于STL出现 看文档 C非官网(建议用这个) C官网 文章目录 string类一.为什么学习string类?1.C语言中的字符串2. 两个面试题(暂不做讲解) 二.标准库中的string类1. string类(了解)2. string类的常用接口说明(注意下面我只讲解…

echarts 如何设置(dataZoom)多个图形的数据区域一起联动缩放响应

数据区域联动缩放需要用到 dataZoom 的专属事件 dispatchAction 实现多个数据区域联动缩放功能 <div style"width:100%;height:320px;" id"test01"></div> <div style"width:100%;height:320px;" id"test02"></…

JavaScript教程:从基础到发展历程及语法规则的全面介绍

文章目录 一、JavaScript简介二、JavaScript发展历程三、JavaScript基础语法3.1、变量概念3.2、变量命名3.3、变量提升3.4、代码注释3.5、语句3.6、区块 四、总结 一、JavaScript简介 JavaScript 是一种高级的、解释型的编程语言&#xff0c;主要用于为网页添加交互性和动态效…

CSS实现卡片在鼠标悬停时突出效果

在CSS中&#xff0c;实现卡片在鼠标悬停时突出&#xff0c;通常使用:hover伪类选择器。 :hover伪类选择器用于指定当鼠标指针悬停在某个元素上时&#xff0c;该元素的状态变化。通过:hover选择器&#xff0c;你可以定义鼠标悬停在元素上时元素的样式&#xff0c;比如改变颜色、…

绝地求生:三大赛区PGS资格赛冠军已揭晓,2024PCL春季赛临近!

随着工资杯S2落幕&#xff0c;亚太、欧洲、美洲三大赛区的PGS资格赛也已结束&#xff0c;三大赛区冠军队伍分别是CES、TM、FALCONS。欧洲赛区此次竞争非常激烈&#xff0c;冠亚军的分差仅1分&#xff0c;从NAVI转会至TM的xmpl为TM的夺冠起到了非常重要的作用&#xff0c;此地大…