AIGC 持续火爆,AI 核心技术百花齐放。过去一年里,大语言模型 LLM(Large Language Model)与 AIGC 引爆整个技术界,不过让 AIGC 落地千行百业,实现商业化使用,则面临更多挑战。例如,训练语料数据更新慢的话,大模型就无法实时获取最新信息;在需要高度准确专业知识的行业,如医学、法律、科学,模型的定制标准高、容错率低;还有模型高昂的训练成本,使模型的幻觉成为瓶颈。
检索增强生成技术 RAG (Retrieval-Augmented Generation) 可以从大规模的知识库中精确地抽取信息,并生成富有洞察力的答案,RAG 系统的检索组件向量数据库是核心功能,采用了特殊的数据结构和索引策略,来有效组织和检索向量数据,成为解决低成本快速定制大模型问题的关键所在,LLM 技术结合 RAG 不仅提高了答案的质量,还为特定行业的应用带来了新的机会,向量数据库不仅仅是一种技术工具,更是连接数据与 AI 的桥梁。
近日,一站式数智化转型技术咨询服务商伊克罗德信息与企业级 AI 数据厂商墨奇科技、以及亚马逊云科技,共同发布推进结合 AIGC 与向量数据库的大模型在行业落地的创新应用实践。
RAG+向量数据库,低成本快速定制高质量大模型
活动现场,伊克罗德信息与墨奇科技正式官宣双方达成战略合作,本次合作旨在通过双方的 AI 大模型领域的技术融合和创新力量,推动前沿科技的快速发展,双方将优势叠加,利用大语言模型 LLM、向量数据库构建生成式 AI 应用解决方案,通过检索增强生成 RAG 提升性能并降低模型成本,打造企业 AI 新范式,为企业带来更加智能化、便捷的服务体验。
墨奇科技向量数据库 MyScale 发布开源版 MyScaleDB
同时,能够支持结构化数据和非结构化数据的存储、查询、搜索、联合分析和处理功能的 AI 数据库厂商墨奇科技在活动上首次宣布:经过为期半年的代码规范和技术文档准备工作,MyScale 将发布其首个开源版本的向量数据库 MyScaleDB。此次开源涉及上百万行代码,将向全球开发者免费公开 MyScale 商用版本大部分核心功能,加速 AI 场景下数据基础设施和传统关系型数据库的有机融合。
落地实践案例:支撑智源 1.3 亿科研文献、西门子 3 万员工文档、专业级法律 AI 应用
RAG 的结构为特定行业大型语言模型的构建带来了巨大潜力,本次合作双方都拥有了丰富的大模型落地案例经验。例如墨奇科技为智源研究院搭建 Science Navigator 科研数据检索系统,覆盖计算机、物理、化学、生物等领域超过 1.3 亿篇科研文献,支持百亿级向量与海量结构化数据的毫秒级检索,使科研人员平均文献搜索时间缩短 90%以上,对专业领域复杂问题仍能保持 95%以上的问答精度。在世界 500 强西门子搭建知识库聊天机器人中,MyScale 为 30,000 名员工提供全面的知识问答,涵盖公司政策、产品服务、监管咨询等,将内存消耗减少十倍,提高 QPS、延迟和数据接收时间的性能,检索准确率接近 100%。为中国企业出海提供数十个海外国家的一站式人力资源解决方案,MyScale 作为 SQL 向量数据库使 Gonex 的 RAG 解决方案能够在跨境企业人力资源管理的合规、税务、发薪和其他行政任务中提供人覆盖数十个小语种的高精度问答服务。RAG 技术使得大语言模型能够为特定领域如医疗、法律、科学、保险和金融提供更准确和有针对性的答案,助力企业快速创新,实现数智化转型,并有效达到降本增效。
升级版大语言模型,即将上架亚马逊云科技 Marketplace(海外区)
本次的战略合作发布中,伊克罗德信息和墨奇科技团队共同将 RAG+向量数据库推向了一个新的水平,发布 2.0 版大语言模型 Ask Myscale,实现了比专用向量数据库更高的性能和可扩展性。近期内将上架亚马逊云科技 Marketplace(海外区),并提供用户咨询、测试、上线、运营等全生命周期服务。亚马逊云科技 Marketplace 是一个精挑细选的数字化产品目录,客户通过它可以轻松地查找、购买、部署和管理构建解决方案及运营其业务所需的第三方软件和服务。
AI 时代来临,各类优秀技术正在快速落地实践,从算力、模型、数据厂商到 SI、ISV 等服务商的紧密合作,去满足千行百业不同 AI 需求,并最终实现多方共赢,将是今年重要的趋势,值得开发者去重点关注。