AI大模型:大数据+大算力+强算法

前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢?

目录

一年半没更文我干啥去了?

AI大模型火了

人工智能

大模型的理解

为什么学习大模型

大模型Function Calling功能增强

大模型接入公司的数据:embeddings&RAG

 国产大模型

大模型学习路线

阶段一:AI大模型时代的华丽登场

阶段二:AI大模型API应用开发工程 

阶段三:大模型应用架构进阶实践

阶段四:大模型微调与私有化部署 

总结:我眼中的IT行业现状与未来趋势


一年半没更文我干啥去了?

不仅我没更文,好像跟我同一批的很多博主都没有更文了,有点怀念那个时候大家一起从0粉开始输出,大家相互卷,卷内容,卷文字,从普通的几百字文章到几千字的文章,最后动不动就万字长文,甚至恐怖到十万字长文,当时官方也吐槽:我们这些博主怎么动不动搞这种大长文?当时大家的卷还不是为了那份流量,从开始的博文记录自己的技术学习到后面为了用户而出输出,那段时间很快乐,很充实,很安逸。

有人说经常怀念过去的人是现在过的不好,好像说对了,好像有不对,你觉得呢?这一年半我自己也经历了不好,因为图文创作本身是没啥收益的,当时后面去试了短视频创作这块,我们一批很多博主后面都尝试了,最后破圈成功的只有英雄老哥【ID:英雄哪里出来】,他现在某站和某音粉丝量惊人,甚至是我们这个赛道里的头部博主了,以前搞博客赛道的时候就是CSDN的头部,现在也是短视频程序员里的头部,所以成功的人好像做啥都能成功,就像雷军雷总一样,当初写代码那么优秀,后面把小米手机做的这么优秀,现在小米汽车同样做的这么优秀。任何人之间的差距,有外在的更有内在的,人往往被外在迷惑而忽视了内自。

我也经历许多挫折,能怎么办呢,拍拍身上的灰尘,继续向前进,与各位互勉。

AI大模型火了

好像火了,年年都在炒,年年炒的东西都不一样,我不想聊纯技术的东西(其实我不太擅长技术0.0),我就蹭蹭这个热度(我不是纯蹭啊,蹭热度的同时跟大家聊明白)

人工智能

传统AI

传统AI技术在工业控制、智能家居、无人驾驶、自动回复等领域也取得了较好的应用效果,在智能家居领域,传统AI技术能够实现对家居设备的智能控制,提高居住舒适度。比如家里的小度小度,智能语音机顶盒,智能控制的电器,就是最多的应用场景。但是它一般比较难有上下文的语言关联能力,也就是说,它不能够结合之前人类跟它的沟通来回答人类的问题。典型的代表就是智能客服,智能客服经常进入死循环,这就是因为没有结合上下文能力的原因。传统AI技术主要基于规则和知识库进行问题求解。

大模型

大模型在自然语言处理、计算机视觉、语音识别等领域取得了显著的成果。大模型还在金融、医疗、教育等领域取得了较好的应用效果。他最大的特点是,大模型给人的感觉是他能够像人一样“思考”,能够结合上下文的内容进行像人一样的回答,似乎它有记忆力一样。

大模型通常采用深度学习技术,通过大规模 数据集 训练出深度神经网络,从而实现对复杂问题的高效解决。大模型具有较好的泛化能力,能够在大量数据集上获得较好的性能。此外,大模型还具有较好的可扩展性,能够通过增加网络深度和网络宽度来提高性能。在人工智能(AI)领域,语言模型是一种可以预测文本序列的概率的统计模型。

大模型的理解

为什么学习大模型

通俗的理解:大模型是一个训练好的智能集体,它不具备联网的能力,它更像是一个人,但是这个人没有手机和电脑可以联网,因此你对它提问,它都会基于自己的知识理解给你答案,这个答案不一定是正确的。因此,大模型的数据知识库知识库是截至到2021年9月份的,这也就意味着在这个日期之后的知识它是一无所知的,尽管可以通过激发它的涌现能力让它具备一定的推理能力。

需要学习的人群:AI使用者:使用别人开发的AI工具,每个人都是这个角色。AI产品设计者:设计给他人使用的AI工具。AI产品开发者: 编程实现AI工具。AI产品的设计和开发者,是一般人在AI中具有最大的机会的人。

大模型Function Calling功能增强

当大模型不懂某些技能,怎么办?比如,我问:请问明天我需要打伞吗?,这个问题大模型是解决不了的,因为大模型是没有联网的。

大模型会需要查询我所在地址的天气情况,然后基于天气情况才能告诉我我是否需要打伞

于是大模型就会去查询天气,然后综合天气给的结果给我们一个答案

模型的结构

  • 应用如下所示

    Function Calling
  • 在上图中②所做的事就是,大模型发现自己要回答问题需要知道天气情况才能给出答案,因此,大模型就会去去调用天气的接口函数,查询天气,这个过程就是Function calling
  • Agent

    大模型能够充分发挥自身的语义理解能力,解析用户的输入,然后在函数库中自动挑选出最合适函数进行运行,并给出问题的答案,整个过程不需要人工手动干预。这整个过程,好像不需要人处理,大模型自己就像人一样在做整个流程,这个流程的组合体就是一个智能的人一样,称为Agent,智能体。
  • APIs

    我们给大模型提供的接口肯定就不止是一个,可能是很多个,一系列的,那么这一系列的接口,我们称为APIs,函数库

大模型接入公司的数据:embeddings&RAG

  • 当一个公司有一系列的书本资料的时候,遇到了问题需要人去查书,然后再总结,这个过程很慢,那么可以把这个整理为一个向量库的标准数据,然后当用户向大模型提出问题的时候,大模型就会去这个数据库中查找数据,并反馈给用户结果

  • embeddings

    • 由于大语言模型信息的滞后性以及不包含业务知识的特点,我们经常需要外挂知识库来协助大模型解决一些问题

    • 为了让外挂的知识库更好的被访问,于是需要对数据进行标准的格式输出,我们称之为向量化》embeddings

  • RAG

    • 相比于仅依赖大型语言模型的生成,RAG技术可以从外部知识库中检索信息,避免了模型的幻觉问题,并提升了对实时性要求较高问题的处理能力。与传统的知识库问答系统相比,RAG技术更加灵活,可以处理非结构化的自然语言文本。

    • RAG并非旨在取代已有的知识库问答系统,而是作为一种补充,强调实时性和准确性,并且通过结合生成和检索机制来提升自然语言处理任务的效果。

    • RAG优势

 国产大模型

  • 文心一言

  • 智谱清言

  • 星火大模型

  • 通义千问

  • MOSS

  • 盘古大模型

  • 云雀

  • 混元

  • 商汤 - 商量SenseChat

  • 中科院自动化所 - 紫东太初大模型

  • 上海人工智能实验室 - 书生通用大模型

  • 百川智能 - 百川大模型

  • 清华大学 - ChatGLM-6B

大模型学习路线

阶段一:AI大模型时代的华丽登场

  • 学习目标:所有行业的人都需要真正的了解的大模型,它不是ChatGPT的使用培训,而是更高级别的全面了解各种大模型,并能够更好的使用这些大模型

  • 内容

    • 第一阶段. 理解大模型

      • 初识大模型

        • 人工智能演进与大模型兴起:从AI1.0到AI2.0的变迁

        • 大模型与通用人工智能

        • GPT模型的发展历程:GPT-1到GPT-4

        • .最新发展:GPT4-Turbo和GPTs

        • 未来展望:大模型的趋势与挑战

      • 国产大模型介绍

        • 1.文心一言

        • 2.星火大模型

        • 3.智谱清言大模型

        • 4.盘古大模型

      • 大模型核心原理

        • 1. 理解大模型成功的背后

        • 2. 理解生成式模型与语言模型

        • 3. Transformer架构深度解析

        • 4. 关键技术解析:预训练、SFT、RLHF

        • 5. GPT4应用实例与Prompt使用技巧

        • 6. 交互式讨论:当前大模型应用场景

      • 实践中的大模型

        • 1. GPT模型实际应用与成本分析

        • 2. OpenAI基础API实操

        • 3. OpenAI Playground与参数调整

    • 第二阶段. 大模型提示工程

      • AI开发环境

        • Python快速入门

        • pip工具快速掌握

        • IDE搭建与使用

      • 提示工程基础

        • 什么是提示工程

        • Prompt的构成与调优

        • 基于OpenAI的Prompt案例

      • 提示工程进阶

        • 思维链Chain-of-thought

        • 思维树Tree-of-thought

        • Prompt攻击与防范

        • 敏感信息及账号密码方面的安全

      • 实战项目一:基于提示工程的代码生成

阶段二:AI大模型API应用开发工程 

  • 学习目标:理解大模型并且能够进行基于大模型的应用开发

  • 内容

    • 理解Function Calling

      • OpenAI tools参数与function

      • 调研本地Function Calling

      • 远程Function Calling调用

      • Function Calling数据库查询

      • 支持Function Calling的国产模型

    • RAG与Embedding

      • 检索增强模型RAG

      • RAG系统基本搭建

      • 什么是Embedding

      • Embedding在LLM中的应用

      • 向量相似度欧式距离与余弦距离

      • OpenAI Embedding

    • 向量数据库

      • 向量数据库运用

      • 向量数据库服务

      • 主流向量数据库

      • Embedding与向量数据库结合

      • 精简讲概念

    • OpenAI GPTs与Assistant API

      • GPTs的使用与限制

      • Assistants API 应用场景

      • Assistants thread与messages

      • 基于Assistans做一个自己的GPT

      • GPT-4应用

    • 实战项目二:基于大模型的文档智能助手

    • 实战项目三:基于大模型的医学命名实体识别系统

阶段三:大模型应用架构进阶实践

  • 学习目标:对大模型进行初步精调,让大模型在某一个领域的任务表现可以商业

  • 内容

    • LangChain开发实践

      • LangChain VS Semantic Kernel

      • LangChain的核心组件

      • 模型I/O封装

      • Prompt模版封装

      • 数据库连接封装

      • Memory记忆封装

      • Chat models与LLMs

      • LangChain中RAG的实现

      • 实战项目四:智能论文审稿机器人

    • Agents智能体架构

      • Agents概述与应用场景

      • LangChain Agents的设计理念与原理

      • Agents关键技术分析

      • ReAct Framework

      • Agents的未来潜力

      • AutoGPT快速打造智能体

      • MetaGPT

        • MetaGPT项目定位与解决的问题

        • MetaGPT的技术方案分析

        • MetaGPT的各模块代码解读

      • 实战六:多智能体协同代码生成应用

    • 实战项目七:基于图片的智能信息检索问答

    • 实战项目八:无人数字人直播机器人客服

    • 实战项目九:基于Agents打造AI模拟面试机器人

阶段四:大模型微调与私有化部署 

  • 学习目标:让大模型根据我们自己的专业/行业的私有知识库,经过微调可以回答有质量的专业问题

  • 内容

    • 开源模型与私有化模型

      • 私有化部署的必要性

      • HuggingFace开源社区的使用

      • ChatGLM,Baichuan, LLaMA介绍

      • 私有化部署模型实战

    • 模型微调Fine-Tuning

      • 模型微调的意义

      • 大模型的训练阶段介绍

      • Pre-train: 基座的训练

      • SFT: 模型的调整

      • 对于GPT模型的微调

      • LoRA介绍

    • 实战:医疗领域智能医生私有模型

    • 开源大模型微调

      • ChatGLM3-6B模型介绍

      • ChatGLM3-6B模型微调

      • LLaMA-7B模型介绍

      • LLaMA-7B模型微调

      • Baichuan-7B模型介绍

      • Baichuan-7B模型微调

    • 多模态

      • 什么是多模态模型

      • 多模态的应用场景

      • 图像生成技术概述

      • DALLE-3与Midjourney

      • Stable Diffusion与ControlNet

      • 语音生成技术概述

      • 主流TTS技术剖析

      • 案例:MiniGPT-4与多模态问答

      • 案例:BLIP与文本描述生成

      • 案例:Video-LLaVA与多模态图像视频识别

    • 实战

      • 代码生成实战

总结:我眼中的IT行业现状与未来趋势

当前,IT行业在全球范围内都是一个快速发展的领域,它对经济发展、社会进步和人们生活方式的改变起着至关重要的作用。

现状方面,中国IT行业呈现出以下几个特点:

  1. 数字化转型加速:随着云计算、大数据、人工智能等技术的成熟和应用,中国各行业都在加速数字化转型,IT行业在提供技术支持和服务方面发挥着核心作用。

  2. 新技术不断创新:中国在5G、人工智能、区块链等新兴技术领域持续投入研发,力图在这些领域取得领先地位。

  3. 政策支持力度大:中国政府出台了一系列政策支持IT行业发展,如“互联网+”、“智能+”等行动计划,以及为科技创新企业提供税收优惠、资金支持等措施。

  4. 国际合作与竞争加剧:在全球产业链中,中国IT行业与国际先进水平的差距正在缩小,同时,国际竞争和合作也在不断加深。

未来趋势方面,可以预见:

  1. 技术创新驱动:未来IT行业将继续以技术创新为核心驱动力,特别是在人工智能、大数据、云计算、物联网等领域。

  2. 行业应用深化:IT技术将在智能制造、智慧城市、远程医疗、在线教育等行业应用中得到更深入的整合和应用。

  3. 信息安全重要性提升:随着数字化的深入,信息安全将成为越来越重要的议题,对加密技术、隐私保护、网络安全等方面的投入将持续增加。

  4. 可持续发展:随着全球气候变化和资源约束的挑战,IT行业将更加注重绿色发展,推动能源效率的提高和电子废弃物的减量化。

做好当下事,不念过往,不惧将来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/656766.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Python】 Python中__slots__的妙用:提升性能与内存管理

基本原理 在Python中,每个类默认都会继承自object类,而object类在Python中是一个动态类,允许动态地添加属性和方法。这种灵活性使得Python在某些情况下非常强大和灵活,但同时也带来了一些性能和内存使用上的开销。 为了解决这个…

简化跨网文件传输摆渡过程,降低IT人员工作量

在当今数字化时代,IT企业面临着日益增长的数据交换需求。随着网络安全威胁的不断演变,网关隔离成为了保护企业内部网络不受外部威胁的重要手段。然而,隔离的同时,企业也需要在不同网络间安全、高效地传输文件,这就催生…

ubuntu strace命令

strace 是 Linux 系统中的一个调试工具,用于跟踪并记录系统调用(system calls)和信号(signals)。在 Ubuntu 中,strace 命令可以帮助开发者和系统管理员了解一个程序在运行时如何与操作系统内核进行交互&…

渗透测试工具Cobalt strike-1.CS介绍与配置

Cobalt Strike是一款美国Red Team开发的渗透测试神器,常被业界人称为CS。最近这个工具大火,成为了渗透测试中不可缺少的利器。其拥有多种协议主机上线方式,集成了提权,凭据导出,端口转发,socket代理&#x…

骨折分类数据集1129张10类别

数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):1129 分类类别数:10 类别名称:["avulsion_fracture",…

使用 RT 矩阵进行 3D 点云变换详解(基于 PCL 和 Eigen 库)

在 3D 点云处理中,RT 矩阵是一个常用的工具,用于对点云进行旋转和平移操作。本文将详细介绍 RT 矩阵的概念,并通过一个示例程序演示如何基于 PCL 和 Eigen 库将一帧点云进行矩阵变换再输出。 本教程的示例代码和点云数据可在 GitHub 下载。 什…

100个 Unity小游戏系列六 -Unity 抽奖游戏专题四 翻卡游戏

一、演示效果 二、知识点讲解 2.1 布局 void CreateItems(){reward_data_list reward_data_list ?? new List<RewardData>();reward_data_list.Clear();for (int i 0; i < ItemCount; i){GameObject item;if (i 1 < itemParent.childCount){item itemParent…

垂类短视频:四川鑫悦里文化传媒有限公司

垂类短视频&#xff1a;内容细分下的新媒体力量 随着移动互联网的迅猛发展和智能手机的普及&#xff0c;短视频已成为当下最受欢迎的媒介形式之一。四川鑫悦里文化传媒有限公司而在短视频领域&#xff0c;一个新兴的概念——“垂类短视频”正逐渐崭露头角&#xff0c;以其独特…

⌈ 传知代码 ⌋ 高速公路车辆速度检测软件

&#x1f49b;前情提要&#x1f49b; 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间&#xff0c;对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取 以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦&#x…

WMS仓库管理系统是怎么操作的?WMS操作流程详解

WMS 是仓库管理系统(Warehouse Management System) 的缩写。通过标准化的来料管理、拣配管理、仓库管理&#xff0c;打造实时化、透明化、可视化的仓储管理体系。一款合格的wms系统具有以下优势 提供实时可视性和自动化仓储流程&#xff0c;帮助企业更好地应对复杂的供应链网络…

python fstring教程(f-string教程)(python3.6+格式化字符串方法)

文章目录 Python F-String 教程&#xff1a;深度探究与实用指南引言基础用法什么是F-String?表达式嵌入 格式化选项小数点精度宽度与对齐数字格式化 高级用法复杂表达式调用函数多行F-String嵌套格式化 总结 Python F-String 教程&#xff1a;深度探究与实用指南 引言 在Pyt…

AI赋能:人工智能技术驱动下的品牌海外市场精准分析与营销策略

随着全球化的加速和科技的飞速发展&#xff0c;品牌在海外市场的竞争愈发激烈。为了在竞争激烈的国际市场中脱颖而出&#xff0c;品牌需要更深入地了解海外消费者的行为、趋势和偏好。在这个过程中&#xff0c;人工智能&#xff08;AI&#xff09;技术以其强大的数据处理和分析…

闲话 .NET(6):.NET Core 各个版本的特性

前言 之前我们聊了一下 .NET Core 有哪些优势&#xff0c;.NET Core 发展非常迅速&#xff0c;不过短短几年&#xff0c;.NET Core 已经发布 .NET 8 了&#xff0c;基本上保持了一年一个版本的速度&#xff0c;每个版本都有自己的独有特性&#xff0c;下面我们来简单的盘点一下…

Enable Full Line suggestions 启用全行建议

开启后效果如下&#xff1a; 直接提示可能要输入的参数

医卫兰大药学试题及答案,分享几个实用搜题和学习工具 #媒体#微信

这些软件以其强大的搜索引擎和智能化的算法&#xff0c;为广大大学生提供了便捷、高效的解题方式。下面&#xff0c;让我们一起来了解几款备受大学生欢迎的搜题软件吧&#xff01; 1.彩虹搜题 这个是公众号 题库内容丰富全面&#xff0c;细致分类整理。找题再也不费力&#…

嵌入式学习记录5.23(超时检测、抓包分析)

目录 一.自带超时参数的函数 1.1 select函数 1.2 poll函数的自带超时检测参数 二、不带超时检测参数的函数 三、通过信号完成时间的设置 四、更新下载源 五、wireshark使用 5.1. 安装 5.2. wireshark 抓包 5.2.1 wireshark与对应的OSI七层模型 ​编辑5.2.2 包头分析 …

旺店通与金蝶云星空 就应该这样集成打通

在当今数字化商业环境中&#xff0c;企业需要高效、灵活的系统来支持其业务运营。旺店通和金蝶云星空作为两个领先的企业管理解决方案&#xff0c;它们的集成能够为企业带来无缝的业务流程和数据一致性。本文将详细介绍旺店通与金蝶云星空的全场景集成方案&#xff0c;包括主数…

netcat一键开始瑞士军刀模式(KALI工具系列六)

目录 1、KALI LINUX简介 2、netcat工具简介 3、在KALI中使用netcat 3.1 目标主机IP&#xff08;win&#xff09; 3.2 KALI的IP 4、命令示例 4.1 测试某IP的端口是否打开 4.2 TCP扫描 4.3 UDP扫描 4.4 端口刺探 4.5 直接扫描 5、即时通信 5.1 单击对话互联 5.2 传…

idea的project structure下project [lauguage ]()level 没有java的sdk17选项如何导入

idea的project structure下project lauguage level 没有java的sdk17选项如何导入 别导入了&#xff0c;需要升级idea版本。idea中没有project language level没有17如何添加 - CSDN文库 别听这文章瞎扯淡 2021版本就是没有&#xff0c;直接卸载升级到最新版本就可以了。没办法…

离大模型落地应用最近的工程化技术(RAG)

虽然大规模语言模型&#xff08;LLM&#xff09;在自然语言处理&#xff08;NLP&#xff09;方面表现出了其强大的文本生成和理解能力&#xff0c;但是它们在实际应用中仍然面临一些挑战&#xff0c;如处理大规模知识库和实时获取最新信息的能力&#xff0c;并且会产生幻觉。为…