AI技术初探:普通人ALL IN AI入门指南

图片

自从去年ChatGPT如流星划过夜空,照亮了整个AI领域,它所带来的技术革新与热潮仿佛一场无声的暴风雨,席卷了全球的科技圈。身为一名低阶IT从业者,感觉这太高大上了,与我的工作有毛线关系。

但是,AI技术的飞速发展确实令人惊叹,它不仅改变了我们的生活方式,更在某种程度上重塑了我们对未来的想象。从智能聊天机器人到图生文、文生图,再到最新的文生视频,每一步的突破都仿佛打开了新世界的大门。

一开始,我也被那些复杂的概念搞得一头雾水,比如OpenAI Chat-GPT、生成式AI、通用人工智能、专用人工智能、多模态,还有大语言模型等等。就像春节回老家,怎么也搞不清楚谁是三姨舅外甥表弟的儿子,哪个小孩是姑姑家外甥表姐的女儿。反正掏红包就是了。

这段时间,我特意抽出时间去深入了解了一些AI的基础知识,终于对这轮新的AI技术有了一些初步的认识。不过一个人自学还是略显枯燥了,有句老话说得好,“独乐乐不如众乐乐”,所以我觉非常有必要把这些知识分享出来让更多的朋友跟我一起”掉头发“,毕竟"欢乐共享则倍增,痛苦分担则减半"。

图片

图片

01.正经概述

自2023年Chat-GPT为代表的人工智能技术领域取得了前所未有的突破性进展,尤其在自然语言处理(NLP)上,GPT-4作为新一代大型预训练模型的代表,其卓越的理解力、精准文本生成和对复杂情境的驾驭能力已超越人类水平,在各个行业广泛应用并引发革新。比如,集成GPT-4的智能助手能深度理解邮件并自动分类回复,撰写信函报告,甚至实时记录会议摘要并提出行动建议,大幅提升办公效率。

与此同时,在市场营销中,基于GPT系列模型的AI工具可深入挖掘大数据以揭示市场趋势和消费者行为模式,为营销策略提供精准洞察。软件开发方面,GitHub Copilot等AI代码生成工具则实现了从自然语言到编程代码的快速转换,极大地减轻了程序员重复工作负担,使之专注于创新设计。

另一重要领域是生成式AI图像技术,DALL-E 2与Stable Diffusion将文本描述转化为逼真图像,深刻影响艺术、设计和媒体行业。艺术家可以借助DALL-E 2描绘未来城市景观,设计师利用Stable Diffusion迅速生成融合多元元素的产品包装图案,而在新闻报道中,编辑能即刻根据文字描述创作出符合新闻内容的高质量图片,增强了信息传递效果。

总结来说,2023年后的一系列AI技术飞跃不仅正在重塑日常工作方式,也预示着一个更智能化的工作环境即将来临,在其中AI将成为不可或缺的伙伴,助力人类应对更高层次挑战,并共同驱动社会生产力持续跃升。同时,生成式视觉AI技术正不断推动视觉创作与消费方式的智能化和高效化转型。

以下本人将以有限的学识给大家介绍一下近日“临时报佛脚”学习来的经验。做了个简单的入门指南,尝试给各位读者老师汇报一下AI领域的一些主要概念、国内外主要的公司、产品及相关技术,希望能帮助老师们能快速了解一下AI这个领域。

图片

图片

02.AI专业术语解释

本章节部分内容包含AI辅助创作

学习这些基本概念对于理解和应用人工智能至关重要。它们构成了人工智能的基石,为我们提供了解决问题的新思路和方法。通过深入掌握这些概念,有助于我们能更好了解人工智能相关技术概念。有助于提高我们的学习效率,为以后使用AI解决复杂问题打好基础。

人工智能(AI)是模拟人类智能的技术和科学,涵盖机器学习、自然语言处理等多个关键领域。其中,机器学习使计算机能从数据中自动学习并改进性能,而自然语言处理则让计算机能够理解和生成人类语言。

大语言模型作为自然语言处理领域的深度学习模型,能处理各种自然语言任务,如文本摘要、问答、翻译等。深度学习,利用神经网络模拟人脑进行学习和推理,是机器学习的重要分支。

神经网络作为深度学习的基础,模拟人脑神经元的连接方式。此外,卷积神经网络专门处理图像数据,循环神经网络则适用于处理序列数据,如文本或时间序列数据。生成对抗网络通过两个神经网络的竞争生成逼真数据,而强化学习使智能体通过与环境互动学习做出最佳决策。

迁移学习利用已有知识解决新任务,数据挖掘从大量数据中提取有用信息,而知识表示将人类知识转化为计算机可理解的形式,语义网丰富Web内容的含义和互操作性,智能代理则能代表用户或其他系统执行任务。

序号术语定义
1人工智能(AI)指计算机模拟人类智能的技术和科学,包括机器学习、自然语言处理等多个领域。
2通用人工智能(AGI)人工智能的一种理论形式,指人工智能系统能够像人类一样学习和推理,解决复杂问题并独立做出决策,具备更广泛的智能和适应性。
3专用人工智能(ANI)也称为狭义人工智能,指针对特定领域或任务设计的人工智能系统,通常被优化以执行一项或多项特定任务,并在这些任务上表现出高水平的性能。
4

机器学习

(Machine  Learning)

指计算机从数据中自动学习并改进其性能的能力。
5自然语言处理(NLP)指让计算机理解和生成人类语言的技术。
6大语言模型(LLM)自然语言处理领域的一种深度学习模型,基于海量文本数据训练,能够生成自然语言文本,并深入理解文本含义,处理各种自然语言任务。
7

深度学习

(Deep  Learning)

机器学习的一个分支,利用神经网络模拟人脑进行学习和推理。
8

神经网络

(Neural  Networks)

模拟人脑神经元连接方式的计算模型,是深度学习的基础。
9卷积神经网络(CNN)专门用于处理图像数据的神经网络。
10循环神经网络(RNN)适用于处理序列数据,如文本或时间序列数据的神经网络。
11生成对抗网络(GAN)由两个神经网络(生成器和判别器)组成,通过相互竞争来生成逼真的数据。
12

强化学习

(Reinforcement  Learning)

机器学习的一种,智能体通过与环境互动并接收奖励或惩罚来学习如何做出最佳决策。
13

迁移学习

(Transfer  Learning)

利用在一个任务上学到的知识来帮助解决另一个相关任务的过程。
14数据挖掘(Data  Mining)从大量数据中提取有用信息和知识的过程。
15

知识表示

(Knowledge  Representation)

将人类知识转换为计算机可理解和处理的形式。
16语义网(Semantic  Web)使用语义技术(如本体论和逻辑推理)来丰富Web内容的含义和互操作性。
17

智能代理

(Intelligent  Agents)

能够代表用户或其他系统执行任务的软件程序,能够自主决策、学习和适应环境。

图片

03.AI技术主要公司及产品介绍

本章节部分内容包含AI辅助创作

以OpenAI为代表的前沿AI科技公司正引领全球AI领域的创新与变革。它们不仅投入大量资源进行研发,推出先进的AI技术和产品,还不断拓展AI的应用领域,从聊天机器人到图像生成,从智能搜索到个性化推荐,使我们的生活变得更加智能、便捷和高效。

同时,这些公司也关注AI技术的伦理和社会影响,确保AI技术的健康发展。未来,随着AI技术的不断进步和应用领域的拓展,这些前沿AI科技公司共同推动了AI技术的发展和应用,将继续为人类社会的进步和发展做出重要贡献并带来巨大变革。

序号公司产品/技术描述
1OpenAIChatGPT一种大型语言模型,能够通过自然语言对话方式与用户进行交互,可以生成文本、解答问题、创作故事、编写代码等多种任务,并具备一定的上下文理解和对话历史记忆能力。
2OpenAISORA一个文本到视频的生成器,可以将用户的文字描述转化为具有真实感和细节丰富的视频内容。能够理解和模拟物理世界的规则
3Stability  AIDiffusion在机器学习领域,扩散模型是一种生成模型,用于创建图像、音频或视频等数据。
4RunwayRunway  ML让非专业程序员也能利用深度学习技术进行视觉艺术和创意设计,其中包括基于扩散模型的视频生成功能。
5MidjourneyMidjourney  AI专注于文本到图像的生成,提供高质量的图像创作体验
6MicrosoftNew  Bing集成AI技术的搜索引擎,提供智能搜索结果和个性化推荐
7MicrosoftCopilot基于人工智能技术开发的一系列功能和服务,其核心目标是为用户提供智能辅助和提高工作效率。分别集成于windows11\office\GitHub  Copilot\Power Platform当中
8百度

文心一言

(ERNIE Bot)

该模型旨在理解和生成自然语言文本,在问答、创造写作等领域具有广泛应用,是中国自主研发的先进AI语言模型之一。
9阿里巴巴通义千问类似于ChatGPT,能够处理各种类型的问题并生成相应的回答,具备广泛的知识覆盖范围和多场景应用能力,服务于企业和个人用户,提供智能化解决方案。
10GOOGLEGemini是一款强大的多模态人工智能模型,能够理解并处理多种类型的数据,并在此基础上进行复杂任务的推理与内容生成。
11Pika  LabsPika是一款利用AI技术,实现文本、图像到视频自动转换与编辑的高效视频创作工具。

​​​04.AI主要基础技术介绍

本章节部分内容包含AI辅助创作

AI技术的发展中,几种关键技术起到了核心作用。首先是Transformer模型,它在自然语言处理领域实现了并行处理和显著性能提升。其次是扩散模型,通过模拟非平衡热力学过程,生成高质量的图像和视频。预训练大模型则在大规模数据集上学习一般性的结构和模式,为各种任务提供强大的特征表示。而Scaling Law则描述了模型性能与规模之间的关系,指导了模型设计和优化。这些技术的综合应用推动了AI领域的持续创新和发展,使得人工智能在各个领域都能展现出强大的潜力和实际应用价值。

  1. Transformer模型:Transformer模型是一种由Google在2017年提出的深度学习架构,它在自然语言处理(NLP)领域产生了深远的影响。与传统的循环神经网络(RNN)不同,Transformer摒弃了序列处理的循环结构,完全依赖于自注意力机制来捕捉输入序列中任意两个位置之间的关系。

    这种设计使得Transformer模型能够并行处理输入序列中的所有元素,极大地提升了计算效率,并且在许多NLP任务上取得了显著性能提升,包括但不限于机器翻译、文本生成和问答系统等。ChatGPT背后的技术基础就包括Transformer架构。

  2. 扩散模型(Diffusion Model):扩散模型是一种生成式建模方法,主要应用于计算机视觉和图像生成领域。其基本思想源自非平衡热力学中的扩散过程。在扩散模型中,数据点(如图像)通过一系列添加噪声的过程逐渐退化为高斯噪声;然后,模型学习这个逆过程,即从随机噪声中逐步还原出原始数据。

    这一过程通常通过训练一个深度神经网络实现,该网络能在给定时间步长的噪声图像上进行去噪操作。经过训练后,扩散模型能够生成高质量的全新样本,例如清晰的图像或视频帧。

  3. 预训练大模型(Pre-trained Large Model):预训练大模型是指在大规模无标签或带少量标签的数据集上预先训练得到的大型深度学习模型。这类模型首先学习一般性的语言结构或数据模式,在此过程中它们学会了强大的特征表示能力。

    完成预训练后,模型可以针对特定下游任务进行微调,从而快速适应和解决各种实际应用问题,包括但不限于文本分类、语义理解、对话生成等。比如,BERT、GPT-3、文心一言和通义千问等都是具有代表性的预训练大模型,它们在各自的领域内展现出了优异的表现和泛化能力。

  4. Scaling Law(扩展定律):在机器学习和人工智能领域,特别是深度学习中,指的是模型性能与模型规模之间的一种普遍存在的关系。该定律描述了随着模型的某个或多个维度(如参数量、训练数据量、训练时间/步数等)按比例增加时,模型的性能(比如准确率、损失函数值等)如何随之变化。

图片

05.如何与AI进行交互

在这个AI爆炸的时代要想ALL IN AI!如何与之进行高效、清晰的交互则成为了关键。在这其中,指令(Prompt)扮演着至关重要的角色。通过精心设计和使用指令词,我们可以引导AI更准确地理解我们的意图和需求,从而实现更高效、更精准的交互。因此,掌握如何运用指令(Prompt)与AI进行交互,无疑是我们在这个AI时代中取得成功的关键一环。

  • 什么是指令(Prompt)

    在AI领域,指令(Prompt)是一种非常重要的交互方式。简单来说,指令就是你告诉AI要做什么、如何做的明确指示。一个好的指令应该具备明确性、具体性和简洁性,以便AI能够快速准确地理解并执行你的需求。

    以文心一言为例,其建议的指令结构如下:

    图片

    参考信息:包含文心一言完成任务时需要知道的必要背景和材料,如:报告、知识、数据库、对话上下文等
    动作:需要文心一言帮你解决的事情,如:撰写、生成、总结、回答等
    目标:需要文心一言生成的目标内容,如:答案、方案、文本、图片、视频、图表等
    要求:需要文心一言遵循的任务细节要求,如:按XX格式输出、按XX语言风格撰写等

这里举个使用AI给一位不懂网络安全的领导解释什么是防火墙的例子。分别用不好的指令(Prompt)和好的指令(Prompt)各问一次。

a.不好的指令词:"介绍一下防火墙”。这同时个指令没有参考信息、目标以及要求。所以生成的内容就是一大堆专业的专业术语及技术原理,一个没有基础的人很难在短时内理解清楚相关内容。

图片

b.好的指令词:“以一名专业的网络安全专家的身份,基于网络安全相技术及关法律法规的数据,给一个不懂网络安全的领导介绍一下什么是防火墙。要求通俗易懂,言简意赅。”

这个指令里给出要求以一名专业的网络安全专家的身份”参考信息基于网络安全相技术及关法律法规的数据”、动作“给一个不懂网络安全的领导介绍一下什么是防火墙”、还有目标要求通俗易懂,言简意赅。”

最后生成的内容通俗易懂、比喻生动,将复杂的网络安全概念简单化,更易使没有基础的人能够迅速理解防火墙的概念,以及其在保护公司内部网络免受黑客和病毒侵害、确保机密信息安全等方面的重要性。

图片

因此,在使用AI时,我们应该尽量提供明确、具体和简洁的指令,以便让AI能够更好地理解并执行我们的需求。同时,我们也可以通过不断尝试和调整指令,逐渐提高与AI的交互效率和准确性。

图片

06.AI未来发展构想

展望未来10年,AI技术正迎来黄金发展期,它的潜力将逐渐释放,改变我们的生活。随着多模态交互的普及,AI系统将更加自然地融入我们的日常,使得与机器的沟通变得如同与人交流般自然流畅。同时,通用人工智能(AGI)的初步实现预示着各领域的深刻变革,AI将与垂直行业深度融合,推动各行业的智能化水平跃升新台阶。

然而,随着AI技术的广泛应用,其可解释性和伦理问题也日益凸显。确保技术的公平性和透明度,成为我们共同关注的重要议题。此外,边缘计算和分布式AI的崛起,将进一步提升数据处理的速度和效率,特别是在实时性要求高的场景中,AI将展现出更加强大的能力。

在这飞速发展的AI时代,持续学习新技术显得尤为重要。只有保持好奇心,不断学习和适应,我们才能紧跟时代的步伐,充分利用AI技术带来的便利。同时,我们也要关注AI技术的伦理和社会影响,确保它的发展符合我们的期望。未来,让我们携手共进,拥抱AI时代,持续学习,共同创造更加智能、便捷、高效的美好生活。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/428391.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据库学习案例20240304-mysql数据库案例总结(碎片,统计信息)

1 表中的碎片 在InnoDB中删除行的时候,这些行只是被标记为“已删除”,而不是真正从物理存储上进行了删除,因而存储空间也没有真正被释放回收。InnoDB的Purge线程会异步地来清理这些没用的索引键和行。但是依然没有把这些释放出来的空间还给操…

pydub、playsound播放声音;gradio、streamlit页面播放声音;gradio 页面图像、视频及调用摄像头

1、pydub from pydub import AudioSegment from pydub.playback import playsong AudioSegment.from_wav(r"C:\Users\loong\Downloads\zh.wav") play(song)2、playsound from playsound import playsoundplaysound(r"voice.wav")3、streamlit import s…

李沐动手学习深度学习——3.5练习

减少batch_size(如减少到1)是否会影响读取性能? 肯定会影响,计算机io性能而言,随着batch_size增大,读取越来越快,需要的时间越少。这里会涉及到计算机操作系统的知识点,内存与硬盘之…

牛客网C++专项题目整理(1)

1. 若有定义语句:char s[3][10],(*k)[3],*p;则以下赋值语句错误的是 1.p s; 2.p k; 3.p s[0]; 4.k s; 答案:124 char s[3][10] s 是数组指针,类型为char (*)[3],所指向的每个数组长度为10; char (*k)[3] k是一个数组指针&a…

C/C++ 乘积尾零问题(蓝桥杯)

如下的10行数据,每行有10个整数,请你求出它们的乘积的末尾有多少个零? 5650,4542 3554 473 946 4114 3871 9073 90 4329 2758 7949 6113 5659 5245 7432 3051 4434 6704 3594 9937 1173 6866 3397 4759 7557 3070 2287 1453 9899…

MySQL数据库运维第一篇(日志与主从复制)

文章目录 一、错误日志二、二进制日志三、查询日志四、慢查询日志(记录超时的sql语句)五、主从复制概括六、主从复制原理七、搭建主从复制八、主从复制的测试 在这篇深入的技术文章中,作者将以明晰透彻的方式详细介绍MySQL数据库中关键的日志…

蓝桥杯——123

123 二分等差数列求和前缀和数组 题目分析 连续一段的和我们想到了前缀和,但是这里的l和r的范围为1e12,明显不能用O(n)的时间复杂度去求前缀和。那么我们开始观察序列的特点,可以按照等差数列对序列进行分块。如上图,在求前10个…

C++基于多设计模式下的同步异步日志系统day5

C基于多设计模式下的同步&异步日志系统day5 📟作者主页:慢热的陕西人 🌴专栏链接:C基于多设计模式下的同步&异步日志系统 📣欢迎各位大佬👍点赞🔥关注🚓收藏,&am…

【Vue3】3-6 : 仿ElementPlus框架的el-button按钮组件实

文章目录 前言 本节内容实现需求完整代码如下: 前言 上节,我们学习了 slot插槽,组件内容的分发处理 本节内容 本小节利用前面学习的组件通信知识,来完成一个仿Element Plus框架的el-button按钮组件实现。 仿造的地址:uhttps://…

SpringBoot接口防抖(防重复提交)的一些实现方案

前言 啥是防抖 思路解析 分布式部署下如何做接口防抖? 具体实现 请求锁 唯一key生成 重复提交判断 前言 作为一名老码农,在开发后端Java业务系统,包括各种管理后台和小程序等。在这些项目中,我设计过单/多租户体系系统&a…

2024最新算法:鹦鹉优化算法(Parrot optimizer,PO)求解23个基准函数

一、鹦鹉优化算法 鹦鹉优化算法(Parrot optimizer,PO)由Junbo Lian等人于2024年提出的一种高效的元启发式算法,该算法从驯养的鹦鹉中观察到的觅食、停留、交流和对陌生人行为的恐惧中汲取灵感。这些行为被封装在四个不同的公式中…

《Improving Calibration for Long-Tailed Recognition》阅读笔记

论文标题 《Improving Calibration for Long-Tailed Recognition》 改进长尾识别的校准工作 作者 Zhisheng Zhong、 Jiequan Cui、Shu Liu 和 Jiaya Jia 香港中文大学和 SmartMore 初读 摘要 深度神经网络在训练数据集类别极度不平衡时可能会表现不佳。最近&#xff0c…

010 Linux 进程间通信_匿名管道

前言 本文将会向你介绍匿名管道的原理以及用法,以及管道的使用存在的情况和管道的特性 文章重点 重点:匿名管道的原理,使用情况,以及特性 进程间通信 进程间通信的本质: 让不同的进程先看到同一份资源&#xff0c…

换个角度看境外支付系统:警惕金融风险之安全测试实践

【面试突击班】1. 性能测试主要关注哪些指标? ,这个名词相信生活在当下社会的大家应该都不在陌生了吧,他时时刻刻充斥在我们的日常生活中,哪里有交易发生,哪里就有它的身影。 其实直白的来说,支付系统是扮…

数组传参调试小技巧

数组传参调试小技巧 前言正文 前言 亲爱的小伙伴们&#xff0c;你们好呀&#xff01;我是莹莹&#xff0c;今天我来给大家分享关于数组传参调试的技巧&#xff0c;希望能够帮助你们&#xff01; 正文 首先&#xff0c;我们先来看一段数组传参代码 #include<stdio.h>v…

《汇编语言》- 读书笔记 - 第16章-直接定址表

《汇编语言》- 读书笔记 - 第16章-直接定址表 16.1 描述了单元长度的标号&#xff08;数据标号&#xff09;检测点 16.1 16.2 在其他段中使用数据标号assume通过标号取地址检测点 16.2 16.3 直接定址表&#xff08;Direct Addressing Table&#xff09;例1分析代码效果 例2分析…

深入了解 Android 中的 FrameLayout 布局

FrameLayout 是 Android 中常用的布局之一&#xff0c;它允许子视图堆叠在一起&#xff0c;可以在不同位置放置子视图。在这篇博客中&#xff0c;我们将详细介绍 FrameLayout 的属性及其作用。 <FrameLayout xmlns:android"http://schemas.android.com/apk/res/androi…

Tomcat常见配置(基础功能、虚拟主机、搭建博客)

目录 一、Tomcat基础功能 1、自动解压war包 2、Tomcat工具界面 2.1 Server Status (服务器状态) 2.1.1 本地登录状态页 2.1.2 远程登录状态页 2.2 Manager App (管理应用程序) 2.3 Host Manager (主机管理器) 3、Context 配置 二、配置虚拟主机 三、搭建 JPress 博客…

就业班 2401--2.29 Linux Day8--存储管理2(LVM)+swap+磁盘阵列raid

&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;小伙伴们一定要看到最后&#xff0c;有彩蛋呢^--^ 一、存储管理Ⅱ 逻辑卷LVM &#xff08;Logical Volume Manager&#xff08;逻辑卷管理&#xff09;的简写&#xff09; LVM管理 lvm概念&#xf…

网络编程作业day4

广播模型&#xff1a; 发送端&#xff1a; #include <myhead.h> int main(int argc, const char *argv[]) {//创建套接字int sfdsocket(AF_INET,SOCK_DGRAM,0);if(sfd-1){perror("socket error");return -1;}//设置套接字允许广播属性int broadcast1;if(sets…