👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
👀 黄家驹AI演唱「直到世界尽头」,是科技前进也是青春回望~
https://www.bilibili.com/video/BV1CG411i7MV
最近几天,B站UP主 @大悦聊 转载了使用AI技术模拟黄家驹演唱「直到世界尽头」的视频,随后在各个社交媒体传播并吸引了大量讨论。黄家驹的歌声搭配「灌篮高手」的主题曲,唤醒了一代人心中关于青春的美好记忆。
歌迷们比较一致的观点是,当前AI生成的音色和声线已经有8分像了!只是唱法还有一点点瑕疵,主要表现在每句尾音的处理,但是能听到这个声音已经激动加感动了!甚至开始期待一场AI演唱会~
这个视频原作者是 YouTube@KaKuiAI。很好奇这位创作者使用了哪些技术和工作流,可以处理到如此细致入微的程度!
🉑 2023亚马逊云科技 re:Invent 全球大会 | 生成式AI赋能千行百业
2023年亚马逊云科技 re:Invent 全球大会于北京时间2023年11月28日-12月1日举办,并进行了线上同步直播。作为亚马逊的年度科技盛典,大会发布的创新产品和技术非常值得关注。
今年的大会重磅发布了 Amazon Q、Graviton4、数据库&应用领域 Serverless 创新、Zero-ETL 新集成功能等,以及面向汽车、制造、生命科学、零售和电商、游戏、金融服务等行业的垂直应用和客户实践。
日报选取与生成式人工智能最密切相关的几个产品,看看亚马逊在这一新领域的布局和进展。了解大会更多信息可以阅读下方官方盘点。
发布 Amazon Q:一个面向企业用户的生成式 AI 助手,可广泛应用于各个垂直行业,将全面改变行业客户在亚马逊云科技上构建、部署和应用生成式 AI 的方式
Amazon Connect 推出生成式 AI 功能:Amazon Connect 是一种全渠道云联络中心服务,新增生成式 AI 功能后,使各种规模的组织能够提高员工生产力、节省成本和改善客户服务体验;新增功能包括Amazon Q in Connect、Amazon Connect Contact Lens、Amazon Lex in Amazon Connect、Amazon Connect Customer Profiles
发布 Amazon Titan Image Generator:通过自然语言提示制作工作室质量级别的逼真图像,帮助零售和电商、游戏开发者、媒体和娱乐、广告营销等行业客户以低成本快速设计和迭代大量图像
推出 Amazon Lex 话语生成(utterance generation)功能:Amazon Lex 是一种用于在任何应用中使用语音和文本构建会话接口的服务,可以快速轻松地构建对话机器人、虚拟客服和交互式语音响应(IVR)系统 ⋙ 官网完整盘点
🉑 年度大事表| 2023 生成式AI寒武纪大爆发
Author: 00@xueyuan.ai
可以前往 ShowMeAI 星球搜索关键字「年度大事表」,下载高清原图 (使用浏览器访问链接 https://t.zsxq.com/14DRq4ZZg 即可)
这份年度大事表,收集了ChatGPT 发布后的一整年时间里,生成式AI每个月的关键事件,并按照产品 (文本 / 图片 / 视频 / 代码 / 其他 / 开源)、模型 (基础 / 多模态)、算力、政策法规这四项进行了分类展示。
可以看出,最近一年生成式AI技术和产品在快速演进,用「日新月异」来形容真是一点没夸张。认真看看这张图,你应该能想起每次被「爆炸性新闻」轰炸信息流的白天和夜晚~
👀 AI知识地图 | 一个AI工程师的自我修养
Author: 即刻 @pe653
可以前往 ShowMeAI 星球搜索关键字「一个AI工程师的自我修养」,下载高清原图 (使用浏览器访问链接 https://t.zsxq.com/14my70TUO 即可)
这是即刻用户 @pe653 分享的一份「AI工程师」学习路径,包括前端demo、环境、推理部署、Train训练、Eval评估框架、算法与网络结构、数据与构造等7个知识领域,共75个技能板块 ༼ つ ◕_◕ ༽つ
🉑 大模型时代,程序员如何实现自我成长
文章作者就是一位开发者,他梳理分享了过去一年总结积累的思考、资料和经验,并借此带领大家回顾了一下过去一年大模型领域的发展情况。
文章会分成了四个部分,从初次接触 ChatGPT 沉迷追 AI 新闻,到开始亲身实践并利用 LLM 进行一些有价值的工作,然后以开发者视角总结一年来大模型各个层面的发展,最后浅谈一下对 AI 未来的一些展望。
尤其不错的是,作者给出了品质非常不错各类清单和链接,包括优质信息源、基础和进阶课程、标志性的开源项目、基础模型服务商、中间层、体验不错的 LLM 产品等等。值得跟着作者清单 follow 一下 ⋙ 阅读原文
🉑 我的朋友开了家AI公司,6个月就把裤衩赔掉了
这是差评君分享的一个他朋友「杨泽玮」创立AI公司失败的经历。6个月,花掉20万,挣了200块,最终关停了项目。一定程度上来说,他是这轮AI创业浪潮里很多人和故事的缩影——迷茫且亢奋,混乱又坚定。
杨泽玮在2023年年初受到GPT-4发布的启发,决定创立一个将AI与设计需求结合的网站。尽管他和团队成员对AI并不了解,但他们通过在线教程学习,并在三个月内完成了网站开发。然而,项目在实际运营中遇到了很多困难,如盈利问题、竞争激烈、难以获得投资等。
在经历一番「大冒险」之后,创业者的「真心话」值得一听——我们还需要补太多课,才能成为一名还算优秀的创业者。以及,尤其值得一提的是,原文评论区很不错! ⋙ 阅读原文
👀 2023中文大模型进展评估 | ChatGPT发布一周年特别报告
ShowMeAI知识星球资源编码:R198
中文语言理解测评基准 CLUE (The Chinese LanguageUnderstanding Evaluation) 发起于2019年,陆续推出CLUE、FewCLUE、KgCLUE、DataCLUE等广为引用的测评基准。SuperCLUE 是大模型时代 CLUE 基准的发展和延续,聚焦于通用大模型的综合性测评,构建了多层次、多维度的综合性测评基准。
11月底,中文大模型测评基准 SuperCLUE 发布最新报告「SuperCLUE中文大模型基准测评报告,2023」,公布了对中文大模型的最新测评结果,并梳理了过去一年国内大模型的关键进展。整理了以下关键页面,感兴趣可以下载报告查看详细信息。
自2022年11月30日ChatGPT发布以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破,大致可以分为三个阶段:
准备期:ChatGPT发布后国内产学研迅速形成大模型共识
成长期:国内大模型数量和质量开始逐渐增长
爆发期:各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势
报告整理了几十个值得关注的中文大模型,包括开源/闭源的通用大模型,以及聚焦于医疗、汽车、教育、金融、工业、文化、零售、交通等垂直领域的行业大模型。
这张图是整份报告的核心。可以看出测评结果按照「基础能力」和「应用能力」分成了四个象限。以下进行简单说明,如果对测评细节感兴趣可以前往阅读原报告:
基础能力包含语言理解与生成、专业技能与知识、传统安全的能力考察
应用能力主要考察对于通用工具使用和检索调用规划接口的能力;
卓越领导者:代表模型在基础和场景应用上处于领先位置,引领国内大模型发展
实用主义者:代表模型在场景应用上处于领先定位
潜力探索者:代表模型正在早期探索拥有较大潜力
技术领跑者:代表模型聚焦基础技术研究
🉑 OpenAI 大神 Andrej Karpathy 带你一小时入门大语言模型
看了一圈,觉得这个视频的中英字幕翻译还不错 ⋙ https://www.bilibili.com/video/BV1kC4y1P7Lt/
OpenAI 有两位大家熟知的技术大神有两位,一位是在最近风波中被广为人知的Ilya,另外一位就是温文儒雅的Andrej Karpathy。
他在今年5月份的微软BUILD 2023大会上,做了名为「State of GPT」的演讲,介绍了 GPT 的训练和推理过程。如果你一直在关注生成式AI领域,应该这次分享印象深刻。
上次的演讲没有留下视频,因此Andrej Karpathy 最近专门录制了一个视频「The busy person’s intro to large language models (给大忙人的 LLM 入门课)」,用一小时的时间带你搞懂什么是大模型。这应该是我们能看到的最好的大模型入门讲座了。
下岗链接是视频字幕的英文文字版本,以下是整理的课程要点和时间戳。没找到很好的中文翻译和学习笔记,大家先凑活看英文吧~ 感兴趣可以对照观看并整理笔记:
Deep Dive Into Large Language Models 深入了解大语言模型
00:20 LLM Inference (LLM 推理)
04:17 LLM Training (LLM 训练)
08:58 LLM dreams (LLM 做梦)
11:22 How do they work? (它们是如何工作的)
14:14 Finetuning into an Assistant (微调成助手)
17:52 Summary so far (目前为止的总结)
21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard (附录:比较、标签文档、RLHF、合成数据、排行榜)
25:43 LLM Scaling Laws (LLM 扩展定律)
27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E) (工具使用 - 浏览器、计算器、解释器、DALL-E)
33:32 Multimodality (Vision, Audio) (多模态 - 视觉、音频)
35:00 Thinking, System 1/2 (思考,系统1/2)
38:02 Self-improvement, LLM AlphaGo (自我提升,LLM AlphaGo)
Security Aspects Of Large Language Models 大语言模型的安全方面
40:45 LLM Customization, GPTs store (LLM 定制,GPTs 商店)
42:15 LLM OS (LLM 操作系统)
45:43 LLM Security Intro (LLM 安全简介)
46:14 Jailbreaks (越狱)
51:30 Prompt Injection (提示注入)
56:23 Data poisoning (数据投毒)
58:37 LLM Security conclusions (LLM 安全总结) ⋙ 链接
虽然 Andrej Karpathy 已经尽力在把课程讲得通俗易懂了,但是想深入理解仍然需要补充很多背景知识。下方链接就是你可能需要的补充资料 Reading List (也是英文版本) ~ ⋙ 链接
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!