阿里大模型又又又又开源了!这次还是王炸产品!

dd8c4f7e3745b083bdcb66d32a45ae53.jpeg

阿里大模型又双叒叕开源了:刚刚,Qwen2 宣布开源!

不到一年时间,阿里云通义千问先后开源近 10 款不同尺寸的大语言模型,之前开源的 Qwen 系列 72B、110B 模型就曾多次登顶 HuggingFace 的 Open LLM Leaderboard 开源模型榜单。

今天,Qwen2 更是在发布后两个小时,就被 HuggingFace 联合创始人发推宣布: 

Qwen2-72B 冲上 HuggingFace 开源大模型榜单 Open LLM Leaderboard 第一名,全球排名最高!

性能强劲、使用免费,我第一时间就去研究了技术报告,以及如何使用。本文将手把手教你如何在自己电脑本地上跑最新的 Qwen2 模型,Windows、MacOS 系统都支持。

01
这次开源了啥?

Qwen2 开源了多个不同尺寸的模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B

fbfbd612dc3828b5a767285a7b95b814.png

Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,比如开源界的国际标杆 Llama-3-70B。

70a402e4696ab980bc409d96e736b1e3.jpeg

小模型方面,Qwen2 系列模型基本能够超越同等规模的最优开源模型甚至更大规模的模型。

8b988bfb4839d98f0b83ec79a56dd3c9.jpeg

02
手把手教你部署 Qwen2

使用之前推荐过的开源工具:Ollama,这是一个用来本地部署和运行大模型的工具。看到 GitHub 上这么多开源的大模型,不要眼馋。使用 Ollama 就能实现在你的电脑本地上运行大模型。

如下分别是 MacOS 和 Windows 系统的部署最新阿里通义千问大模型的教程。

0a790af108ce3d17063c1ef8961c9719.pngMacOS 部署 Qwen2 模型教程

  1. 官网搜索 Ollama ,然后下载对应你操作系统的版本

946f69f85fa975cfe15b6208697399d3.png

2. 安装后运行 Ollama,点击 install 即可

3. 去打开你的终端 terminal ,输入如下命令,就可以下载并部署大模型了

ollama run qwen2:1.5b

注意,1.5b 是模型的尺寸,你可以替换成任何的开源尺寸。比如 qwen2:72b 就是参数量比较大的模型,只不过下载时间比较长。

4. 输入命令后,模型开始下载:

ad90c2f004e0abfd6b3150beabc7b986.png

5. 模型下载部署完成:

77def13f6f26020df7320ce0b3d4c952.png

6. 开始使用大模型:

1ea864e8bbc0d239f86b59aafebbd77e.png

0121ed99fb3d4a516cf0eba3cece3e57.png Windows 操作系统部署 Qwen2 模型教程

1. 前往 Ollama 下载 Windows 版本安装文件

2. 然后运行下载的 OllamaSetup.exe 文件

3. 去下载部署最新的通义千问大模型

你只需要 win键+R 输入 cmd 打开你的命令行,然后输入如下命令。就开始下载这个大模型了

ollama run qwen2:72b

你只需等待下载完成,进行安装部署。

03
测测 Qwen2 模型效果

1️⃣ 请用数学原理、公式、符号等为我创作一首数学情诗。必须包含如下关键词:π、love、996

f6246275a1d2972e90e8f1efc4e9f719.jpeg

2️⃣ 将如下翻译成英文:谬赞、桃花源、献丑、发嗲、噱头、嘴替、显眼包、奥里给、躺赢、阴阳怪气、我裂开了

推荐长按图片翻译,对比前后翻译结果。Qwen2 的翻译结果绝了,不仅输出了拼音,而且每一个词都翻译的很好。比如桃花源翻译成乌托邦;奥利给翻译成经常被用来表示赞同或鼓励。

89015d77d5b5a9d7ae40fcdfe2db425b.png

3️⃣  推理问题

输入事件:医生告诉他不要担心。基本上没有病变严重。

问题:请从下面选择输入事件的原因

选项1:小名在回家的路上遇到了一个奥利里。

选项2:小名的父亲被查出患有视网膜母细胞瘤。

2af12a486e9b64aca9ee5b3e7ef0de9e.png

04
开源地址

现在,Qwen2 系列模型均已开源在 Hugging Face 和ModelScope上。后续,阿里云通义千问会把 Qwen2 扩展成多模态模型,融入视觉及语音的理解。期待住了!

开源地址:https://github.com/QwenLM/Qwen2
开源社区:https://huggingface.co/Qwen

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/692150.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

两个不同的TA Instance之间可以共享全局变量吗

答案:不能。 在GP规范里其实是有规定,在不同的TA Instance之间,都是有着各自的physical memory space的,都是相互独立物理地址空间的。 不同的TA instance之间,各自拥有各自的堆空间、可写全局数据段、可写静态数据段。…

Python可视化 | 使用matplotlib绘制面积图示例

面积图是数据可视化中的一个有效工具,用于说明时间上的关系和趋势。它们提供了一种全面的、视觉上迷人的方法,通过熟练地将折线图的可读性与填充区域的吸引力相结合来呈现数值数据。 在本文中,我们将学习更多关于在Python中创建面积折线图的…

前端渲染大量数据思路【虚拟列表】【异步机制】

当浏览器遇到性能瓶颈导致页面卡顿时,你会怎么处理?如何查找问题的原因? 浏览器本身自带性能检测工具,通常我们分析由脚本导致的页面卡顿会选择 性能(performance) 选项卡,在其中我们可以找到导…

从诺曼底登陆八十周年说起

昨天(2024年6月6日)是诺曼底登陆(Normandy Campaign)八十周年纪念日。媒体上有很多对相关纪念活动的报道。 诺曼底登陆战役,是第二次世界大战也是世界战争史上规模最大的登陆战役。敦刻尔克大撤退后,西欧大…

Qt Window Dialog 无标题栏 ,无边框,可拖动

1.效果: 2. 主要实现步骤: 设置窗口 flag: this->setWindowFlags(Qt::FramelessWindowHint | Qt::WindowStaysOnTopHint); 创建变量存储位置 QPoint m_dragPosition; 对鼠标左键按下和移动事件做处理 void DraggableDialog::mousePre…

【Linux操作系统】Linux中进程的五种状态:R、S、D、T、X以及僵尸进程、孤儿进程

操作系统中有许多同时执行的进程,这些进程都可能处于不同的状态代表着不同的含义。 R运行状态(running) 概念:并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。 我们运行可执行程序myproc利用指令 ps ajx可以看到进程…

Java 18 新功能概述

Java 18 在 2022 年 3 月 22 日正式发布,Java 18 不是一个长期支持版本。 包含多项新特性和改进,如文件系统链接、文本块、表达式求值API、ForkJoinPool优化、Optional新方法等。 亮点还包括预览特性:Record Pattern Matching for Switch和增…

Elastic Search(ES)Java 入门实操(3)数据同步

基本概念和数据查询代码: Elastic Search (ES)Java 入门实操(1)下载安装、概念-CSDN博客 Elastic Search(ES)Java 入门实操(2)搜索代码-CSDN博客 想要使用 ES 来查询数…

为什么会有虚像

本来我就打算写虚像相关的内容,实际上我看不懂光学的内容,我只是发觉书上没有使用变分法来做,而只是解析几何的变换,这个做法完全脱离实际,物理书为什么会这样写不知道原因,但是很明显这样的内容也非常的复…

操作系统复习-存储管理之段页式存储管理

存储管理之段页式存储管理 页式存储管理(等分划分) 字块是相对物理设备的定义页面则是相对逻辑空间的定义指的都是大小一样的一块内存页式存储管理是将进程逻辑空间等分成若干大小的页面相应的把物理内存空间分成与页面大小的物理块以页面为单位把进程空间装进物理内存中分散的…

【MySQL】常见可执行程序

本文使用的版本是MySQL8,5.7可能会有所不同。 MySQL提供了一些重要的程序用来管理和操作数据库。这里会介绍一些常用的程序及其使用。对于MySQL程序的使用,可以查看官方帮助手册来学习。 MySQL :: MySQL 8.0 Reference Manual :: 6 MySQL Programs 程序…

normalizing flows vs 直方图规定化

normalizing flows名字的由来 The base density P ( z ) P(z) P(z) is usually defined as a multivariate standard normal (i.e., with mean zero and identity covariance). Hence, the effect of each subsequent inverse layer is to gradually move or “flow” the da…

C# Maui 报错:程序“[15748] MauiApp1.exe”已退出,返回值为 2147942405 (0x80070005)

“MauiApp1.exe”(CoreCLR: DefaultDomain): 已加载“C:\Program Files\dotnet\shared\ Microsoft.NETCore.App\8.0.6\System.Private.CoreLib.dll”。 “MauiApp1.exe”(CoreCLR: clrhost): 已加载“E:\cDemo\MauiApp1\MauiApp1\bin\Debug\net8.0-windows10.0.19041.0\win10-x…

数智融通 创新发展|亚信科技携AntDB、Data OS与隐私计算产品,赋能企业高质量发展

5月21日,亚信科技在云端举办了一场别开生面的研讨会——“数智融通 创新发展”,聚焦企业数智化升级的前沿话题。资深产品经理和技术架构师们面对面深入交流,分享创新成果与实战案例,共同探索企业数智化转型的新路径。 图1&#xf…

重构某测试站点

一、计算校验值 校验值结果: 文件名称:培训用centos.rar,文件大小:1,335,759,953,MD5:534EC38CDA7DA2196C84AC8F6092514B,SHA1:FD35D86A27A007AE10872980C48653A110DF6067&#xf…

【Ardiuno】ESP32单片机初试点亮LED小灯

之前用的Ardiuno的主板做过一些简单的开发实验,按照相关说明还是很容易进行操作的。最近看了ESP32可以有wifi的功能,也就买来实验一下。 ESP32的主板开发环境安装,按照说明的安装下载程序总是报错,又上网搜索半天最后按照CSDN上某…

算法006:查找总价格为目标值的两个商品

. - 力扣(LeetCode). - 备战技术面试?力扣提供海量技术面试资源,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/he-wei-sde-liang-ge-shu-zi-lcof/ 题干说的很复杂,简化一…

IDEA使用阿里通义灵码插件

在这个AI火热的时代,纯手工写代码已经有点out了,使用AI插件可以帮我们快速写代码,起码能省去写那些简单、重复性的代码,大大提高编码效率,在这里我推荐使用阿里的通义灵码 注册安装 安装注册好后,打开我们…

前端技术探索:从基础到进阶

前端技术作为现代Web开发中不可或缺的一部分,其重要性不言而喻。随着技术的快速发展,前端领域涌现出了许多经典且值得深入探索的技术和框架。本文将带您领略前端技术的魅力,从基础到进阶,一起探讨前端开发的精髓。 一、前端技术基…

【AI时代,生命修行】

今日分享📒,AI时代, 生命 与 修行: 不要用太多时间去工作,尤其是在人工智能时代。如果谁还在用传统的线性的费时间的这种努力的工作方式,只能说太落伍了。 我只说给同频的朋友们无关的人请划走。因为很多…