中国大模型开源创新与合作的新篇章 | 2023 CCF中国开源大会

2023年10月21日至22日,由中国计算机学会(CCF)和开放原子开源基金会联合主办的CCF中国开源大会(CCF ChinaOSC)在湖南省长沙市北辰国际会议中心成功召开。此次大会以“开源联合,聚力共赢”为主题,旨在推动国内外开源事业的交流与合作,共同探讨开源未来的发展方向和趋势。

2023 CCF中国开源大会现场

高文院士:大模型开源推动技术创新与产业发展

在21日的主论坛会议上,鹏城实验室主任、中国工程院院士高文发表了题为《鹏城·脑海预训练大模型底座与开源合作》的报告。高文院士详细介绍了鹏城脑海预训练大模型的底座技术和应用场景,并强调了开源合作的重要性。他指出,以ChatGPT为代表的聊天预训练大模型已经对人类经济生活产生了巨大的影响。而这种影响背后,强大的算力基础是大模型能够理解海量数据并不断演化的关键因素。

高文院士表示,基于鹏城云脑II先进自主E级智能算力平台,鹏城实验室正在持续训练鹏城·脑海大模型底座。脑海是一个完全自主可控、开源开放的自然语言稠密大模型,参数级别达到2000亿,性能达到国际先进水平。他强调,鹏城·脑海大模型底座的输出内容符合中文核心价值观,这对于推动大模型在国内的发展具有重要意义。

高文院士还指出,开源已经成为推动技术创新和产业发展的重要力量,而大模型开源更是未来发展的重要方向之一。通过开源开放的方式,可以汇聚全球的智慧和力量,加速大模型的研发进程,并且推动大模型在各个行业和领域的应用。他表示,鹏城实验室已经开放基于鹏城·脑海自然语言预训练大模型底座的合作,将持续共建大模型开源联合体,助力国产自主创新的大模型生态发展。

大模型开源创新研究联合体:联接资源,推动创新

为进一步推动大规模模型的研究和发展,促进学术界和工业界的交流与合作,以及汇聚全球的智慧和力量,会上进行了“大模型开源创新研究联合体”的成立仪式。由OpenI启智社区运营中心主任余跃博士为大家简单介绍关于成立“大模型开源创新研究联合体”的背景和目的。他表示,该联合体的主要目标是通过将三种创新体相互联接以构建更好的大模型开源发展生态。

第一种是对计算资源跨域协作的联接。目前通过中国算力网加入联合体的有鹏城云脑以及来自全国的8家智算中心。这种联接方式旨在优化和整合各中心的资源,打破孤立,实现资源共享,以推动大规模模型的开发和研究。

第二种是对包括了鹏城·脑海在内的大模型主体的联接。鹏城·脑海是一个强大的AI模型,具备深度学习和推理能力。通过联接这些模型,开发者可以更方便地利用这些模型进行研究和开发,进一步推动大模型的发展和应用。

第三种是对包括科研机构、高校、企业等群智主体的联接。这种联接方式旨在促进学术界和工业界的交流与合作,汇聚全球的智慧和力量,共同推动大模型技术的不断发展和应用。

在成立仪式上,由中国工程院院士王怀民、余跃博士以及来自北京昇腾人工智能计算中心、天津人工智能计算中心、沈阳人工智能计算中心、大连人工智能计算中心、长春算力中心、西安未来人工智能计算中心、武汉超算中心&人工智能计算中心、成都智算中心8家计算中心代表上台联合见证了这一重要时刻。大模型开源创新研究联合体将成为人工智能领域的一个重要平台,为未来的技术创新和发展奠定坚实的基础。

中国大模型开源之路:专家探讨文化、技术与企业实践

繁荣中国开源生态,促进中国开源发展,离不开产学研的参与和努力。会上,由中国科学院院士、CCF开源发展委员会主任王怀民主持了以“中国大模型的开源发展之路”为主题的开源高峰论坛,与会嘉宾包括高文院士、复旦大学计算机学院教授邱锡鹏、清华大学计算机系WeBank讲席教授唐杰、阿里云CTO周靖人以及百川智能创始人兼CEO王小川。这些嘉宾就中国大模型的开源发展问题进行了深入探讨,并提出了宝贵的建议。

其中,高文院士强调了开源的重要性,认为开源本身是一种文化。传统的软件开源与大模型的开源并没有本质差别,都需要构建合作伙伴关系、建立生态。大模型开源后,其影响力将更广泛,更多的开发者和企业将能够基于它来开发更多应用与服务。他还特别提到OpenI启智社区,其独特之处在于它成功地从实验性科研项目发展成为备受开发者喜爱的开源社区。他认为,吸引并服务好年轻人是关键,让社区成为大家喜爱的聚集地是社区建设最重要的任务。

唐杰教授则从技术角度出发,探讨了大模型的开源技术挑战和解决方案。他认为,解决模型的可解释性、隐私保护以及跨语言、跨领域等问题是大模型开源的关键。同时,他还分享了如何利用强化学习等技术来优化大模型的性能。

邱锡鹏教授表示,大模型的开源将促进更多的创新和合作。他认为,在开源社区中,应该注重培养年轻的人才,让他们成为推动大模型开源发展的重要力量。

周靖人则从企业的角度出发,分享了阿里云和魔搭社区在大模型开源方面的探索和实践。他认为,企业应该积极参与大模型的开源工作,通过合作来推动技术的发展,同时也要注重保护知识产权。

王小川提出模型开源比以往的项目开源更积极,开源之后,大家能基于模型很快搭建自己的服务平台,可用性较以往大有提升。他表示,百川智能将致力于推动大模型的开源发展,通过建立合作伙伴关系、培养人才以及加强技术研发等方面来推动中国大模型开源的进步和发展。

最后,王怀民院士总结了本次对中国大模型的开源发展之路的讨论,他表示,我们感受到中国建设的大模型开源创新环境具有吸引力,吸引中国开发者乃至全球创新者的关注。未来期待基于大模型开源激发我国人工智能应用创新,助力中国信息产业发展。

中国大模型开源事业的健康发展、开源生态的良性构建,离不开政府、企业、科研机构以及各界开源爱好者的持续支持和广泛参与。最后,OpenI启智社区热烈欢迎对鹏城·脑海大模型开源感兴趣的组织机构通过以下联系方式加入大模型开源创新研究联合体,期待在各方的支持下,中国的大模型开源事业能够取得更大的突破和进步。

鹏城·脑海大模型网址:

OpenI - 启智AI开源社区提供普惠算力!

联系邮箱:

secretariat@openi.org.cn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/104956.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

身份证号码,格式校验:@IdCard(Validation + Hutool)

目标 自定义一个用于校验 身份证号码 格式的注解IdCard,能够和现有的 Validation 兼容,使用方式和其他校验注解保持一致(使用 Valid 注解接口参数)。 校验逻辑 有效格式 符合国家标准。 公民身份号码按照GB11643-…

Gdb调试

1 概述 当程序运行时出现问题时,通过GDB调试可以快速找到问题点,当然不是所有问题都能通过调试找到问题点。 在GCC编译程序时,需要加 -g参数,可以通过在-g选项后附加数字1、2或3来指定在代码中加入调试信息的多少。默认的级别是2…

人工智能基础_机器学习001_线性回归_多元线性回归_最优解_基本概念_有监督机器学习_jupyter notebook---人工智能工作笔记0040

线性和回归,就是自然规律,比如人类是身高趋于某个值的概率最大,回归就是通过数学方法找到事物的规律. 机器学习作用: 该专业实际应用于机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜索、定理证明、博弈、自动程序设计、智能控制…

Decomposed Meta-Learning for Few-Shot Named Entity Recognition

原文链接: https://aclanthology.org/2022.findings-acl.124.pdf ACL 2022 介绍 问题 目前基于span的跨度量学习(metric learning)的方法存在一些问题: 1)由于是通过枚举来生成span,因此在解码的时候需要额…

GPT的前世今生:从gpt1到chatgpt的能力提升

从2017年google brain提出transformer模型,到2018年基于transformer模型open ai推出了gpt1模型以及google推出了bert模型,到2019-2021年open ai陆续推出gpt2和gpt3,再到2022-2023年推出chat-gpt和gpt4,大语言模型已经发展成了一个…

Hadoop+Hive+Spark+Hbase开发环境练习

1.练习一 1.数据准备 在hdfs上创建文件夹,上传csv文件 [rootkb129 ~]# hdfs dfs -mkdir -p /app/data/exam 查看csv文件行数 [rootkb129 ~]# hdfs dfs -cat /app/data/exam/meituan_waimai_meishi.csv | wc -l 2.分别使用 RDD和 Spark SQL 完成以下分析&#xf…

Auth.js:多合一身份验证解决方案 | 开源日报 No.60

nodejs/node Stars: 96.2k License: NOASSERTION Node.js 是一个开源的、跨平台的 JavaScript 运行时环境。它具有以下关键特性和核心优势: 强大:Node.js 提供了强大且高效的服务器端运行能力,可以处理并发请求,并支持异步编程…

【Java技术专题】「入门到精通系列教程」深入探索Java特性中并发编程体系的原理和实战开发指南( 实现可伸缩IO专题)— 上

深入探索Java特性中并发编程体系的原理和实战开发指南( 实现可伸缩IO专题) 总体内容概览可扩展的网络服务分布式对象传统的阻塞式网络服务每个请求或连接可以在独立的线程中进行处理Server服务处理请求类Handler处理逻辑类优点缺点 可扩展性目标平稳降级…

【Gan教程 】 什么是变分自动编码器VAE?

名词解释:Variational Autoencoder(VAE) 一、说明 为什么深度学习研究人员和概率机器学习人员在讨论变分自动编码器时会感到困惑?什么是变分自动编码器?为什么围绕这个术语存在不合理的混淆?本文从两个角度…

设置爱奇艺代理教程

设置爱奇艺代理教程 活泼与直观:设置爱奇艺代理,让你的网络更加自由! 轻松口语化:首先,打开爱奇艺APP,进入设置页面。 设置->网络->代理设置 活泼与直观:在代理设置页面,我…

Docker Swarm 集群搭建

Docker Swarm Mode Docker Swarm 集群搭建 Docker Swarm 节点维护 Docker Service 创建 1.准备主机 搭建一个 docker swarm 集群,包含 5 个 swarm 节点。这 5 个 swarm 节点的 IP 与暂 时的角色分配如下(注意,搭建完成后会切换角色&#xff…

无线测温产品在菲律宾某工厂配电项目的应用

摘要:配电系统是由多种配电设备和配电设施所组成的变换电压和直接向终端用户分配电能的一个电力网络系统。由于配电系统作为电力系统的一个环节直接面向终端用户,它的完善与否直接关系着广大用户的用电可靠性和用电质量,因而在电力系统中具有…

3.SpringSecurity基于数据库的认证与授权

文章目录 SpringSecurity基于数据库的认证与授权一、自定义用户信息UserDetails1.1 新建用户信息类UserDetails1.2 UserDetailsService 二、基于数据库的认证2.1 连接数据库2.2 获取用户信息2.2.1 获取用户实体类2.2.2 Mapper2.2.3 Service 2.3 认证2.3.1 实现UserDetails接口2…

asp.net乡村旅游管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net乡村旅游管理系统是一套完善的web设计管理系统系统,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为vs2010,数据库为sqlserver2008,使用c# 语言开发 asp.net乡村旅游管理系统 二、…

2022年12月 Python(一级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 关于Python语言的注释,以下选项中描述错误的是?( ) A: Python语言有两种注释方式:单行注释和多行注释 B: Python语言的单行注释以#开头 C: Python多行注释使用###来做为标记 D: …

gitlab查看、修改用户和邮箱,gitlab生成密钥

查看用户、邮箱 git config user.name git config user.email 修改用户、邮箱 git config --global user.name “xxx” git config --global user.email “xxxxxx.com” 生成ssh密钥 ssh-keygen -t rsa -C “xxxxxx.com” 查看SSH秘钥 cat ~/.ssh/id_rsa.pub 将秘钥复制&…

Jenkins环境部署与任务构建

一、CI/CD 1、CI/CD 概念: CI/CD 是一种软件开发和交付方法,旨在加速应用程序的开发、测试和部署过程,以提高软件交付的质量和效率。 (1) 持续集成 (CI Continuous Integration): 持续集成是开发团队频繁集成其代码更改的过程。开发者将其…

DBOW概要理解与记录

前言 DBOW作为一种视觉回环技术被广泛应用在各类VSLAM框架中,之前的经验主要集中在使用和抽象理解层面,近期花了一些时间仔细阅读了相关论文和源码,这里做一些记录。 两个关键概念 Vocabulary 通过预先训练得到的词汇库,以树状…

VR全景餐厅,为餐饮老板开启了新纪元

在近两年的“元宇宙”概念的催生下,VR全景技术逐渐渗透到我们生活的方方面面,从舌尖到指尖、从田间到车间、从衣食住行到娱乐消费等,越来越多的行业、领域开始引入VR全景了,并在各自的垂直领域开拓了VR全景新时代。 而一直以来&am…

强化学习问题(7)--- Python和Pytorch,Tensorflow的版本对应

1.问题 之前下载的python3.8,在对应Pytorch和Tensorflow时没太在意版本,在运行一些代码时,提示Pytorch和Tensorflow版本过高,直接降下来,有时候又和Python3.8不兼容,所以又在虚拟环境搞一个Pyhon3.7&#x…