【博士每天一篇论文-算法】Optimal modularity and memory capacity of neural reservoirs

阅读时间:2023-11-15

1 介绍

年份:2019
作者:Nathaniel Rodriguez 印第安纳大学信息学、计算和工程学院,美国印第安纳州布卢明顿
期刊: Network Neuroscience
引用量:39
这篇论文主要研究了神经网络的模块化与记忆性能之间的关系,提出记忆性能存在一个最佳模块化程度,即在局部凝聚性和全局连接性之间建立平衡。这种最佳模块化可以使神经网络具有更长的记忆能力。
作者提出从神经网络的动力学分析和信息传播过程中获取的见解可以用于更好地设计神经网络,并可以揭示大脑的模块化组织。
研究了基于信息扩散和储备计算机的模块化的作用,展示了这对于平衡局部和全局通信和计算的能力以及提高记忆性能的效果。

2 创新点

(1)揭示了记忆性能的最佳模块化结构
通过研究神经网络的结构组织如何影响其功能能力,发现在记忆性能方面存在一个最佳的模块化结构。这个最佳模块化结构在局部凝聚性和全局连接性之间实现了平衡,从而使神经网络能够具有更长的记忆能力。
(2)动力学分析和信息传播过程揭示了设计神经网络的见解
作者提出了通过神经网络的动力学分析和信息传播过程来更好地设计神经网络的方法,并提出这种方法可能为大脑的模块化组织提供见解。通过基于信息扩散理论的模块化角色的研究,作者探讨了模块化在储层计算机中的作用。
(3)ESN中的社区的作用
通过研究信息扩散理论和模块化对预留河计算机的影响,作者发现ESN中的社区可以在局部和全局通信和计算之间提供平衡的方式,从而提高记忆性能。

3 相关研究

(1)储层计算(Reservoir computers)是生物学上可行的大脑计算模型
【Reservoir computing properties of neural dnamics in prefrontal cortex】
【Minimal approach to neuro-inspired information processing】
(2)储层计算与RNN不同,储层计算仅训练少量输出参数,而不是训练所有连接参数。储层计算机利用神经储层的隐式计算能力-模型神经元的网络。
储层计算机学习特定行为的能力取决于储层的动力学集合的丰富程度。
【Reservoir computing approaches to recurrent neural network training】
【A neurodynamical model for working memory】
(3)在ESN中受多个因素的影响,包括谱半径(the spectral radius )、输入和储层权重尺度( reservoir weight scales)以及储层大小( reservoir size)。
在记忆任务中,性能在谱半径的临界点附近急剧增加,嵌入在具有长转换和前一输入回响神经元状态的动力学区域,保存了过去的信息。【A neurodynamical model for working memory】【An experimental unification of reservoir computing methods】发现权重分布在性能方面也起重要作用。【Effects of synaptic connectivity on liquid state machine performance】
(4)储层拓扑的影响有较多的研究
使用小世界【Collective behavior of a small-world recurrent neural system with scale-free distribution.】, scale-free【 Collective behavior of a small-world recurrent neural system with scale-free distribution】,columnar 【Effects of synaptic connectivity on liquid state machine performance】【.A priori data-driven multi-clustered reservoir generation algorithm for echo state network-2015】,Kronecker图【An approach to modeling networks-2010】和带有横向抑制的集合【Decoupled echo state networks with lateral inhibition】,每种方法的性能都优于简单的随机图。

4 实验分析

4.1 验证线性阈值模型中发现的最优模块化现象是否适用于神经

通过两个模拟实验,验证了最优模块化现象不仅适用于线性阈值模型,也可以推广到神经网络中的沉积池。实验结果表明,当网络中的模块连接强度适中时,可以实现最大激活效果,优化整个网络的响应。
image.png
(1)第一个实验使用了一个简单的双社区配置,其中桥梁比例μ控制网络中的社区结构强度。当μ=0时,社区之间完全隔离,社区结构最强;当μ≈0.5时,社区之间连接最多。实验结果显示,即使没有指定种子社区,类似的最优模块化行为仍然存在。在低μ值下,由于缺乏桥梁的存在,输入信号无法得到加强,即使是高度凝聚的社区也无法被激活。在高μ值下,虽然存在许多全局桥梁有助于巩固信号,但局部凝聚度不足以维持强烈的响应。在最优区域,社区的放大效应与桥梁的全局传播之间存在平衡,使得网络能够将亚临界的、全局分布的信号传播到整个网络。然而,在线性和双曲正切的库中,并未发现这种关系。
(2)第二个实验模拟一个具有许多社区的网络,这些社区类似于ESN(Echo State Network)或大脑中观察到的社区。与之前的研究仅仅考虑输入到单个社区不同,这里扩展到了多个社区。实验结果显示,即使没有指定的种子社区,类似的最优模块化行为也出现。在低μ值下,由于缺乏桥梁的存在,输入信号无法得到加强,甚至无法激活高度凝聚的社区。在高μ值下,许多全局桥梁有助于巩固信号,但局部凝聚度不足以维持强烈的响应。在最优区域中,社区的放大效应与桥梁的全局传播之间存在平衡,使得网络能够将亚临界、全局分布的信号传播到整个网络。然而,在线性和双曲正切的库中,并未发现这种关系。

4.2 最优模块化对神经网络记忆能力的影响

通过Jaeger(2002)开发的常见的记忆基准任务。【Short term memory in echo state networks】
在记忆任务中,研究了最优模块化对神经网络记忆能力的影响。结果发现,当网络模块化结构较强时,网络的记忆能力较差。随着模块之间的连接增强,网络的记忆性能显著改善,但当连接过于密集时,会导致性能下降。模块化会降低记忆容量,因为社区创建了信息瓶颈。然而,权重尺度(weight-scales)在ESN中能平衡这个性能。使用输入信号与延迟输出信号之间的二项分布的决定系数来量化ESN的性能。网络的记忆容量是在所有时间延迟下的这些性能之和。MC是网络的记忆容量。
image.png

4.3 记忆任务中的模块化结构对性能的影响

引入一个召回任务,在网络中输入随机生成的二进制序列,并通过网络的吸引子(Attractors)空间来存储并召回这些序列。发现模块化网络在性能上表现更好,并且在μ约为0.1时达到最佳性能。此外,模块化网络具有更多的可用吸引子,而过度互连会导致吸引子数量减少。在适度的模块化结构下,网络具有更多的可用吸引子,有利于提高网络的信息存储能力。然而,过多的连接会将各个初始状态牵扯到少数几个大吸引子中,导致性能下降。
image.png
吸引子表示网络在记忆和召回过程中所处的特定状态。吸引子提供了一种稳定的状态,使得网络可以存储和恢复信息。

5 代码

https://github.com/Nathaniel-Rodriguez/reservoirlib

6 思考

作者从多个角度去分析了模块化结构对于类脑网络ESN的影响。此外模块化结构还有助于在噪声环境、学习新技能和处理系统建模等方面提高神经网络的性能。
作者用两种方法去评价模型的记忆能力和信息存储能力,分别是MC和Attractors方法。本文比较新颖的提出了用Attractors去评价模型的记忆存储能力。MC方法适用于不依赖于具体系统模型的性能评估,而Attractors方法则适用于需要考虑系统动力学特性的性能评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/308350.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

WEB 3D技术 three.js 光照与阴影

本文 我们来说 灯光与阴影 之前 我们有接触到光照类的知识 但是阴影应该都是第一次接触 那么 我们先来看光 首先是 AmbientLight 环境光 你在官网中搜索 AmbientLight 官方是就写明了 环境光是不会产生阴影的 因为 它没有反向 然后是 DirectionalLight 平行光 它是可以投射阴…

Java建筑工程建设智慧工地源码

智慧工地管理平台依托物联网、互联网,建立云端大数据管理平台,形成“端云大数据”的业务体系和新的管理模式,从施工现场源头抓起,最大程度的收集人员、安全、环境、材料等关键业务数据,打通从一线操作与远程监管的数据…

代理IP连接不上/网速过慢?如何应对?

当您使用代理时,您可能会遇到不同的代理错误代码显示代理IP连不通、访问失败、网速过慢等种种问题。 在本文中中,我们将讨论您在使用代理IP时可能遇到的常见错误、发生这些错误的原因以及解决方法。 一、常见代理服务器错误 当您尝试访问网站时&#…

MySQL 存储引擎全攻略:选择最适合你的数据库引擎

1. MySQL的支持的存储引擎有哪些 官方文档给出的有以下几种: 我们也可以通过SHOW ENGINES命令来查看: 还可以通过ENGINES表查看 2. 存储引擎比较 我们通过存储引擎表来看各自的优点: InnoDB 默认的存储引擎(SUPPORT字段为D…

LeetCode 36 有效的数独

题目描述 有效的数独 请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。 数字 1-9 在每一行只能出现一次。数字 1-9 在每一列只能出现一次。数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。(请参考…

[openGL]在ubuntu20.06上搭建openGL环境

就在刚刚, 我跑上了一个6小时后出结果的测试程序. 离下班还有很久, 于是我打开了接单群 , 发现了很多可以写的openGL项目. 但是!!我的电脑现在是ubuntu呀, 但是不要慌!!!接下来我一步一步教你如何完美搭建一个ubuntu上的openGL环境. 保证一个坑也不会踩! 文章目录 创建项目工作…

借助Gitee将typora图片上传CSDN

概述 前面已经发了一个如何借助Github将typora上的图片上传到csdn上,但这有个缺陷:需要科学上网才能加速查看已经上传到github上的图片,否则就会出现已经上传的图片,无法正常查看的问题 如何解决? 那就可以使用Gite…

前端(angular)在谷歌(chrome)浏览器使用高德地图api定位报错超时geolocation time out ,能定位但不安全的方法

已知信息整合 正如大家搜到的大佬说的原因是chrome浏览器本身的问题。我换成edge就可以。高德地图给出的地图定位api的常见问题,这是另外还有个别浏览器(如google Chrome浏览器等)本身的定位接口是黑洞 以下是能定位但不安全的方法 连接上…

Java面试之集合篇

前言 本篇主要总结JAVA面试中关于集合相关的高频面试题。本篇的面试题基于网络整理以及自己的总结编辑。在不断的完善补充哦。欢迎小伙伴们在评论区发表留言哦! 1、基础 1.1、Java 集合框架有哪些? Java 集合框架,大家可以看看 《Java 集…

Excel·VBA按指定顺序排序函数

与之前写过的《ExcelVBA数组冒泡排序函数》不同,不是按照数值大小的升序/降序对数组进行排序,而是按照指定数组的顺序,对另一个数组进行排序 以下代码调用了《ExcelVBA数组冒泡排序函数》bubble_sort_arr函数(如需使用代码需复制…

18张AI电脑动漫超清壁纸免费分享

18张AI电脑动漫壁纸,紫色系和暗黑系,都很不错,喜欢的朋友可以拿去 CSDN免积分下载

【云计算】云计算概述

1. 云计算概述 1.1 云计算的定义 美国国家标准与技术研究院(NIST)定义 云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件…

AI墨墨交流群正式成立:探索科技前沿,共建智能未来

在这个充满变革的时代,AI技术正如涌泉般迸发,带来无限可能。我们深感,唯有汇聚智慧,方能更好地驾驭这股前沿科技的潮流。因此,我们自豪地宣布:AI墨墨交流群正式成立了!这不仅是一个交流群&#…

小白苦恼:电脑那么多USB口,怎么知道哪个读写更快?

前言 最近有个朋友和小白抱怨:电脑那么多USB接口,有些接口在传输文件的时候实在慢的很。 电脑诞生以来,USB接口就一直存在。但是USB接口还是长得几乎一样,不仔细去研究都不知道哪个USB会更快。 许多小伙伴就会直接放弃辨认&…

阿里云服务器新购、续费、升级优惠活动及代金券领取入口汇总

阿里云作为国内领先的云计算服务提供商,一直以来都为广大的用户提供了优质、稳定、高效的服务。为了更好地满足用户的需求,阿里云会不定期地推出各种优惠活动,包括新购、续费、升级优惠活动以及代金券领取等。本文将为大家详细介绍这些优惠活…

软件测试|详解 Pytest 参数化:简化测试用例的编写

简介 Pytest 是一个广泛使用的 Python 测试框架,它提供了丰富的功能来编写和执行测试用例。其中一个强大的特性是参数化,它允许我们通过一种简洁的方式运行多个输入参数的相似测试用例,从而减少冗余的代码。本文将详细介绍 Pytest 的参数化功…

文心、讯飞、ChatGPT大模型横向比较

三种大模型的横向比较分析发现,大模型最终的优异表现依赖于模型规模的突破。 通过比较不同规模的大模型,分析发现大模型的强大生成能力主要源自模型的参数量级的飞跃。尽管方法论上大同小异,但参数量的指数级增长是实现质的飞跃的关键所在。“大力出奇迹”可以说是大模型取得辉…

电子学会C/C++编程等级考试2023年12月(一级)真题解析

C/C++编程(1~8级)全部真题・点这里 第1题:数的输入和输出 输入一个整数和双精度浮点数,先将浮点数保留2位小数输出,然后输出整数。 时间限制:1000 内存限制:65536 输入 一行两个数,分别为整数N(不超过整型范围),双精度浮点数F,以一个空格分开。 输出 一行两个数,分…

嵌入式(二)单片机基础 | 单片机特点 内部结构 最小系统 电源 晶振 复位

上一篇文章我们介绍了嵌入式系统 嵌入式系统(Embedded System)是一种特定用途的计算机系统,它通常嵌入在更大的产品或系统中,用于控制、监测或执行特定的任务。这些系统通常由硬件和软件组成,旨在满足特定的需求&…

Kafka(四)Broker

目录 1 配置Broker1.1 Broker的配置broker.id0listererszookeeper.connectlog.dirslog.dir/tmp/kafka-logsnum.recovery.threads.per.data.dir1auto.create.topics.enabletrueauto.leader.rebalance.enabletrue, leader.imbalance.check.interval.seconds300, leader.imbalance…