《跟李沐学 AI》AlexNet论文逐段精读学习心得 | PyTorch 深度学习实战

前一篇文章,使用 AlexNet 实现图片分类 | PyTorch 深度学习实战

本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started

本篇文章内容来自于学习 9年后重读深度学习奠基作之一:AlexNet【下】【论文精读】】的心得。

《跟李沐学 AI》AlexNet论文逐段精读学习心得

  • ImageNet Classification with Deep Convolutional Neural Networks
  • 视频学习感悟
  • 视频学习知识经验

ImageNet Classification with Deep Convolutional Neural Networks

https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

在这里插入图片描述

关于 AlexNet 工作原理的博客: https://readmedium.com/alexnet-explained-a-step-by-step-guide-93870b45126b

视频学习感悟

  • 没有必要学习前人的太多东西,因为很多东西是错误的,学习它们反而限制了自己的思路1
  • 工程能力很强才能验证自己的猜想,验证自己的猜想才能创新;光有猜想而没有能力验证等于空谈
  • 只要你的东西足够新,即使有很多说法是错误的,别人也会相信,关键是能 work,方法就是好过现在的,至于为什么可以慢慢等待时间,这个和牛顿莱布尼茨使用微积分,而微积分的严谨要一百多年后由柯西补充是一样的
  • 不要害怕学术工作,学术工作需要你:学习数学2,掌握编程,并且要勤奋。

视频学习知识经验

  • 经过了 2012 ~ 2021 年的探索,人们最终发现,主要的贡献在于大规模的数据集和算力本身,一些技巧证明不是大模型可训练的关键因素。
  • 正则化手段去处理过拟合,不是最关键的,最关键的是网络的架构设计,网络的架构好,就会让模型更容易训练
  • 首先要说自己实现了什么东西,比如在哪些地方超过了其它的模型和方法。然后,再说自己是怎么做的。
  • 论文前面的内容要高屋建瓴,细节放在第 3、4 章去写。
  • 论文的核心观点是:用 CNN 来做图像分类,然后经验是如何将 CNN 做的特别大。
    • 使用多 GPU,论文仲使用的显卡是 GTX 580 3GB, 两张。所以,该显卡在当时也不是很先进,而且要将模型切开,放在两张卡,所以,该论文的研发还是工作量很大 3
    • 使用一些技术来降低过拟合
    • 结果好只是一些方面,一些工程上的劳动也可能做出好结果,但是这意味着没有算法上的创新,学术主要看算法的创新
    • 使用 RGB 做成向量,进入模型,被称为 RAW 模式 4 。还有一种模式,是把图片提取特征,常见算法是 SIFT。一些研究方向,https://github.com/christiansafka/img2vec, https://scikit-image.org/docs/stable/auto_examples/features_detection/plot_sift.html
  • 这个项目 Alex 对比了 ILSVRC-2010 和 ILSVRC-2012 两个数据集的成绩。
  • 论文中,重点强调了使用 ReLU 作为激活函数,Hinton 在一次访谈中 5 ,坦陈挑选到 ReLU 花了十年的时间
  • 论文中的参考文章并不多,这个文章的写作团队很牛,作为一个创新的团队,没有必要研究前人的很多东西,因为前人的很多东西也是错误的,研究了很多以后自己反而被限制,那么灵感来源于哪里?灵感来源于对周围世界的观察和一些更为成熟的行业,比如人工智能领域内的很多发明来自于更成熟的通信行业6

  1. 自然界的宝库和秘密,就在我们眼前,需要我们多问问题。用好奇心探索,就像达芬奇,并没有学习他所在时代的前人精华太多,主要靠自学,从观察身边的事物开始。https://www.bilibili.com/video/BV1iG411K7ma/ ↩︎

  2. 主要是微积分、概率论、线性代数。 ↩︎

  3. 实现一篇高质量的论文,还是需要通过工程手段验证猜想,无论结果是证实还是证伪,都是有价值的,关键是猜想本身是一个好的猜想,有新意。首先是好的猜想,然后工程能力是必不可少的。如果有很好的猜想,却无法证实或证伪,这个就是玄学,玄学不是科学。 ↩︎

  4. 不做任何特征提取,直接将原始的图片、文本作为训练模型的输入,被称为 End to end 训练。 ↩︎

  5. Hinton 回顾与 Ilya 的初次见面和合作,https://www.bilibili.com/video/BV1xM4m1k7ZJ ↩︎

  6. 很多论文发布,只是作为一些经典论文的陪衬,因为它们的作者是通过一些经典论文,并研究其中的不足之处,然后发布的。真正的有价值的论文其实不多,这些论文的灵感是来自于作者的好奇心或者从别的行业汲取的宝贵经验。 ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/973385.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【科研绘图系列】R语言绘制小提琴图、散点图和韦恩图(violin scatter plot Venn)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍加载R包数据下载画图1画图2画图3画图4画图5画图6画图7参考介绍 【科研绘图系列】R语言绘制小提琴图、散点图和韦恩图(violin & scatter plot & Venn) 加载R包 library…

IMX6ULL的ALT0、ALT1、ALT2、ALT3、ALT4等是啥意思?

在IMX6ULL的手册IMX6ULLRM.pdf中,发现了题目中这些描述,相关截图如下: 那么红框中的ALT0、ALT1、ALT2、ALT3、ALT4等是啥意思呢? 在IMX6ULL及其他NXP(Freescale)芯片中,ALT0、ALT1、ALT2、ALT…

Android Http-server 本地 web 服务

时间:2025年2月16日 地点:深圳.前海湾 需求 我们都知道 webview 可加载 URI,他有自己的协议 scheme: content:// 标识数据由 Content Provider 管理file:// 本地文件 http:// 网络资源 特别的,如果你想直接…

DeepSeek 冲击(含本地化部署实践)

DeepSeek无疑是春节档最火爆的话题,上线不足一月,其全球累计下载量已达4000万,反超ChatGPT成为全球增长最快的AI应用,并且完全开源。那么究竟DeepSeek有什么魔力,能够让大家趋之若鹜,他又将怎样改变世界AI格…

神经网络八股(1)

1.什么是有监督学习,无监督学习 有监督学习是带有标签的,无监督学习是没有标签的,简单来说就是有监督学习的输入输出都是固定的,已知的,无监督学习输入是已知的,输出是不固定的,无监督学习是通…

DeepSeek 助力 Vue 开发:打造丝滑的瀑布流布局(Masonry Layout)

前言:哈喽,大家好,今天给大家分享一篇文章!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 Deep…

【分布式理论14】分布式数据库存储:分表分库、主从复制与数据扩容策略

文章目录 一、分表分库1. 数据分表的必要性与方式2. 数据分库原则与优势 二、主从复制1. 读写分离架构设计2. 数据复制方式3. MySQL实现主从复制4. MySQL主从复制实践与高可用方案 三、数据扩容 随着业务的不断发展和数据量的增长,传统的单机关系型数据库已经逐渐不…

从传统到轻量级5G:网络架构演变与优化路径

轻量级5G​​​​ 随着5G技术的不断发展,通信网络架构正经历着前所未有的变革。传统的5G核心网架构虽然在性能和容量方面表现出色,但在灵活性、部署效率以及成本控制方面却面临一些挑战。为了应对日益复杂的通信需求,轻量级5G核心网成为了一种…

搭建Kubernetes (K8s) 集群----Centos系统

前期准备 准备3台Linux虚拟机(CentOS系统),参考 https://carry.blog.csdn.net/article/details/144578009https://carry.blog.csdn.net/article/details/144578009搭建Docker环境,参考 https://carry.blog.csdn.net/article/de…

OpenSSL实验

文章目录 一、OpenSSL安装二、OpenSSL配置常见路径查找配置文件的方法示例**1. 配置文件结构****2. 主要段落及其作用****(1) 默认段(Default Section)****(2) OID段(OID Section)****(3) CA相关段(CA Section&#xf…

51单片机-按键

1、独立按键 1.1、按键介绍 轻触开关是一种电子开关,使用时,轻轻按开关按钮就可使开关接通,当松开手时,开关断开。 1.2、独立按键原理 按键在闭合和断开时,触点会存在抖动现象。P2\P3\P1都是准双向IO口,…

DeepSeek动画视频全攻略:从架构到本地部署

DeepSeek 本身并不直接生成动画视频,而是通过与一系列先进的 AI 工具和传统软件协作,完成动画视频的制作任务。这一独特的架构模式,使得 DeepSeek 在动画视频创作领域发挥着不可或缺的辅助作用。其核心流程主要包括脚本生成、画面设计、视频合成与后期处理这几个关键环节。 …

EasyRTC智能硬件:实时畅联、沉浸互动、消音护航

在当今智能硬件迅猛发展的时代,音视频通讯技术已成为设备与用户、设备与设备间不可或缺的沟通纽带。而EasyRTC,凭借其无可比拟的实时性能、卓越的互动感受以及强大的交互实力,正逐步演变为智能硬件领域的“超级动力”核心。特别是其倾力打造的…

[AI相关]Unity的C#代码如何简写

是一个某培训机构的飞行棋教学源码 不知道,是否有人想知道怎么可以简写 (这个问AI,DeepSeek也应该找不到答案的) 静态变量 属性引用 单例 注入 一些UnityEvent特性就不说了。。。 IL 注入 运算符号改写

ubuntu 执行 sudo apt-get update 报错

记录一下,遇到这个问题了,网络上看到的解决办法,亲测有效 执行sudo apt-get update ,却报以下错误,“SECURITY: URL redirect target contains control characters rejecting ” 经检查发现,/etc/apt/source.list 下的…

蓝桥杯学习大纲

(致酷德与热爱算法、编程的小伙伴们) 在查阅了相当多的资料后,发现没有那篇博客、文章很符合我们备战蓝桥杯的学习路径。所以,干脆自己整理一篇,欢迎大家补充! 一、蓝桥必备高频考点 我们以此为重点学习…

【插件】前端生成word 文件

文章目录 1、背景2、方式一:html-docx-js2.1 具体代码2.2 前端生成word文件的样式2.3 总结 3、方式二:pizzip docxtemplater3.1 具体代码3.2 前端生成word文件的样式3.3 总结 4、参考链接 1、背景 在实际开发中,业务需要,需要把数…

4. grafana(7.5.17)功能菜单简介

点击可以返回home页面 搜索Dashboard 新建按钮:用户创建Dashboard、文件夹。以及导入外部(社区)Dashboard 用于查看活管理Dashboard,包括home、Manage、playlists、snapshots功能 explore(探索)&#x…

QT之改变鼠标样式

QT改变鼠标图片 资源路径如下 代码实现 QPixmap customCursorPixmap(":/images/mouse.png");QCursor customCursor(customCursorPixmap);QWidget::setCursor(customCursor); // 可以设置为整个窗口或特定控件QWidget::setCursor(); // 设置为透明光标&#xff0c…

ctfshow web入门 web11-web24

web11 web12 进来浏览网站,底部有一串数字,根据提示可能有用,访问robots.txt,发现禁止访问/admin/,进去看看发现需要输入用户名和密码,刚想爆破就猜对了,用户名是admin,密码是页面下…