劝退还是坚守?计算机视觉行业综述

劝退还是坚守?计算机视觉行业综述

1 从炙手可热到充满争议

计算机视觉(Computer Vision,简写为CV)是一门研究如何让计算机从图像或图像序列中获取信息并
理解其信息的学科,其主要目的在于从图像或图像序列中提取对世界的描述。从工程学的角度来看,它
研究如何使用算法模拟人类的视觉系统,从而完成人类的通过视觉可以完成的一系列工作,其中最广为
人知的应用就是“人脸识别”。
网上照片,如侵权请联系删除

作为深度学习相关的、近二十年内落地发展最快的领域之一,计算机视觉让无数技术人魂牵梦绕又魂飞
魄散。人们追逐计算机视觉主要有两个原因:第一,这个领域非常有趣并且具有改变世界的潜力。人脑
所获取的信息有80%都依赖视觉形成,成功模拟人类视觉系统所带来的经济与社会效益是不可估量的。
从科学精神上来说,计算机视觉值得科研人员付出一生去研究,进入这个领域,你将有机会拥有自己的
事业(career),而不只是一份工作(job)。第二,在21世纪初,计算机视觉领域取得了飞速的发展、
并拥有了巨量实际落地场景,这意味着这个领域有产业需求、有学术潜力,并且最重要的是,有很高的
经济价值。这些因素让计算机视觉成为资本市场上的香饽饽,行业人才价格也水涨船高,计算机视觉成
为了许多人梦寐以求的事业发展方向。
但很快的,人们就对计算机视觉敬而远之了。且不说深度学习本身就是一门有一定门槛的学科,在2019
年秋季,算法岗招聘还出现了“诸神黄昏”之景,无数手握顶会论文的大佬们神仙打架,争夺有限的CV岗
位,几乎形成了完全的卖方市场。从那之后,人们相信计算机视觉领域内卷严重、学术研究停滞,工业
落地场景虽多但成本巨大,看似光明灿烂,其实性价比不高。一时之间,竟形成了从计算机视觉“大逃
亡”的景象,众多怀抱AI梦想的毕业生都转向开发岗,放弃了计算机视觉、甚至完全放弃了AI这条路。
从炙手可热到充满争议,计算机视觉只经历了短短几年的时间,这与全球AI风潮的兴衰、以及人们高度
看好计算机视觉领域有很大的关系,但更多还是视觉领域门槛低、上限高、学习曲线陡峭的学术特点导
致的。

2 门槛低,上限高,学习曲线陡峭

深度学习是一门有门槛的技术,只要稍有了解“算法”、“人工智能”这些概念的人,都不敢轻易说深度学
习、尤其是计算机视觉门槛低。但在视觉这个行业中,比起达到“熟悉”或“精通”的水平,视觉入门的确是
太容易了——首先,人人都知道计算机视觉的核心是卷积神经网络CNN,于是先学CNN就对了,通常一
个优秀的老师只需要30分钟的时间就能够让人们对卷积神经网络的工作流程产生个大概的印象,剩下的
就是在github甚至CSDN上找一段代码,百度一下、修补几天、把代码跑通,就算是完成了人生第一个
“视觉系神经网络”。对于更困难的模型,采用调包的方式,也能轻易获得结果。少数人会找几个图像识
别的例子来完成自己的学习,但大部分人都只停留在跑通(别人的)代码,就转向了下一个领域,不可
谓不容易。

但这样学习,距离成为“计算机视觉人才”还有天渊之隔。许多人在完成经典模型的学习之后,就傻了
眼,会发现“无从下手、不知该从哪里继续深入”,因为这个领域里的经典模型就那几个,似乎已经没有
需要学习的内容了(学算法,除了学模型,还能学什么呢?)。但望着招聘条件中赤裸裸的“顶会paper”
的要求,根本想象不出论文应该从哪里出来,只能从“哪个领域好发paper”这个角度去入手。此时,你就
是到了计算机视觉进阶的瓶颈处,大神在大气层,你在地下十八层,你却看不出你们之间的差异从何而
来。即便你千辛万苦找到了你们之间的差异,你会发现你根本无法直接从简单的CNN架构跨入“读文献、
写文献、看公式就能复现”的神之领域。90%以上的学习者都无法跨越这条陡峭的学习曲线继续向前,说
计算机视觉要求太高、内卷严重,也就不奇怪了。
为什么视觉领域会有这样的状况呢?有两个根本原因:

其一、计算机视觉所覆盖的领域远远超出CNN本身,卷积只是冰山一角,而大部分人是在不了解这个事实的前提下投机到计算机视觉的方向

其二、以卷积神经网络为核心的“深度视觉”是一个过于年轻的领域,这个领域最稀缺的是开拓者,投机的人成不了开拓者

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/4975.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于51单片机AT89C51的小型音乐喷泉控制系统设计

wx供重浩:创享日记 对话框发送:单片机小喷泉 获取完整无水印论文报告(内含电路原理图和程序) 根据目前音乐喷泉的发展现状,介绍了一个以AT89C51单片机为核心的小型音乐喷泉控制系统。给出了一个简洁的单片机控制电路&a…

Java_Spring:9. 基于 XML 的 AOP 配置

目录 1 环境搭建 1.1 第一步:准备必要的代码 1.2 第二步:拷贝必备的 jar 包到工程的 lib 目录 1.3 第三步:创建 spring 的配置文件并导入约束 1.4 第四步:配置 spring 的 ioc 1.5 第五步:抽取公共代码制作成通知 …

数据结构与算法笔记--数据结构与算法基本知识

目录 1--数据结构 2--算法 3--算法分析 4--实例1:普通算法与秦九韶算法的运算效率比较 5--实例2:最大子列和问题 5-1--暴力求解法 5-2--分而治之 5-3--动态规划 5-4--完整代码 1--数据结构 定义:所有数据元素以及数据元素之间的关系…

JS手写Promise(详细过程)

PS:JS手写Promise方法的整理在下一篇文章 手写Promise的API(resolve,reject,then,catch,finally,all)_Eric加油学!的博客-CSDN博客 1、基础版Promise 首先,通过一个简单的Promise例子回顾其使用 const promise new Promise((resolve, rej…

为什么诚信是项目管理的关键部分?

由于有许多需要指导的活动部件和风险,管理一个新项目可能是一项具有挑战性的工作。在一些对质量有着严格要求的行业,项目结构、设定目标、跟踪状态、风险管理和资源管理等项目管理原则尤为重要,而领导这项工作的是诚信。那么,究竟…

IP 归属用 Ip2region 就够了

文章目录Ip2region 简介是什么特性支持的编程语言案例实操依赖获取IP输入流转化解析IP测试抖音、微博、小红书等各平台相继上线" 网络用户IP地址显示功能", 境外显示 国家, 境内显示到 省市,且该功能无法关闭,IP地址为强…

【新2023Q2模拟题JAVA】华为OD机试 - 分苹果

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试,独家整理 已参加机试人员的实战技巧本篇题解:分苹果 题目 AB两个人把苹果…

第16章_变量、流程控制与游标

第16章_变量、流程控制与游标 🏠个人主页:shark-Gao 🧑个人简介:大家好,我是shark-Gao,一个想要与大家共同进步的男人😉😉 🎉目前状况:23届毕业生&#xf…

ClickHouse学习笔记(三):MergeTree 原理解析

文章目录1、简介2、MergeTree 创建方式与存储结构2.1、MergeTree 的创建方式2.2、MergeTree 的存储结构3、MergeTree 数据分区3.1、分区目录的命名规则3.2、分区目录合并过程4、一级索引4.1、索引粒度4.2、索引生成4.3、索引查询5、二级索引6、数据存储7、数据标记8、协同总结8…

BootStrap4:栅格系统

1、container容器 container:固定宽度的容器container-fluid:响应式容器 2、栅格选项 Bootstrap4 总共有五个栅格等级,每个响应式分界点隔出一个等级 Ps:.row上带有margin-left: -15px;margin-right: -15px;属性,你…

【22年蓝桥杯】十三届蓝桥杯真题JavaB组解析+代码(带你复习知识点)(一)

试题 A: 星期计算 【填空题】 答案:7 解析:直接对所给数进行取余,然后直接再加6(注意:不能直接让20^226再对7进行取余操作,这是不对的,这个6可以看成已经取余过了。) 直接取余的话可…

Linux系统安装部署及配置Grafana

TOC 用于 UI 展示 wget https://dl.grafana.com/oss/release/grafana-8.0.3-1.x86_64.rpm1 安装 grafana 1.1 下载安装 wget https://dl.grafana.com/oss/release/grafana-8.0.3-1.x86_64.rpmsudo yum install grafana-8.0.3-1.x86_64.rpm1.2 启动&状态查看 sudo syst…

PHP初级教程------------------(3)

目录 文件包含 文件包含的作用 文件包含四种形式 文件加载原理 Include和require区别 文件加载路径 文件嵌套包含 函数 函数的基本概念 函数定义语法 函数命名规范 参数详解 形参 实参 默认值 引用传递 函数体 函数返回值 ​作用域 静态变量 可变函数 匿名函数 闭包 伪类型 文件…

作为一个数学专业的学生,我是怎么看待编程的?

1.概况 博主的专业是数学与应用数学,简称应数。虽然后面跟了个应用数学,但是这个专业应该是本科阶段最接近数学的专业了。我认为这个专业使我具有如下的几个优势: 数学的学习使我具有较强的思维能力。编程本质上就是通过写代码的方式来解决…

大数据Flink进阶(八):Apache Flink架构介绍

Apache Flink架构介绍 一、Flink组件栈 在Flink的整个软件架构体系中,同样遵循这分层的架构设计理念,在降低系统耦合度的同时,也为上层用户构建Flink应用提供了丰富且友好的接口。

山东大学机器学习大作业

数据处理与可视化这里是DLRM模型数据集预处理模块:args.ln_emb ln_emb.tolist() m_spa args.arch_sparse_feature_sizeln_emb np.asarray(ln_emb)num_fea ln_emb.size 1 # num sparse num dense featuresm_den_out ln_bot[ln_bot.size - 1]Sparse fea 26, D…

Java设计模式-3、单例模式

单例模式 单例模式属于创建型模式,⼀个单例类在任何情况下都只存在⼀个实例, 构造⽅法必须是私有的、由⾃⼰创建⼀个静态变量存储实例,对外提供⼀ 个静态公有⽅法获取实例。 优点是内存中只有⼀个实例,减少了开销,尤…

代码随想录|day26|回溯算法part03● 39. 组合总和● 40.组合总和II● 131.分割回文串

今天的练习基本就是回溯法组合问题,这一节只要看labuladong即可。 组合问题: 39. 组合总和---------------------形式三,元素无重可复选 链接:代码随想录 一次对,同样在进入下次循环时,注意startindex是从j…

欧莱雅校招负责人张泽宇:拥抱Z世代,探索新玩法

作为校招HR,你在雇主品牌创新实践的路上做过什么尝试? 2020年,欧莱雅正式推出了全新的雇主品牌价值主张 —— 敢为敢超越,就是欧莱雅(Freedom to go beyond, thats the beauty of L’ORAL),鼓励…

使用ChatGPT进行AI对话

1.ChatGPT简介 ChatGPT是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力&#xff0c…