面了 5 家知名企业的NLP算法岗(大模型方向),被问麻了。。。。。

最近一位同学,给我分享了他面试 NLP 算法工程师(大模型方向)的经历与经验。直呼最近找工作太难了。。。。

今天我整理后分享给大家,希望对后续找工作的有所帮助。

这位同学为面试刷了 leetcode200-300 题左右,侧重刷中高频hard题,同时也准备了大量的面试问题。面的公司地点均在上海,总共5家。

一、字节跳动-抖音 nlp算法工程师

一面(1h):

1、自我介绍+聊项目经历;

2、算法题:手撕multi-head self-attention,使用tensorflow或torch框架(尽量按google源码的思路);

3、开方式问题:介绍deberta中的两个优化点,disentangled attention和enhanced mask decoder;

4、开方式问题:说出pre-norm和post-norm的区别;

5、基础问题:layer normalization和batch normalization的区别。

6、大模型实践场景有那些?ChatGLM、LlaMa、qwen 等大模型的区别?如何优化 Prompt ?

7、大模型微调的优化方法及区别?

8、是否熟悉大模型langchain 和 llama index 及区别?

9、当前大模型检索有什么问题?如何进行 RAG 优化的方法?

10、从0到1训练大模型的流程及方法及注意事项

二面(1h):

1、自我介绍+聊项目经历;

2、算法题:手撕transformer decoder部分的inference过程,重点看beam search的实现,使用tensorflow或torch框架;

3、开方式问题:如何解决含有象征、隐喻等修辞手法的文本分类问题。

4、大模型在NLP的落地案例及遇到的问题?

5、如果评估大模型的效果及安全性

三面(1h):

1、自我介绍+聊项目经历;

2、基础问题:介绍bert的原理、结构,以及bert中哪些结构(layer或block)的训练参数比较多;

3、基础问题:attention结构的神经网络与递归神经网络相比有什么优点(还问了一些比较基础的问题,貌似有点忘了);

4、业务问题:如何用一些业务指标衡量模型的效果;

5、算法题:(共三个小问题)

(1)针对某个表达式如5+64(只含有加减乘除),设计并使用一种数据结构能够对表达式进行求值(使用二叉树即可);(2)在(1)的基础上,倘若表达式中出现未知变量,如a+ab,改进(1)中的结果使其在知道未知变量具体赋值的时候能够返回表达式的结果(实现类似tensorflow中placeholder的机制);(3)在(2)的基础上,倘若已知loss function返回的结果,实现一下梯度的反向传播。

6、对那些开源大模型比较熟悉?如何看待大模型的前景与价值

hr面(0.5h):

自我介绍—》为什么想换工作—》薪资期望—》其他常规流程

二、拼多多-智能客服 nlp算法工程师

一面(1h):

1、自我介绍+聊项目经历;

2、基础问题:又问了一遍layer normalization和batch normalization的区别;

3、基础问题:bert模型采用mask的具体策略,以及为什么要这么设计;

4、开放式问题:常用的文本数据增强方法(全面完整的回答可以从语种层面,letter、subword、word和语序层面,利用mlm过程、利用wordnet近义词替代等角度);

5、开放式问题:模型蒸馏的具体实现过程,KL散度和交叉熵的联系与区别;

6、算法题:给定一个图的节点集合和边集合,找出图中一个有多少个连通子图(并查集或bfs)

7、AI 大模型LangChain开发框架是否用过,AGENT、MEM、向量知识库的细节

8、熟悉那些分布式训练框架,目前在用那些,能否详细说明?

9、是否有预训练、微调和部署经验,展开讲一下?

10、是否了解大模型在智能客服领域落地场景、质检、拓展问、机器人

二面(1h):

1、自我介绍+聊项目经历;

2、开放式问题:写出中文bert-base预训练模型所有的参数量,细分到每一个结构的参数量;

3、基础问题:attention结构中Q、K、V的含义及作用;

4、基础问题:bert结构中embedding部分具体是怎么样的(word embedding+position embedding+segment embedding);

5、基础问题:绝对位置和相对位置的区别(最好举例作答);

6、开放式问题:position embedding的实现方式有哪两种(functional position embedding,如transformer和华为的NEZHA;parametric position embedding,如bert);

7、基础问题:layer normalization中的两个可学习参数的作用;

8、算题题:已知二叉树的前序和中序遍历的前提下重构二叉树。

9、基于大模型和向量数据库构建企业级知识库平台的流程及细节说明

三面(0.5h):

1、自我介绍+聊项目经历;

2、场景题:基于项目中聊到的多轮对话改写模型,是否能够用另一种不同的方法实现;

3、场景题:在真实的客诉场景中,客户可能不会一次性把话说完整,比如某客户会先说“hi”,然后说“想问一下”,最后说“如果你们这边的产品有问题该怎么办”。如何设计客服机器人解决上述的问题(停顿检测);

4、算法题:将两个升序的数组合并,合并后的数组保持升序,设计时间复杂度尽可能低的算法。

hr面(0.5h):

自我介绍—》为什么想换工作—》薪资期望—》其他常规流程

三、bilibili 人工智能与大数据平台 nlp算法工程师

一面(1h):

1、自我介绍+聊项目经历;

2、基础问题:再问了一遍layer normalization和batch normalization的区别;

3、基础问题:transformer网络中一共有多少种不同的attention(3种);

4、开放式问题:bert及其变体中常用的mask方式及特点(dynamic mask,whole word mask,phrase mask, entity mask);

5、开放式问题:中文场景的nlu任务和英文场景有什么不同;

6、开放式问题:模型蒸馏的具体实现过程;

7、算法题:数组中连续子数组和的最大值。

8、大模型知道那些?原理、性能、差异的?目前有那些问题需要解决?

9、如果解决大模型的可控可信度不足、推理效率慢的问题

10、常用的模型微调方法、模型量化问题及分布式部署问题

二面(1h):

1、自我介绍+聊项目经历;

2、业务问题:如何用一些业务指标衡量模型的效果,如何使用一些非模型的方法解决内容的识别问题;

3、开放式问题:介绍一下是如何做语义相似度的(simcse,simbert,sentence bert等)

4、开放式问题:是否了解triple loss,以及它的功能是什么;

5、算题题:实现一个函数能够计算softmax和交叉熵;

6、基础问题:softmax函数在梯度反向传播过程中会出现梯度的钝化,实际过程中该如何解决。

7、熟悉的开发语言Pytorch 还是Tensorflow ?

8、Megatron-lm、Deepspeed 等是否熟悉?你熟悉哪一种?

9、模型并行、数据并行、ZERO是否用过?

三面(0.5h):

1、自我介绍+聊项目经历;

2、算法题:判断链表是否有环,并输出环的入口节点;

3、场景题:平时是否使用过b站,如何看待b站的弹幕文化。

hr面(0.5h):

自我介绍—》为什么想换工作—》薪资期望—》其他常规流程

四、太保金科 研究院 nlp算法研究员

一面(0.5h):

1、自我介绍+了解哪些nlp的前沿研究;

2、场景题:如何用gpt-3的prompt机制挖掘以新冠疫情为主题的稀疏文本以及如何在保险场景实现zero-shot;

3、场景题:在文本分类任务中,如果打乱文本中字或词的顺序,是否会对分类结果产生影响;

4、算法题:给定一个长度为n的初始数组nums[0, 1, 2, …, n-1],求出i != nums[i]对任意i都成立的排列组合总数(动态规划)。

5、GPT3、chagpt、T5、LLAMA、GLM 的区别?

6、模型小型化技术有那些?

7、使用大模型的落地场景?

二面(1h):

1、自我介绍+聊项目经历;

2、场景题:如何在一个3GB内存空间中部署一个深度学习模型;

3、开放式问题:说一下目前主流或前沿的nlp预训练模型(百度ERNIE3.0,华为NEZHA,openAI gpt-3,nvidia MegatronLM,macrosoft T5)及相关的加速方法(混合精度训练、Zero Redundancy Optimizer);

4、开放式问题:简单聊一下ERNIE1.0到3.0发展历程和gpt-1到gpt-3的发展历程;

5、开放式问题:说一下对多任务训练(multi task learning)和多领域训练(multi domain learning)的理解,最好举一个例子;

6、大模型是否有经验,请详细说明?

7、目前大模型落地有那些问题?你是如何解决的?

8、大模型目前RAG、chain 是否熟悉?

三面(0.5h):

1、笔试题:给定训练集和测试集,要求在24h内自己设计神经网络。要求在epoch=1和learning_rate=0.03的限制下,测试集评估的准召达到95%以上;

2、智力题:有5个相邻的山洞(一字排开),山洞里有一只兔子,兔子每天白天会移动到相邻的洞中,你是一个猎人,每天晚上可以查看一个洞。设计一个可以找到兔子的策略。

hr面(0.5h):

自我介绍—》为什么想换工作—》薪资期望—》其他常规流程

五、上海人工智能实验室 大规模预训练算法研究员

一面(1h):

1、自我介绍;

2、开放式问题:说一下目前主流或前沿的预训练模型,包括nlp(百度ERNIE3.0,华为NEZHA,openAI gpt-3,nvidia MegatronLM,macrosoft T5)和cv(我只知道CLIP)领域;

3、基础问题:说一下数据并行和模型并行的主要区别;

4、基础问题:混合精度训练的原理,有哪些优缺点,针对这些优缺点是如何改进的;

5、开放式问题:说一下DeepSpeed有哪些方面的突破;

6、算法题:N皇后;

7、算法题:用递归和迭代两种方式实现二叉树的层次遍历;

8、算法题:袋子中有5个白球和8个红球,现规定摸球规则:(1)第一次摸球无论红白,均拿出;(2)倘若这一次摸到球的颜色与上一次的相同,则将这一次摸到的球拿出;若不同,则将这一次摸到的球放回。求最后一个球是白球的概率(动态规划)。

这个岗位主要偏开发而非算法,和我自己的条件不匹配,一面后就没有后续了。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/874022.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

图的广度优先遍历与深度优先遍历(C语言)

这是结果 #include <stdio.h> #include <stdlib.h> #include <stdbool.h>#define _CRT_SECURE_NO_WARNINGS// 定义边表结点结构 typedef struct EdgeNode {int adjvex; // 邻接顶点域&#xff0c;存储该边所指向的顶点struct EdgeNode* next; // 指向下一条…

LLM 大模型产品经理学习指南:【2024 全新版】极致详细,一篇搞定!

前言 随着人工智能技术的蓬勃发展&#xff0c;尤其是大模型&#xff08;Large Model&#xff09;的强势兴起&#xff0c;越来越多的企业对这一领域愈发重视并加大投入。作为大模型产品经理&#xff0c;需具备一系列跨学科的知识与技能&#xff0c;方能有效地推动产品的开发、优…

六西格玛质量管理:让质量成为竞争的关键-优思学院

前言&#xff1a;六西格玛的传奇之路 提起质量管理&#xff0c;六西格玛无疑是绕不开的一个话题。从摩托罗拉到通用电气&#xff0c;从制造业到服务业&#xff0c;六西格玛质量管理的方法已经走遍全球&#xff0c;成为许多企业成功的关键。无论是提高产品质量、减少浪费&#…

DevC++编译及使用Opencv

1.依赖 需要如下依赖&#xff1a; DevC11Opencv4.10.0CMake.exe 整个安装过程参考下面的文章&#xff1a;https://blog.csdn.net/weixin_41673576/article/details/108519841 这里总结一下遇到的问题。 2.问题 2.1 DevC安装路径 一定不要有空格&#xff01;&#xff01;否则…

kubectl的安装使用

1. Windows下载kubectl 2.将kucectl的所在目录添加到PATH环境变量下 3.运行 kubectl version --client 命令来测试kubectl是否正确安装并显示其版本信息。这个命令会显示kubectl客户端的版本信息&#xff0c;如果一切正常&#xff0c;这将确认kubectl已经成功安装在你的Windo…

Git 学习与使用

0 认识⼯作区、暂存区、版本库 ⼯作区&#xff1a;是在电脑上你要写代码或⽂件的⽬录。 暂存区&#xff1a;英⽂叫stage或index。⼀般存放在.git ⽬录下的index⽂件&#xff08;.git/index&#xff09;中&#xff0c;我们 把暂存区有时也叫作索引&#xff08;index&#xff09;…

UDS 诊断 - ReadDTCInformation(读取 DTC 信息)(0x19)服务(2) - 请求消息

UDS 诊断服务系列文章目录 诊断和通信管理功能单元 UDS 诊断 - DiagnosticSessionControl&#xff08;诊断会话控制&#xff09;&#xff08;0x10&#xff09;服务 UDS 诊断 - ECUReset&#xff08;ECU重置&#xff09;&#xff08;0x11&#xff09;服务 UDS 诊断 - SecurityA…

怎么样处理浮毛快捷又高效?霍尼韦尔、希喂、米家宠物空气净化器实测对比

掉毛多&#xff1f;掉毛快&#xff1f;猫毛满天飞对身体有危害吗&#xff1f;多猫家庭经验分享篇&#xff1a; 一个很有趣的现象&#xff0c;很多人在养猫、养狗后耐心都变得更好了。养狗每天得遛&#xff0c;养猫出门前得除毛&#xff0c;日复一日的重复磨练了极好的耐心。我家…

SprinBoot+Vue学生信息管理系统的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍&#xff1a;CSDN认证博客专家&#xff0c;CSDN平台Java领域优质…

CSP-CCF★★201809-2买菜★★

目录 一、问题描述 二、解答&#xff1a; 三、总结 一、问题描述 问题描述 小H和小W来到了一条街上&#xff0c;两人分开买菜&#xff0c;他们买菜的过程可以描述为&#xff0c;去店里买一些菜然后去旁边的一个广场把菜装上车&#xff0c;两人都要买n种菜&#xff0c;所以也…

C 408—《数据结构》算法题基础篇—链表(上)

目录 Δ前言 一、链表中特定值结点的删除 0.题目&#xff1a; 1.算法设计思想&#xff1a; 2.C语言描述&#xff1a; 3.算法的时间和空间复杂度&#xff1a; 二、链表链表最小值结点的删除 0.题目 : 1.算法设计思想 : 2.C语言描述 : 3.算法的时间和空间复杂度 : 三、链…

【前端】探索webpack3项目build速度优化, 优化个p

文章目录 背景uglifyjs-webpack-pluginwebpack3 压缩混淆js 优化踩坑。结论 背景 webpack3 babel7 uglifyjs-webpack-plugin的项目&#xff0c;build起来是什么体验。 大抵是写了两个月后&#xff0c;发现build时间从120s激增到400s。而这400秒中&#xff0c;有50多秒是Ugli…

如何看待IBM中国研发部裁员?三个方向快速解析

如何看待IBM中国研发部裁员&#xff1f; 近日&#xff0c;有媒体从IBM中国方面确认&#xff0c;IBM将彻底关闭中国研发部门&#xff0c;涉及员工数量超过1000人。 3分钟裁员上千人&#xff01; IBM中国宣布撤出在华两大研发中心&#xff0c;引发了IT行业对于跨国公司在华研发战…

ubuntu16.04下qt5.7.1添加对openssl的支持

文章目录 前言一、编译安装openssl二、编译qt5.7.1三、配置qtcreator开发环境四、demo 前言 最近工作中要求客户端和服务端通过ssl加密通信,其中客户端是qt编程,服务端是linux编程.我的开发环境是ubuntu16.04;运行环境是debian9.13,是基于gnu的linux操作系统,64位arm架构. 一…

C++_17_友元

友元 > 友元 友元 是单向的 甲和乙 甲说 他是乙朋友 乙有可能不承认 所以 是单向的 > 只要是 友元 就可以访问他私有的东西 所以 友元会破坏 封装性作用&#xff1a;可以访问友元 的私有成员 特点&#xff1a; 单项性不能被传递不能被继承 关键字&#xff1a…

OpenCV结构分析与形状描述符(13)拟合椭圆函数fitEllipseDirect()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 围绕一组2D点拟合一个椭圆。 该函数计算出一个椭圆&#xff0c;该椭圆拟合一组2D点。它返回一个内切于该椭圆的旋转矩形。使用了由[91]提出的直接…

Ubuntu22.04之禁止内核自动更新(二百六十八)

简介&#xff1a; CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布&#xff1a;《Android系统多媒体进阶实战》&#x1f680; 优质专栏&#xff1a; Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a; 多媒体系统工程师系列【…

第二阶段(c语言)

内存&#xff1a;一块临时存储区域 虚拟内存 vm 物理内存 pm 内存单元&#xff1a;一个内存单元的大小是1byte 内存块&#xff1a;连续多个内存单元 内存地址&#xff1a;相当于是教室的门牌号 内存中的值&#xff1a;相当于是教室里面所存放的东西 int num 0&#xff1b; …

Prometheus + Grafana + nVisual 实现运维监控全面可视化

Prometheus主要实现采集、存储、查询设备数据指标、告警等功能&#xff1b;Grafana通过Prometheus的API以仪表板的形展示数据&#xff0c;同时在线提供了大量监测数据展示模版。然而&#xff0c;实际运维中我们不仅需要实时监测数据&#xff0c;还需要了解设备的物理位置、拓扑…

Axure科技感设计案例教程:从按钮到大屏的全面探索

Axure RP&#xff0c;作为一款强大的原型设计工具&#xff0c;不仅能够帮助设计师快速构建产品界面&#xff0c;还能通过其丰富的交互功能实现高度逼真的科技感效果。以下是一个简要的教程&#xff0c;介绍如何使用Axure RP设计科技感按钮、图标、统计、图表以及大屏界面。 1.…