国内20家公司大模型岗位面试经验汇总

面试情况:

投过的公司:淘天,字节,蚂蚁,商汤,美团,夸克,腾讯,minimax,零一万物,阿里控股,潞晨科技,阿里巴巴国际,网易实验室,Momenta。

Offer:淘天,字节AML,商汤,蚂蚁,美团,夸克,腾讯混元,天翼云。

面经:

淘天【offer】:

部门:未来生活实验室。

介绍:

淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。

面经:

一面:

  • 如何训练ocr任务

  • 实验的setting,

  • ocr任务影响如何

  • 高分辨率训练,再在小分辨率上,会不会崩掉

  • 输出bbox有没有好的方式

HR面:

  • 基本信息确认:

  • 考研进入电子科技大,为什么

  • 为什么进入了诺亚

  • 代表性的工作

  • 如何解决问题的,国内在做语言大模型的多一些。

  • 国内在做多模态大模型的

  • 如何评测,评估这些大模型的。如何看待刷榜的问题。

  • 你们的衡量指标

面试体验:

面试体验很好。HR也没有那么咄咄逼人。阿里味不是特别明显。最终权衡也选择来了淘天,有兴趣来我们这边的欢迎投递简历,卡很足(****张)。

字节AML【offer】:

部门:AML火山方舟大模型

介绍:

淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。

预备面经:

猎头也提供了一些其他候选人的面经, 整理如下:

  • 设计一个Hash表

  • 蓄水池问题

  • 从超大文本文件中随机行采样

  • 二叉搜索树-去掉超出[m, n]范围内的节点

  • 计算交叉熵

  • 计算IOU

一面:

  • 多模态你们的流程

  • 你们的OCR的结构

  • layernorm的区别

二面:

  • 什么时间开始做多模态模型

  • 目前在文档

  • Token长度太大。高分辨率如何解决。

  • patch能不能变得

  • VQGAN

  • GPT4V的结构形式。

  • LLM decoder

  • MagViT

  • LLM的基础知识需要尽快补上

三面:

  • 自我介绍

  • 多模态大模型用哪个模型

  • Transformer比较熟悉

  • python实现self attention和Transformer

面试体验:

字节一如既往的注重coding,基本每一面两道题,自己能拿到offer也算是运气吧。一面的面试体验很差,可以说是毫无面试经验的面试官。

商汤【offer】:

一面:

  • 简单的自我介绍

  • 关于高分辨率的解决办法

  • OCR是如何去做的,有没有grounding,Referring。

  • GPT4V 位置,检测明显的问题。

  • 你们是如何解决位置信息的。

  • 新的模态,进来。如何去拼接过来。

  • 新来一批数据,如何训练。

  • tree1是否是tree2的子树。

二面:

  • AGI缺不了视觉。

  • 工业场景,人的检测,奇怪的零件,机器的检测。检测的结果,需要理解人的行为。理解和context的关系。人和环境的关系。借助多模态来解决。

  • 自驾,感知端,到决策端,感知不需要全面的感知,着重额感知需要。

  • 假新闻,图是真的。caption场景。

  • OCR,街景的OCR,文档,网页截图等是不同的,这些场景混在一起。会有影响吗。

  • OCR的方案,一般是先出检测框,再出文本。不规则的文本,如何解决。

  • 多模态大模型的OCR。

  • Qwen-VL的文本检测形似,是否合理。

  • 模型本身的三种能力:

* 自己的能力,认识什么。

* LISA:借助decoder来做,用新的prompt来实现分割。

* 外挂RAG等。

  • 判断左右括号(),等组成的字符串是否是合法的。

二面结束,问题不大。

三面:

  • Leader面,聊了一些有的没的

面试体验:

面试过程很专业,毕竟是商汤,算法技术是国内领先的,奈何没产品,而且薪资包也没有诚意。

蚂蚁风控大模型【offer】:

一面:

  • 自我介绍

  • 介绍Focus-DETR,有没有在业务中应用。

二面:

  • 介绍

  • 目前在做的事情

  • 下游的任务,文档场景,再做一个什么任务。

  • ocr数据是如何生成的。

  • 效果如何。

  • 如何解决幻觉的问题。

HR面。

  • 具体的工作内容,印象

  • 安全内容,tob的内容审核。竞对。

  • 个人介绍。

  • 上海海思,为什么跳槽

  • 算法支撑

MiniMax:【挂】

一面:

  • 空间感知能力是如何解决的

  • 不同token长度是否有做balance的方式

  • 很多有价值的问题。

  • python实现标题 MLP Regressor 题目描述 题目描述与要求:实现一个MLP regressor 的完整训练过程,包括:forward , backward , SGD更新参数;验证backward梯度正确性;构建数据,验证端到端正确性 (收敛&泛化);(optional) 参考你过往的实验经验,尽可能让功能更完善;不使用第三方库中已实现好的自动求导方法;P.S. 实现方法不限,但由于在线IDE运行环境不稳定,推荐使用numpy。

PS

面试官对算法底层了解比较深入,比较考验代码能力,不是字节那种。

零一万物【挂】:

一面:

  • 多模态的情况。

  • document的难度。

  • 手写 self attention

二面:

  • 自我介绍

  • 传统的OCR模型和多模态大模型的区别

  • 带不带OCR,多模态文档智能差多少。

  • 未来OCR模型是否会被大模型吃掉。OCR大模型有什么是做不了的。

  • 在哪些模型上做过一些预训练。

  • 多模态未来怎么做。

  • EVA的有趣的现象。没有出现涌现的现象。

  • 后面的工作主要集中在哪里。

  • 怎么训练比较好,gemini那种形式,llm那种形式。

PS:问了很多开放性的问题,给的回复是业务积累不够,hhhh。

美团【offer】:

一面:

  1. 文档大模型是一个独立的模型,会整合到一个大模型还是分离式的。

  2. 不考虑通用场景的。

  3. 目前用的多大的模型。

  4. 是一个什么结构。对结构的一些了解。

  5. flamingo或者blip2的结构上的对比。

  6. 足够资源的情况下,哪个结构是最优的。

  7. 分辨率是如何解决的。文档的分辨率比较高。

  8. QA对匮乏如何解决的。

  9. ocr的性能目前是低于多模态大模型。

  10. 如何解决bbox感知能力差的问题。

  11. 充足的算力。数据如何获取。如何有效的清洗。

  12. fuyu这种结构有什么优化的空间。

二面:

  1. OCR文档大模型

  2. Instruction tuning的决定性因素,哪些Instruction tuning策略效果更好。如何评估复杂度的性能。

  3. 如何保证数据集的多样性和复杂度。

  4. 分层的Instruction tuning。

  5. 数量的影响。数量和质量。

  6. 不同类型数据的影响。对下游任务的影响。自动化的数据配比。自动化的指标去做类似的事情。

  7. 专门优化的指标不再是一个好的指标。

  8. 使用其他的指标来引导模型的优化,而不是使用下游的指标。LLM使用的loss,作为指标。而不是benchmark的分数。

  9. 合理的评估指标是什么。openAI的压缩理论,trainnig loss代表优化目标。

  10. AGI的几个阶段,deepmind发表。

三面:

  1. 各种问题

四面:

  1. 介绍自己。

  2. 有一个多模态大模型,具备一些很多baseline的效果,基础的CV能力。可能效果都不是特别好。不如专精的大模型。OCR为例。目标得到一个类似GPT4V的模型,整理提高模型的效果。第二个,全流程,强化ocr能力。已有的多模态大模型。

  3. 文档场景。

阿里控股【PASS】

一面:

这里没什么面经,整体面试体验很差。不考虑继续往下面。

  • 人非常高傲,傲慢,问问题,满脸的嫌弃

  • 感觉别人都不行

  • 觉得自己很强

  • 文生图

  • 文生图的畸形,检测的方式。

潞晨科技【PASS】

一面:

  • 手写self-attention

emmm,但凡面试官是NLP的,面试体验都不太好。如果NLP背景的面试官,面试会比较困难。

夸克【offer】

一面:

项目

做题

二面:

  • 高分辨率的解决方案

  • 重叠文本框。采用什么方案来解决。

  • 端到端的OCR是怎么做的。

三面:

  • 介绍Focus-DETR。

  • 介绍端到端的OCR。

  • 介绍多模态大模型。

  • 小语种数据集采购是为什么。检测数据多了,识别数据少了。

介绍业务规划,偏传统业务,不是大模型方向。

四面:

大佬面,出了一个概率题。

HR面:

为什么跳槽。

职业规划。

为什么有这个绩效和各种奖项。

腾讯-混元大模型【offer】:

一面:

  1. 简单描述简历,在做的东西

  2. 图像细节提取有什么办法

  3. 目前的进展是什么样的,项目进展到什么情况

  4. 表格这种数据如何解决,如何对表格这种做有效的信息抽取。

  5. 目前有多少的数据量

二面:

  • OCR算法

  • 项目

  • 介绍文本检测的一些问题如何解决

  • MAE如何优化,什么鬼问题

三面

纯聊天,没有太多技术问题。

  • 多模态大模型,TEG,数据平台事业部。混元大模型。机器学习平台。

阿里巴巴国际部【中止】:

一面:

题目,旋转图像 Alpha度,

介绍项目

介绍Focus-Detr。

二面:

简单询问项目,很快结束。

PS:不靠谱,很久没消息。没有后续的任何回复。这种最恶心了,建议大家不要再投。

网易实验室【PASS】:

一面:

  • 自我介绍

  • 剪枝的工作,Focos-DETR是如何剪枝的。

  • Transformer相比CNN,相比RNN的优势。

  • 训练推理,增加吞吐量。

  • 推理加速。预训练模型的部署推理,优化。

做推理加速的不合适。

Momenta【PASS】:

一面:

  1. 手写NMS

  2. 介绍DETR

  3. 介绍Focus-DETR

  4. 介绍position Embedding

  5. 介绍DETR里面query的含义

PS:Momenta属于给钱多,但是比较累的。以后不太想做自动驾驶了,所以pass。不再考虑。

蚂蚁【大模型-codefuse】【HR面挂】

一面:

简单聊项目

二面:

  • 业务题,如何解决多页文档的问题

  • 业务题,现在 ui 多模态大模型,ocr 如何引入,目前 ocr 存在很多问题

  • leetcode 题目,字符串转数字

  • leetcode 题目,最大子数组和

  • 多模态大模型的基础知识

三面:

  • 个人介绍

  • 部门规模

  • 论文的情况

  • 换过部门

  • 海思做的内容

  • OCR成熟度很高

面试体验:

面试官都很专业,问了很多问题,感觉很强。在HR面上吃了亏,很多问题没有回答好,吸取了经验,很多问题调整了回答的方式。也反思了自己在过往工作中存在的问题,面对大公司建议HR面认真准备,看看网上的一些经验,阿里的HR有一票否决权。

HR面注意点:

1、跳槽动机:如果是因为晋升不上去看机会,建议这么说:内部机会少,太稳定,想看更有发展的机会,别直接说晋升不上去才看机会,⚠切勿说和leader处不来或者说目前leader坏话。

2、关于薪资:可以回答看企业安排,或者回答一个区间,保底多少,期望多少,加一句薪资可谈,留足谈判空间,如果企业给的薪资不太满意,⚠别直接拒绝,就说考虑一下,我这边去谈,最后面试结束时,记得感谢下面试官的时间。

3,关于加班:大厂都大差不差,HR问就是试探⚠切勿说接受不了。

一些参考资料:

  1. 国内大模型公司,粗略面经+感受+一些包裹

  2. 淘天集团大模型算法工程师面试经验贴

  3. 大模型面试八股

  4. 大模型八股答案(一)——基础知识

社招关于大模型的知识点问到的也是一些常识知识,没有特别难得,更多的还是项目为主。面试其他公司的时候基本没有刷题,因为工作期间面试的,没有太多时间刷题, 只能周末时间。为了准备字节还是刷了一些题,大概60多道,如果是字节的话,还是好好准备刷题, 我有朋友甚至遇到了好几道hard。关于刷题,推荐labuladong的刷题笔记。应该算是最精良了,看这个不用看其他的了。

选择offer过程中也是各种权衡,考虑很多因素,也咨询了很多朋友,面临offer选择困难的朋友也可以咨询我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/517835.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

吴恩达2022机器学习专项课程(一) 5.2 向量化(1) 5.3 向量化(2)

问题预览/关键词 什么是向量化?向量化的好处是?如何向量化多元线性回归函数的参数?如何在Python中向量化参数?计算机底层是如何计算向量化的?向量化示例 笔记 1.向量化 一种在数学和计算中广泛使用的概念&#xff…

ROS 2边学边练(13)-- 创建一个功能包

前言 功能包是啥 简单理解,功能包就是一个文件夹,一个具备一定功能的文件夹,一个有组织有结构的文件夹,一个能方便分享给其他人使用的文件夹,比如我们的小海龟功能包,它就是一个文件夹,名字叫t…

番外篇 | 利用YOLOv5实现视频划定区域目标统计计数

前言:Hello大家好,我是小哥谈。视频划定区域目标统计计数是指在一个给定的视频中,通过划定一个特定的区域,对该区域内的目标进行统计计数的过程。这个过程通常涉及到目标检测和跟踪的技术。本篇文章就以YOLOv5算法为基础,实现视频划定区域目标统计计数!~🌈 目录…

3.6k star, 免费开源跨平台的数据库管理工具 dbgate

3.6k star, 免费开源跨平台的数据库管理工具 dbgate 分类 开源分享 项目名: dbgate -- 免费开源跨平台的数据库管理工具 Github 开源地址: GitHub - dbgate/dbgate: Database manager for MySQL, PostgreSQL, SQL Server, MongoDB, SQLite and others. Runs under…

汇编语言作业(二)

目录 一、实验目的 二、实验内容 三、实验步骤以及结果 四、实验结果与分析 五、实验总结 一、实验目的 1、巩固debug命令 2、使用 debug 来进行寄存器、内存中内容的查看和修改 3、使用 debug 来进行程序的调试 二、实验内容 上图是一段指令代码 ,机器码和汇编…

JS详解-手写Promise!!!

前言: 针对js的深入理解,作者学习并撰写以下文章,由于理解认知有限难免存在偏差,请大家指正!所有定义来自mdn。 Promise介绍: 对象表示异步操作最终的完成(或失败)以及其结果值. 描…

vue3表单参数校验+正则表达式

这里我们要实现在form表单中对表单项添加参数校验。 校验要求 我们的表单中有用户名、密码、电话号码、邮箱这四个项。 我们设置用户名为3到20位的非空字符 密码为3到25位非空字符 电话号码就用目前用的电话号码正则表达式,要求手机号码以 1 开头,第…

Unity框架,ET框架8.1版本的打包流程记录

目录 打包代码前置1.必须要安装Visusal Studio 2022的组件,如下图,必须都要进行安装,不然会在代码重构的时候报错,丢失SDK。Rider的版本必须2023及以上 步骤一、使用Rider编辑器打开项目后进行重构项目步骤二、使用HybirdCLR生成A…

UTONMOS:AI+Web3+元宇宙数字化“三位一体”将触发经济新爆点

人工智能、元宇宙、Web3,被称为数字化的“三位一体”,如何看待这三大技术所扮演的角色? 3月24日,2024全球开发者先锋大会“数字化的三位一体——人工智能、元宇宙、Web3.0”论坛在上海漕河泾开发区举行,首次提出&…

设计模式——原型模式05

原型模式核心复制,每次new出来的对象完全不一样,实现对象之间的隔离。 学习前最好先掌握jAVA值传递和深浅拷贝 设计模式,一定要敲代码理解 浅拷贝 克隆出对象,其中两者的引用类型属性是同一个对象。 对象信息 /*** author ggb…

Ps:合并到 HDR Pro

Ps菜单:文件/自动/合并到 HDR Pro Automate/Merge to HDR Pro 合并到 HDR Pro Merge to HDR Pro命令可以将同一场景的具有不同曝光度的多个图像合并起来,从而捕获单个 HDR 图像中的全部动态范围。 合并到 HDR Pro 命令分两步进行。 首先,需要…

Kubernetes(k8s):精通 Pod 操作的关键命令

Kubernetes(k8s):精通 Pod 操作的关键命令 1、查看 Pod 列表2、 查看 Pod 的详细信息3、创建 Pod4、删除 Pod5、获取 Pod 日志6、进入 Pod 执行命令7、暂停和启动 Pod8、改变 Pod 副本数量9、查看当前部署中使用的镜像版本10、滚动更新 Pod11…

车载电子电器架构 —— 软件下载

车载电子电器架构 —— 软件下载 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证明自己,无…

matlab中角度-弧度转化

在 MATLAB 中进行角度和弧度之间的转换可以使用内置的函数: 1. 将角度转换为弧度: matlab rad deg * pi / 180; 这里 deg 是你想要转换的角度值,pi 是 MATLAB 内置的圆周率常量。 2. 将弧度转换为角度: matlab…

端口映射如何测试?

端口映射是一项网络技术,用于将外部网络中的数据流量映射到内部网络中的特定端口或设备上。通过端口映射,可以实现远程访问内部网络中的设备或应用程序,使其能够在外部网络中得到访问。本文将介绍端口映射测试及其应用场景。 2. 【天联】组网…

MIT6.828实验:Xv6 and Unix utilities

2023MIT6.828 lab-1 官方地址 一、sleep 实验内容 调用sleep(系统调用)编写用户级别程序能暂停特定时常的系统滴答程序保存在user/sleep.c 实验过程 xv6的参数传递 查看官方文档提示的文件中,多采用如下定义: int main(in…

代码随想录算法训练营第三十天| 332.重新安排行程, 51. N皇后, 37. 解数独,总结

题目与题解 参考资料:回溯总结 332.重新安排行程 题目链接:332.重新安排行程 代码随想录题解:332.重新安排行程 视频讲解:带你学透回溯算法(理论篇)| 回溯法精讲!_哔哩哔哩_bilibili 解题思路&a…

【随笔】Git 高级篇 -- 相对引用2(十三)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

每日一题(leetcode287):寻找重复数--二分查找+思维

思路&#xff1a;看官方解答 class Solution { public:int findDuplicate(vector<int>& nums) {int nnums.size();int left1;int rightn-1;int ans-1;while(left<right){int mid(leftright)/2;int count0;for(int j0;j<n;j){if(nums[j]<mid){count;}}if(co…