算法、推理、部署,面了40多个大佬的感想

news2025/7/14 18:15:07

今年三月份到现在陆陆续续面了40来个人,有实习生,有校招生,也有来社招的大佬们。面了挺久,有些总结和感想,发出来和大家交流交流,也趁着这个机会为之后参与校招的同学提供一些学习方向。

我面的岗位主要是算法工程师,也会面试一些推理相关的人。

简单从这三点说:

  • 对候选者的要求

  • 大家的水平

  • 未来的看法

技术交流

技术要学会分享、交流,不建议闭门造车。一个人走的很快、一堆人可以走的更远。

资料、数据、技术交流提升, 均可加知识星球交流群获取,群友已超过2000人,添加时切记的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、添加微信号:mlc2060,备注:加群
方式②、微信搜索公众号:机器学习社区,后台回复:加群

实习生

第一个是招实习生,实习生的简历,大家的学校感觉都不错,北邮、北航、东南大学、厦门大学、大连理工、西交西电等等,项目做的也都很多,有发表过一些顶会的也有其他不错期刊的。也有同时在其他公司实习的,这种有公司实习经历的同学我们肯定是优先考虑,毕竟在公司实习能有个完整的项目啥的,而且ssh、git、docker一些常用工具也都会用。

图片

不过实习生的话,公司要求没有校招高,只要有对口的项目,代码能力过关,来了我们都愿意培养,一起搞个项目,学生嘛,学习起来很快,上手新项目多带带很容易就会了。重点说下代码能力必须要过关,你项目不多不要紧,你来了可以学,代码能力不行就会怀疑你项目是咋做的有没有自己亲自动手做的。

还有一个是要求实习生对基础理解的比较好些,项目虽然可以不用太多,但是你做过的项目细节,自己必须要清楚,深入问的时候能够回答上来,比如一个BN层,训练和推理有哪些表现不一样,有哪些参数需要更新等等,这些细节面试的时候大部分人都说不全,不能一次性说对。

总结下对实习生的要求:

  • 项目可以不多,但是要精

  • 基础知识要好

  • 代码能力过关

就OK了,至于方向的话,只要是和算法CV相关就行。

校招生

校招生要求会高一些,校招生的学校和实习生没区别,也都挺好,不过看简历项目明显多了一些(最起码暑假阶段找了个实习,然后秋招面试的时候可以写上去),对于校招生来说,除了基础知识外,更要看项目是否匹配啥的。

因为现在深度学习算法咋说也火了好多年了,从神仙打架到诸神黄昏了。到现在简历上搞一些什么使用unet训练一个分割网络实现某个任务,或者说使用yolov7检测某个目标已经不是什么亮点了。不过这种也不是不行,但你需要更多的深度我才会感兴趣:

  • 网络结构有无值得说明的改进

  • 为什么这样做可以明确说出原因和数据证明

  • 对使用这个方法以及和其他方法做过比较详细的对比,选择这个模型是有理由的

现在是大模型和多模态的时代,大模型确实在很多场景上都应用的挺好而且都能落地,比如chatgpt以及基于llama的各种开源模型在各种场景上的应用,隔几天就能出一个大模型、隔几天刷一次榜;多模态的话,gpt4已经可以看图生图了(gpt-plus用户可以体验),而且效果也比较惊艳,这种多模态潜力还是很大的,有很多开源的项目可以借鉴:

  • https://github.com/QwenLM/Qwen

  • https://github.com/IDEA-Research/GroundingDINO

  • https://github.com/Vision-CAIR/MiniGPT-4

因此也希望校招生有多模态相关的项目(实话实说,多模态和大模型对显卡的要求比普通项目更高,确实在学生时代搞还是挺难…),多模态,和CV结合再和NLP结合,都能搞出不错的项目。

图片

比较简单点的多模态可以尝试下grounding dino,对于稍稍的大模型+目标检测来说是一个不错的点子:

图片

话说回来,在面试今年算法校招生的时候,就更想要一些偏多模态,

至于部署工程方面,我也看到很多校招生有一些工程的项目,比如使用C++写个模型的前后处理,比如剪枝量化啥的,不过感觉都不是很深,比如关于剪枝的细节,问具体剪的是哪?剪网络层?剪通道?还是剪kernel,回答的都不是很清楚,还有量化,因为现在很多库对量化支持的很好,大家普遍调用一下API看到结果好就好了,也没有看细节,这个一问就问出来了(比如trt的量化,有api可以直接量化)。这些部署可以搞得再细一点,不过这些童鞋在大家都一样的基础上,你再会C++、再会一些部署方向的东西,比只会写python算法的肯定要强些。

推理相关

推理面了一些校招以及一些社招,大家的方向大概是这几种:

  • 搞上层编译器的(类似于torch-tensorrt的利用pytorch生态和TensorRT生态的在nvidia显卡加速的编译器,不需要自己写codegen),会针对不同的后端(比如onnx和torchscript)写parser,针对计算图写一些pass;也有搞基于MLIR的编译器的,在自己的公司硬件上跑,前端中端后端需要都搞

  • 搞推理框架的,就是优化训练和部署中的一些性能问题、精度溢出问题;有些公司喜欢搞统一的框架(训练和部署都解决了),不喜欢用现有的轮子,要自己造;对于加速类的推理框架,会实现比如模拟量化功能、精度对比功能等等

  • 搞加速的,就是对任务中各种瓶颈的算子进行加速,C++转cuda,python转c++等等,使用C++封装一些项目blabla

有些社招的大佬做的比较深,细节说的比较好,也对新的技术(比如新显卡hopper架构)有探索的热情(面试过一些35+的大佬,热血激情不分年龄),在多个大厂待过,很强。

图片

也有一些优秀的校招生,项目优化op的细节都能答上来,加分~也有几个校招生不清楚项目为啥要这么做,问则答曰领导要求的,问有没有自己的想法,回答的也不是很好,这种是比较降分的。

感想

预计明年的热点还是大模型和多模态,而部署加速一直有需求。问了面试的算法校招生,说今年难度也挺大,有好学校的秋招过了国庆目前只有一个offer。

还有因为大模型,一开始各个厂抢大模型加速的人才比较剧烈,不过现在应该好多了。

其余一些想说的:

  • 面了不少寒武纪和百度的大佬

  • 有工作7、8年的大佬,在多个大厂待过然后目前在创业公司

  • 也有离职(自己原因、公司原因)待业的大佬

环境依然不是很乐观,之后一起加油!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1103011.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【STL】平衡二叉树

前言 对于之前普通的二叉搜索树,其搜索的效率依靠树的形状来决定,如下: 可以看到 A图 中的树比较彭亨,搜索一个元素的效率接近 O(logN) ;而 B图 中的形状也符合搜索二叉树,但是很不平衡,这时的…

SamSung三星笔记本NP930QCG-K02CN原装出厂OEM预装Win10系统

下载链接:https://pan.baidu.com/s/13GsR_r9caJkLjiWWaXa30Q?pwdncp9 系统自带指纹驱动、声卡,网卡,显卡等所有驱动、三星出厂时主题壁纸、系统属性三星专属LOGO标志、Office办公软件等三星出厂时自带的预装程序 由于时间关系,绝大部分资料没有上传,不…

SpringCloud: sentinel热点参数限制

一、定义controller package cn.edu.tju.controller;import com.alibaba.csp.sentinel.annotation.SentinelResource; import com.alibaba.csp.sentinel.slots.block.BlockException; import org.springframework.web.bind.annotation.PathVariable; import org.springframewo…

出详图和工程图(上)-SOLIDWORKS 2024新功能

保持尺寸链共线 即使空间有限,您也可以确保尺寸链保持共线。 当尺寸文本和箭头重叠时,您可以选择最合适的选项。 要在尺寸文本重叠时保持尺寸链共线: 1. 单击工具 > 选项 > 文档属性 > 尺寸 > 线性 > 尺寸链。 2. 在共线选…

Nginx的安装——window环境

1、下载Nginx 在官网下载稳定版本: http://nginx.org/en/download.html 以nginx/Windows-1.24.0为例,直接下载 nginx-1.24.0.zip。 下载后解压,解压后如下: 2、启动nginx 在window环境下启动nginx的方法有以下两种: …

Hadoop3教程(二十):MapReduce的工作机制总结

文章目录 (109)MapTask工作机制(110)ReduceTask工作机制&并行度ReduceTask工作机制MapTask和ReduceTask的并行度决定机制 (122)MapReduce开发总结参考文献 (109)MapTask工作机制…

数据存储工程解决

在构建大规模爬虫系统时,数据存储是一个至关重要的环节。面对大量数据的处理和存储,我们需要采取一些工程化的解决方案,以确保数据的有效管理和快速检索。在本文中,我将与大家分享一些关于大规模爬虫数据存储的解决方案&#xff0…

Linux中的主要系统调用

Linux 操作系统中就是创建进程。创建进程的系统调用叫fork。在 Linux 里,要创建一个新的进程,需要一个老的进程调用 fork 来实现,其中老的进程叫作父进程(Parent Process),新的进程叫作子进程(C…

【刷题篇】回溯算法(广度优先搜索(一))

文章目录 N 叉树的层序遍历腐烂的橘子单词接龙打开转盘锁 N 叉树的层序遍历 给定一个 N 叉树,返回其节点值的层序遍历。(即从左到右,逐层遍历)。 树的序列化输入是用层序遍历,每组子节点都由 null 值分隔(参…

AADL 端到端流延迟分析示例项目 Latency-case-study 简述

一、项目概述 latency-case-study 项目是一个增量延迟分析系统。该系统从系统的总体框架开始,逐步迭代增进,最终建立起系统的模型并实现对模型的分析。(个人觉得这个过程有一些类似于“自顶向下,逐步求精”的过程) 示…

它来了,xhadmin多应用Saas框架正式发布!

这是一个很激动人心的时刻,因为这个框架从立项到现在已经一年多的时间了,先给大家欣赏下颜值吧。 上图所示是总后台的首页截图,看上去还是比较满意的,不过后续还有一些小小的调整。 应用市场的效果也是相当炸裂的,整体…

Windows10找不到msvcr100.dll如何修复呢?详细有效的修复方法分享

在使用Windows10操作系统的过程中,我们经常会遇到各种各样的技术问题。其中,一些常见的问题是关于系统文件丢失或损坏,如“找不到msvcr100.dll”的错误。这个问题在Windows 10系统中尤其常见,msvcr100.dll是一个动态链接库文件&am…

用友NC-Cloud uploadChunk 任意文件上传漏洞

一、漏洞描述 用友 NC Cloud,大型企业数字化平台, 聚焦数字化管理、数字化经营、数字化商业,帮助大型企业实现 人、财、物、客的全面数字化,从而驱动业务创新与管理变革,与企业管理者一起重新定义未来的高度。为客户提…

收集灵感都有哪些网站推荐?

设计是一件非常令人兴奋的事情。特别是最常见的平面设计,作为一种传达想法或信息的视觉表达形式,被要求不仅突出个性和主题,而且具有创造力和美感,使许多设计师在灵感枯竭时疯狂。此时,浏览一些平面设计网站&#xff0…

YOLOv8涨点技巧:手把手教程,注意力机制如何在不同数据集上实现涨点的工作,内涵多种网络改进方法

💡💡💡本文独家改进:手把手教程,解决注意力机制引入到YOLOv8在自己数据集不涨点的问题点,本文提供五种改进方法来解决此问题; ContextAggregation | 亲测在血细胞检测项目中涨点,…

C/C++文件操作(细节满满,part2)

该文章上一篇:C/C文件操作(细节满满,part1)_仍有未知等待探索的博客-CSDN博客 个人主页:仍有未知等待探索_C语言疑难,数据结构,小项目-CSDN博客 专题分栏:C语言疑难_仍有未知等待探索的博客-CSDN博客 目录 …

AGI 黑客松收官,Zilliz 向量数据库助力34支参赛队伍角逐大模型时代的Killer App

紧张的 72 小时、34 组 AGI 前沿玩家、天马行空的创意、一场酣畅淋漓的黑客松比赛! 近期,由 Zilliz、Founder Park、智谱 AI 联合主办的 AGI Playground Hackathon 在北京圆满落幕。作为此次大赛的主办方之一,Zilliz 为选手提供了开箱即用的向…

Tuxera NTFS2024Mac电脑磁盘读写工具

NTFS是一种广泛用于Windows系统的文件系统,但是如果你想在Mac系统中读写NTFS格式的硬盘或U盘,你会发现Mac系统并不支持NTFS读写。这时,NTFS for Mac就变得非常有用了。本文将介绍NTFS for Mac有什么用,NTFS for Mac怎么用。 一、…

Java8实战-总结42

Java8实战-总结42 用Optional取代null应用 Optional 的几种模式默认行为及解引用 Optional 对象两个 Optional 对象的组合使用 filter 剔除特定的值 用Optional取代null 应用 Optional 的几种模式 默认行为及解引用 Optional 对象 采用orElse方法读取这个变量的值&#xff0…

接口自动化测试持续集成,Soapui接口功能测试参数化

按照自动化测试分层实现的原理,每一层的脚本实现都要进行参数化,自动化的目标就是要实现脚本代码与测试数据分离。当测试数据进行调整的时候不会对脚本的实现带来震荡,从而提高脚本的稳定性与灵活度,降低脚本的维护成本。Soapui最…