1.广州视宴(ai开发实习生)
首先是自我介绍~
1.第二个项目中的热力图是用怎么样的方式去做的?
2.在第二个项目中,如何用热力图去实现它的实时变化
答:我这里直接说我项目里面其实静态的热力图,不是动态的
3.如果要你爬虫阿里或者百度的网站,你会怎么做?阿里的做了什么样的反爬机制?
答:我首先说了下百度的反爬机制,后面我发现我没有反爬过阿里的网站,我直接说不会了,现在想来这两个应该是差不多的。
4.OpenCV如果识别人脸和人的身体的话,你会用什么库,比如说你要识别人的身体骨骼的话。
5.你的这个项目是识别人脸的,那你如何确保别人贴个照片在脸上直接过呢?怎么判断它是不是真人?
这个不会
6.transformer模型有没有了解过?
答:我说了一下它的大概结构和自注意力机制
7.现在有一个企业内部资料库,假如你需要把它训练成一个ai智能体,用于相互对话的话,你该怎么做?(我说用这个内部资料库对本地部署的deepSeek-R1模型进行训练,然后使用Pythoweb开发前后端进行交互,把训练后的结果利用网页来让它能够实现相互对话)
8.具体究竟是怎么训练这个智能体的?(我说调用科大讯飞的api进行情感分析和自然语言处理,然后生成结果)
9.那假如我就是不能用api,就是要离线生成答案,我应该怎么做?(这个也不是很会)
10.MCP协议了解过吗?(还真不会)
11.如果让你用OpenCV来用于做情感的识别,你会怎么做?。
答:我回答说OpenCV有一个专门的库是用来识别人脸的,还有几个库是专门识别像微笑,伤心等表情的
12.那如果我要增加它的表情类目的话呢,比如我要识别160种表情,我应该如何去做?
答:当时都傻了,160种表情?我后面直接说只用OpenCV的话是做不到的,我会像我写的第一个项目那样,在Kaggle上下载各个表情下的数据集,然后用YOLOv11的模型在配置好文件之后进行训练
13.那按你这样做的话,准确度能够控制在多少呢?
答:0.8-0.9吧
14.怎么提升这个准确度呢?
答:我回答要么训练次数更高一些,要么做数据增强
15.假如说这个表情识别的项目的受众群体是中国人比较多,但是数据集都是外国人,比如黑人和白人,这个会有什么影响?
答:我直接说由于黑人的嘴唇一般比我们国人要厚一点,可能我们的微笑在黑人那里会识别成假笑?
16.你一般用什么ai工具多一点?就只用过这些吗?
答:我说ChatGPT和deepSeek多一点,我还用过cursor里面的Gemini和Claude模型,只是ChatGPT和deepSeek用的多一点。
17.你觉得deepSeek这个模型是怎么做出来的?
答:我说是用ChatGPT的那个模型进行蒸馏,然后减少那个训练的数据集来降低成本
18.你需要什么样的条件你才能做出这种类型的模型出来。
答:我说好像是用要跟deepSeek差不多的一个训练环境,再模拟deepSeek的方法对ChatGPT进行一个蒸馏
19.假如说我要用deepSeek来让我的公众号实现像ai客服机器人一样去对话,我应该怎么做?
答:先利用爬虫的知识,在app上获取客户发送的消息。然后调用deepSeek的api来生成回答的文本,最后使用模拟器和selminum,DrissionPage这些自动化工具来模拟人的操作,将生成好的文本发送过去
20.那假如说企业有几十个微信账号,让它全都变成客户机器人呢?应该怎么做?
答:(这个我是真的不会了)下多几个模拟器进行类似的操作,或者使用网页版微信来增加它的那个ai客服的运行数据。
21.比如你那个电脑再使用这个自动化工具,我又不想让这个自动化工具影响我的日常微信的文件使用,我应该怎么做?
答:(这个其实我也不是很会)我说可以不用该脚本,可以想手机那样做应用双开?
22.那按你怎么做的话,跑这些模拟器的项目配置要多高?包括它这个链路该如何去串通起来?
这里有点答非所问了,我说了3080应该可以吧。
23.按你刚刚的那个配置对智能进行训练的话,大概要训练多久?
答:应该是一个星期吧。
24.你是明年毕业是吧,能够实习半年对吗?
答:是的。
反问环节~
总结:
这次面试让我深刻的意识到了自己的不足,对于这种场景题基本上是一点都不会,我的知识储备跟大佬们比肯定是不足的。我需要再好好的学习一些面试的题目。
写在最后:
我们可以在这里学习C++知识:
0voice · GitHub