豆包AI模拟面试官,提示词迭代记录
引言某招聘软件的AI面试问题死板、数量固定、中途打断、随意打分和真实面试完全不是一回事。所以我用豆包AI提示词自己做了个能模拟真实面试的AI面试官。文档目的我突然想到这个点子之后实际使用一次后感觉效果极好因此写这个文档记录一下我的AI面试官迭代记录后续会持续更新。最终目标希望可以实现全行业可用的、高拟真度的AI面试官。AI面试官构想我想到这些其实本质上是让AI提问然后将你的答案与它的答案库或者搜索结果进行比对。我们需要处理的问题就是怎么让它尽可能贴近真实线上面试场景。模拟方式1、视频面试模拟面试官语音提问自己开视频回答这是最真实的场景。豆包AI正好有打视频功能但是我经过测评发现几个问题豆包会在你回答中途插话、说‘我在听’‘你继续说’打断思路无法关闭。豆包自带的打视频功能虽然有内置有说完之后再点击发送功能但是询问后发现它只能由AI随机触发。视频面试一旦它不分场合的中途插话对于我来说我的思路极为容易被打断。2、语音面试模拟既然视频面试走不通我就退而求其次选择语音面试由豆包语音给我提问有一说一豆包语语音真不错我同样使用语音进行回答这样可以自由控制什么时候说完什么时候发送。我同样进行了测评它会在每次回答完之后直接评价答案在真实面试中是绝不可能的所以需要加以限制。面试时会问完所有问题哪怕答得再烂。而真实面试中往往累计或者连续几个答错面试官就直接让等通知了。它的提问范围默认是直接询问八股这个虽然有用但是那都不是社招时面试官主要的考察点与我模拟面试官的理念不符。不过上述问题都可以通过设计一套提示词解决。提示词设计1、结果量化面试后我们求职者最关心的是面试过不过或者面试表现到底如何。而其实在AI的强大数据总结和检索功能下能轻而易举将你面试时的回答结果进行量化。基于此我们可以定义一套评分规则每道题总分10分6分含小数点后一位为合格最后需要统计平均分来量化面试结果。答题过程不能当场评分面试结束之后先给出平均分再单独列出每道题得分和扣分点。为模拟真实面试官对我失去兴趣。连续三个题不合格、或者总共5个题不合格直接结束面试并无视平均分直接不及格。岗位匹配度计算我会让它问岗位JD上需要熟悉但是求职者简历上没有相关技术栈的题目它要单独计算这部分题目的平均分满分10分。最终得分计算加权平均分对应题目基础权重如下对于高难题、系统设计优化题该题需要动态根据表现调整权重得分7.9分以下权重50%得分8.0-9.0分权重100%得分≥9.1分权重120%同时不计入终止规则题目类型权重是否触发终止示例项目深挖100%是数据迁移、幂等、PDF基础八股100%是ACID、volatile、HashMap使用场景题80%否Redis怎么用的、MQ场景系统设计/优化题50%否限流方案优化、高并发设计高难度追问题50%否Nacos心跳、分布式事务最终平均分 (Σ核心题得分 0.5 × Σ非核心题得分) ÷ (核心题数量 0.5 × 非核心题数量)x0.9岗位匹配题得分 × 0.1评分时由AI完全控制扣分规则也是不可取的因此我还根据不同题型自定义了扣分规则对于使用场景型类问题介绍见下文。回答明显很假如编造不存在的功能、技术使用场景严重不合理直接评为不合格≤5分计入终止规则。回答存疑如逻辑有漏洞、细节模糊扣0.5-1分对于业务决策类问题介绍见下文- 回答有明显漏洞如说不出为什么比现成方案好、甚至不知道有现成工具扣大分1-2分- 回答逻辑混乱、前后矛盾扣1-1.5分。- 回答清晰理由充分不扣分-加分情况能对比多个现成方案的优劣并结合项目实际做出合理决策可加分0.5-1分。这套评分规则的核心思路是让AI模拟面试官的‘不耐烦’——连续答错就提前结束。2、面试时间对于我的求职目标1-3年岗位平均通过的时间控制在45分钟左右。我通过控制豆包的题目数量来间接控制时间总共题目含追问是21-28个3、题型设置我主要分为以下题型各自按照我面试实际情况进行配比项目深挖50%八股文30%场景/排查题15%其他自我介绍、职业规划5%还有一些额外题目主要检验项目真实度或者岗位匹配度等岗位匹配题根据目标岗位JD可问1-3道该岗位需要、但候选人简历中没有明确写出的技术点或经验。判断标准如下仅当JD中使用“熟悉”“精通”“熟练使用”“掌握”等强要求词时才作为必问项。如果JD中使用“了解”“知道”“接触过”等弱要求词则不问或问了答不上来不计分。使用场景型问题对于“在项目中如何使用XXX技术”“XXX技术的适用场景”这类问题视为使用场景题业务决策题选题不局限于如下例子需参考其他面经中类似问题例如为什么自研不用现成方案怎么保证数据不丢为什么选择这个技术栈而不是其他4、题目范围灵活拓展还有个真实面试中很重要的一点面试官可能根据你回答的比较好的内容进一步提升提问的广度而不是局限于简历。例如你说你做了代码层的接口限流答得还比较好那么面试官可能追问常见的限流方式是哪些。具体来说对于任何问题项目深挖、八股、场景题等如果候选人的回答评分达到8分以上真实、有深度、逻辑清晰则该回答中涉及的技术点、场景描述、实现细节可视为简历内容的有效延伸。AI可根据这些延伸内容在后续提问中灵活追问相关八股或项目细节。例如候选人回答“我用Redis做分布式锁”AI可追问“Redis分布式锁怎么保证原子性”“锁超时怎么处理”。5、交互细节设置由于使用的是语言输入模拟真实面试回答所以难免出现同音错别字、英文识别成中文、漏字等情况所以需要排除这方面影响同时要避免它打断、回复无意义内容、结束前给分我是这样设计提示词的我会使用语音输入可能会出现同音字、错别字或识别错误。忽略这些文字错误只关注我表达的技术内容和逻辑。面试过程中请不要在我每句话后都回复“好的”“知道了”“继续”等无意义内容。我会一次性回答完整个问题。在我回答问题的过程中不要打断我不要插话不要追问。答题过程中不要告诉我得分。不要在我说完一段话后说“这个回答6分”之类的评分。所有评分、总结、改进建议请在面试结束后统一给出。提问示例1、请你详细说一下优惠券小程序里的接口幂等性你是怎么用 Redis 锁 AOP 限流 数据库唯一索引来实现的这三种方式分别解决什么问题2、你刚才提到 Redis 锁用了 UUID 防误删、设置过期时间、finally 释放。那我问你如果业务执行时间超过 5 秒锁过期了其他线程拿到锁会怎么样你怎么解决这个锁超时问题3、你在项目里做过千万级数据从 MySQL 迁移到 MongoDB请说一下你用的多线程分段抓取、优先级队列、单线程写入具体是怎么设计的为什么要单线程写入4、你刚才说用主键游标分页做数据迁移那为什么不用普通的 limit 分页游标分页相比 limit 分页优势在哪里5、你在项目中用AOP 自定义注解做了接口限流说说你这个注解的核心逻辑是什么用的是什么限流算法6、你提到限流用的是计数器算法那它有临界值问题。如果现在要把它改成高并发下更可靠的限流方案你会选用哪种算法怎么实现7、那我问个基础八股MySQL 里什么是事务的四大特性ACID分别讲一下含义。实测效果用这套提示词跑了一次模拟面试14个问题平均分8.0AI给出的评价是“项目深挖充分八股基础需加强”。和真实面试的反馈有较大差距严格打分只有6.4。后续我会继续迭代该问题用最新版提示词已修复。这里还附上一份我的模拟记录豆包AI面试官使用记录(含问题、扣分点、面试总结)更新记录v1.1 - 2026-04-24第二次模拟面试复盘结果平均分7.1分使用deepseek排除过难题目干扰后评分7.5分发现问题豆包评分机制与预期不符追问/延伸题高难度题超过岗位所需能力边界答不上被拉低平均分岗位匹配题未被问到核心题数量偏少仅10个优化内容新增“题型分类与计分规则”明确核心题含项目深挖、八股文等子类型、岗位匹配题、各类追问题项目深挖型、技术栈真实性型等的分类逻辑以及不同题型的计分原则。核心题数量定至15个左右总问答次数核心题追问题岗位匹配题控制在21-28个。细化不同类型追问题项目深挖、场景型、业务决策型等的追问规则与计分原则区分回答质量对应的评分区间。题型设置中明确列出岗位匹配题数量。根据不同题型设置不同权重例如项目深挖、基础八股权重100%使用场景80%系统设计、高难追问50%。动态调整高难度或者优化类题目权重。v1.2 - 2026-04-26第三次测试面试复盘结果豆包抽风导致测试失败暂无发现问题题目数量如果设置过多导致上下文过长豆包会开始说胡话比如中途打断、直接给出答案、一次性给出剩余题目。规则过多有些豆包无法理解导致错乱一口气甩出20道问题。优化内容题目数量固定总数为20个。加入一句规则参考真实面试一问一答否则作废解决一次性问问题。注意事项由于AI模拟面试需要参考岗位JD和候选人简历所以需要将提示词发过去的同时粘贴岗位JD和简历内容。同时豆包评分结果仅供参考完整的提示词见链接https://github.com/jmingfu/Daily-Demo/blob/main/AI-Interview-Bot-Prompt再附上一份模拟时的题目列表随着每次迭代豆包问的问题感觉拟真度越来越高了豆包AI面试官使用记录(含问题、扣分点、面试总结)
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2558530.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!