AI Infra 后端开发工程师 — 学习路线
AI Infra 后端开发工程师 — 学习路线目标3个月可切换到AI Infra后端岗位能力迁移地图AI Infra 对应迁移成本Goroutine调度/并发控制思维直接复用Agent会话生命周期管理设计模式相同SSE/WebSocket流式协议实时系统思维GPU显存管理/KV-cache资源约束优化思维推理延迟优化/负载均衡时延敏感系统经验Go微服务/K8s后端架构相通Python推理网关开发直接可用3个月学习计划Month 1Go语言 云原生基础目标能用Go写生产级后端服务理解容器化部署周次主题内容产出W1Go基础速成goroutine/channel/interface/error处理写过C的人Go基础1周够W2Go并发实战context/sync/semaphore/worker pool实现一个RTOS-task-scheduler的Go版W3gRPC Protobufservice定义/流式RPC/拦截器/超时重试写一个EtherCAT从站协议的gRPC版W4Docker K8s入门Dockerfile/Pod/Service/Deployment/ConfigMap把W3的服务容器化部署到minikube关键资源《Go程序设计语言》前8章gobyexample.com— 每天刷20个例子github.com/grpc/grpc-go/examples— 官方gRPC示例Month 2消息中间件 推理网关理解目标理解AI推理服务的后端基础设施周次主题内容产出W5Redis深度Stream/发布订阅/分布式锁/Lua脚本用Redis Stream实现一个任务队列W6消息队列Kafka/NATS基础、消费者组、消息可靠性用NATS实现多Agent消息总线W7vLLM推理网关源码阅读API server/调度器/显存管理写vLLM架构分析笔记W8HTTP流式协议SSE实现/WebSocket/长连接管理实现一个SSE推送服务关键资源redis.io/docs— Redis Stream教程github.com/vllm-project/vllm— 重点看vllm/entrypoints/openai/api_server.py和vllm/core/scheduler.pynats.io— NATS官方文档比Kafka更适合Agent场景Month 3实战项目 — 自建Agent推理网关目标从0搭建一个可运行的多模型推理网关项目Mini Hermes Gateway┌──────────────────────────────────────────┐ │ API Gateway (Go) │ │ /v1/chat/completions (SSE streaming) │ │ /v1/models │ │ /v1/health │ └──────────────┬───────────────────────────┘ │ gRPC ┌──────────────▼───────────────────────────┐ │ Model Router (Go) │ │ 负载均衡 / 模型选择 / 队列管理 │ └──────┬──────────────┬────────────────────┘ │ │ ┌──────▼──────┐ ┌─────▼──────┐ │ vLLM node 1 │ │ vLLM node 2│ │ (GPU 0) │ │ (GPU 1) │ └─────────────┘ └────────────┘周次模块技术点W9API GatewayOpenAI兼容API、SSE流式、速率限制W10Model Router轮询/最少连接/显存感知路由W11会话管理Redis会话存储、多轮对话状态机W12压测优化wrk/vegeta压测、pprof分析、部署文档简历项目清单按优先级 Mini Hermes Gateway核心项目Go实现OpenAI兼容推理网关支持多模型路由 SSE流式 Redis会话管理Docker Compose一键部署面试价值直接对应AI Infra日常工作的80% RTOS Scheduler in Go展示并发功底用Go实现一个抢占式调度器支持优先级反转检测、deadline调度面试价值证明并发编程深度理解嵌入式背景正确定价 gRPC Bridge展示协议设计能力协议栈用gRPC重新实现支持流式数据传输、从站配置协议面试价值证明能从0设计通信协议这是AI Infra核心能力4️⃣ vLLM源码分析笔记推理引擎架构、KV-cache管理、PD分离公开发在技术博客/GitHub面试价值证明你对AI推理系统有深度理解不是只会调API每周时间分配时段内容时长工作日晚上 20:00-22:00理论学习 阅读源码2h×510h周六 9:00-12:00项目实战 代码3h周六 14:00-17:00项目实战 代码3h周日 10:00-12:00整理笔记 复盘2h每周总计~18h关键里程碑时间里程碑检验标准第2周末Go gRPC服务能跑EtherCAT-gRPC Bridge v0.1第4周末K8s部署自己的服务minikube上3个pod互访第6周末vLLM架构吃透能给别人讲清楚调度器显存管理第8周末SSE流式推送服务100并发稳定推送第10周末Mini Hermes v0.1单模型推理网关跑通第12周末Mini Hermes v1.0多模型路由压测报告部署文档
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2637024.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!