刘良权
Full Stack & AI Engineer
✨ 个人简介
15 年全栈开发经验,具备 云原生 + AI 工程能力:
🛠️ 技术技能
AI Engineering & LLMOps
- 模型训练与推理设施:熟悉 vLLM / SGLang 等高性能推理框架及优化技术。熟悉 LoRA / P-Tuning 微调流程及分布式训练基础。熟悉使用 Volcano 进行大规模 AI 算力调度与编排。
- RAG 检索增强生成:熟悉 Milvus / Elasticsearch 向量数据库,熟悉向量化(Embedding)策略、混合检索及重排序(Rerank)优化。
- Agent 智能体架构:具备类 Coze / Dify 编排引擎的自研能力。具备大模型长期记忆系统设计与实战经验。熟悉 LangChain / Vercel AI SDK / Claude SDK 等 Agent 工具链。
云原生与分布式
- 中间件与高并发:深入理解 Nginx / LVS(四/七层负载均衡原理)、RocksDB / LevelDB(LSM-Tree 存储引擎)。熟练驾驭 Kafka, RabbitMQ, Redis 构建高吞吐系统。
- 容器与调度:精通 Kubernetes 生态,特别是针对 AI 负载的 Volcano 批量计算调度,以及 Docker 容器化最佳实践。
全栈工程与工具链
精通 React, Next.js, Astro, TypeScript 等现代前端栈。具备硬核的语言工程能力,有手写 Parser / Compiler (转换器) 经验,熟悉 JetBrains PSI 及 LSP (Language Server Protocol) 开发,能开发 IDE 插件级提效工具。
编程语言
- • Go: 主攻高性能网关、云原生中间件、并发调度
- • Python: 主攻 AI 工程胶水、数据处理、PyTorch 生态
- • Java: 主攻复杂企业级业务逻辑、大型分布式系统
- • TypeScript / JavaScript:主攻全栈开发
- • C/C++: 主攻底层性能优化、FFI 调用
💼 工作经验
上汽云计算
AI 应用架构师
🚀 大模型服务平台
定位:对标 AWS Bedrock /
硅基流动的模型服务平台,统一管理企业内部算力与模型资源。
技术攻坚:基于 Volcano 调度引擎深度定制,实现了 GPU 算力的细粒度切分与任务编排,大幅提升显卡利用率。基于
Go + Python 构建高性能推理网关,集成 vLLM/TGI 引擎,实现了高并发下的模型吞吐优化及流式响应(SSE)标准化。实现了从模型上传、量化压缩到一键部署的自动化流水线。
🤖 大模型应用平台
定位:类 Coze/Dify 的低代码 AI
应用构建平台,赋能业务部门快速落地 AI 场景。
核心创新:设计并实现了基于 Milvus 向量库 + 结构化数据库的混合记忆机制(Long-term
Memory),解决了传统 LLM 对话上下文丢失的问题,赋予 Agent 跨会话的持久化记忆能力。设计了可视化的
Agent 编排引擎,支持插件调用、知识库挂载及多 Agent 协同工作。
🚗 自动驾驶数据与训练平台
数据闭环:作为主程构建了 PB
级自动驾驶数据管理平台,实现了从采集、清洗、脱敏到标注的全链路自动化。
训练调度:搭建了分布式模型训练平台,解决大规模数据集下的断点续训与资源抢占问题。
☁️ 云原生基础设施研发
自研负载均衡:基于 Go 语言研发七层负载均衡器,结合 LVS/HAProxy
优化四层转发,支撑高并发流量。
中间件 PaaS 化:基于 K8s Operator 模式,实现了 Redis、Kafka、RabbitMQ、ES、EMQX、Ceph
等中间件的一键交付与自动化运维,大幅降低运维成本。
美味不用等
系统架构师
- 餐饮排队系统:主导架构设计及研发支撑亿级用户体量的餐饮排队系统。
- 账号与支付系统:主导用户中心(Passport)与支付网关的拆分重构,解决了单体架构在业务爆发期的性能瓶颈。
- 基础组件研发:研发基于 Java 以及 Go 的基础组件,包括消息队列、缓存、RPC 以及通用基础组件等,统一公司技术栈标准。
快宝网络
研发主管
主导核心物流平台从 PHP 到 Java 的微服务化迁移,支撑千万级用户的高频物流查询。
亲宝文化
高级工程师
负责千万级用户母婴社区的性能优化与架构升级。
🎓 教育背景
东华大学
计算机科学与技术 | 本科(网络教育)