Leon Liu

刘良权

Full Stack & AI Engineer

leonstdio@gmail.com supaleon.com 15 年经验 远程 / 上海

✨ 个人简介

15 年全栈开发经验,具备 云原生 + AI 工程能力:

🤖 AI 工程能力:近 3 年专注于大模型基础设施及 AI Agent 系统建设,主导过企业级 MaaS(模型即服务)平台及 Agent 编排平台从 0 到 1 研发。熟悉推理加速、RAG 检索增强及 Agent 记忆持久化等核心领域。
🏗️ 系统架构能力:具备亿级用户、万级 QPS 系统的架构设计能力,精通分布式系统、微服务及中间件底层原理。
🚀 全栈交付能力:具备从底层算力调度(K8S/Volcano)到上层应用编排(Coze-like Platform)的实战能力,具备前端 UI 交付能力(React/NextJS/Astro)。

🛠️ 技术技能

AI Engineering & LLMOps

  • 模型训练与推理设施:熟悉 vLLM / SGLang 等高性能推理框架及优化技术。熟悉 LoRA / P-Tuning 微调流程及分布式训练基础。熟悉使用 Volcano 进行大规模 AI 算力调度与编排。
  • RAG 检索增强生成:熟悉 Milvus / Elasticsearch 向量数据库,熟悉向量化(Embedding)策略、混合检索及重排序(Rerank)优化。
  • Agent 智能体架构:具备类 Coze / Dify 编排引擎的自研能力。具备大模型长期记忆系统设计与实战经验。熟悉 LangChain / Vercel AI SDK / Claude SDK 等 Agent 工具链。

云原生与分布式

  • 中间件与高并发:深入理解 Nginx / LVS(四/七层负载均衡原理)、RocksDB / LevelDB(LSM-Tree 存储引擎)。熟练驾驭 Kafka, RabbitMQ, Redis 构建高吞吐系统。
  • 容器与调度:精通 Kubernetes 生态,特别是针对 AI 负载的 Volcano 批量计算调度,以及 Docker 容器化最佳实践。

全栈工程与工具链

精通 React, Next.js, Astro, TypeScript 等现代前端栈。具备硬核的语言工程能力,有手写 Parser / Compiler (转换器) 经验,熟悉 JetBrains PSI 及 LSP (Language Server Protocol) 开发,能开发 IDE 插件级提效工具。

编程语言

Go 精通 Python 精通 Java 精通 TypeScript 精通 C/C++ 熟练
  • • Go: 主攻高性能网关、云原生中间件、并发调度
  • • Python: 主攻 AI 工程胶水、数据处理、PyTorch 生态
  • • Java: 主攻复杂企业级业务逻辑、大型分布式系统
  • • TypeScript / JavaScript:主攻全栈开发
  • • C/C++: 主攻底层性能优化、FFI 调用

💼 工作经验

上汽云计算

AI 应用架构师

2019.09 – 2025.09

🚀 大模型服务平台

定位:对标 AWS Bedrock / 硅基流动的模型服务平台,统一管理企业内部算力与模型资源。
技术攻坚:基于 Volcano 调度引擎深度定制,实现了 GPU 算力的细粒度切分与任务编排,大幅提升显卡利用率。基于 Go + Python 构建高性能推理网关,集成 vLLM/TGI 引擎,实现了高并发下的模型吞吐优化及流式响应(SSE)标准化。实现了从模型上传、量化压缩到一键部署的自动化流水线。

🤖 大模型应用平台

定位:类 Coze/Dify 的低代码 AI 应用构建平台,赋能业务部门快速落地 AI 场景。
核心创新:设计并实现了基于 Milvus 向量库 + 结构化数据库的混合记忆机制(Long-term Memory),解决了传统 LLM 对话上下文丢失的问题,赋予 Agent 跨会话的持久化记忆能力。设计了可视化的 Agent 编排引擎,支持插件调用、知识库挂载及多 Agent 协同工作。

🚗 自动驾驶数据与训练平台

数据闭环:作为主程构建了 PB 级自动驾驶数据管理平台,实现了从采集、清洗、脱敏到标注的全链路自动化。
训练调度:搭建了分布式模型训练平台,解决大规模数据集下的断点续训与资源抢占问题。

☁️ 云原生基础设施研发

自研负载均衡:基于 Go 语言研发七层负载均衡器,结合 LVS/HAProxy 优化四层转发,支撑高并发流量。
中间件 PaaS 化:基于 K8s Operator 模式,实现了 Redis、Kafka、RabbitMQ、ES、EMQX、Ceph 等中间件的一键交付与自动化运维,大幅降低运维成本。

美味不用等

系统架构师

2016.06 – 2019.08
  • 餐饮排队系统:主导架构设计及研发支撑亿级用户体量的餐饮排队系统。
  • 账号与支付系统:主导用户中心(Passport)与支付网关的拆分重构,解决了单体架构在业务爆发期的性能瓶颈。
  • 基础组件研发:研发基于 Java 以及 Go 的基础组件,包括消息队列、缓存、RPC 以及通用基础组件等,统一公司技术栈标准。

快宝网络

研发主管

2013.04 – 2016.06

主导核心物流平台从 PHP 到 Java 的微服务化迁移,支撑千万级用户的高频物流查询。

亲宝文化

高级工程师

2011.02 – 2013.04

负责千万级用户母婴社区的性能优化与架构升级。

🎓 教育背景

东华大学

计算机科学与技术 | 本科(网络教育)