AI 算法工程师
关于我们
在中关村人工智能研究院,软件智能研究所,我们承担重大国家项目与横向合作项目,面向真实复杂场景中的 AI 问题。
这里的算法工作并非“刷榜”或“单点模型优化”,而是从数据、模型、评测到落地的完整链路。每个项目的问题背景、数据形态、约束条件都可能完全不同。
这个角色是什么
你不会只是在调一个现成模型。
作为项目中的算法核心,你将直接参与问题定义,与客户、领域专家和工程团队一起,把一个模糊的“想要 AI 能做什么”,变成可训练、可评测、可交付的模型系统。
你需要理解任务本身,而不仅是模型;理解数据,而不仅是代码;理解评测,而不仅是 loss。
每个项目可能使用不同的模型范式、数据流程与工具链——这正是这个角色的挑战和价值所在。
你将在一个稳定的团队中工作,与算法研究人员、软件工程师紧密协作,共同完成从 0 到 1 的 AI 项目交付。
岗位职责
- 作为算法核心参与项目全周期:问题建模、数据处理、模型训练、评测设计与迭代
- 与客户及合作方进行技术对接,理解业务目标并转化为清晰的算法任务定义
- 独立完成或主导模型训练与优化(包括但不限于大模型微调、多模态模型、任务模型)
- 设计并实施合理的评测方案,明确模型能力边界与改进方向
- 构建和维护数据处理、训练与评测流程,保证实验可复现、结果可解释
- 撰写算法方案、实验报告与技术文档,支撑项目决策与最终交付
我们在找什么样的人
我们不以学历、年资或“是否发过论文”作为筛选标准。
我们关心的是:你是否真的独立把模型训练过、评测过,以及你是如何思考和解决问题的。
技术能力
真正做过模型训练
- 能够根据任务选择合适的模型结构、训练策略与工程方案,并说明原因
- 有从原始或半结构化数据出发,完成数据清洗、构建训练集的经验
- 熟悉常见模型训练流程:预训练 / 微调 / 指令微调 / 对齐等
- 有使用 Hugging Face 生态(Transformers、Datasets、Trainer 等)的实际经验
- 了解并使用过 LLaMA Factory、DeepSpeed、FSDP、LoRA / QLoRA 等工具或方法者优先
理解评测,而不是只看 loss
- 能根据任务目标设计合理的评测指标与对照实验
- 理解自动评测与人工评测的适用边界
- 能分析模型失败案例,而不是只关注分数提升
对算法有“工程级”的理解
- 理解算力、显存、训练效率与效果之间的权衡
- 能在资源受限条件下做出可行方案
- 具备基本的实验管理、结果复现与版本控制意识
综合素质
沟通与协作
- 能够与工程、产品、领域专家清晰讨论模型能力与限制
- 能把算法假设、评测结果与风险点讲清楚,而不是“黑盒正确”
自驱力与主动性
- 不依赖于被动分配的任务说明
- 能在问题模糊、数据不完美的情况下主动拆解问题、推进进展
学习能力与技术好奇心
- 面对新模型、新范式(如新型大模型、多模态、Agent 等)保持持续关注
- 不迷信某一种模型或方法,对“为什么有效 / 为什么无效”保持追问
AI 时代的算法工程师
- 熟练使用 AI 工具(如 Codex,Cursor,Claude Code)辅助算法开发与实验
- 理解大模型的能力边界与风险
- 对 AI 在真实场景中的落地问题有清醒认识与长期兴趣
优先条件
- 有完整的模型项目经验(从数据到训练再到评测与交付)
- 有大模型微调、指令数据构建或评测体系设计经验
- 有高质量开源项目、技术博客或可公开的实验报告
- 有竞赛或实战背景(Kaggle、天池、真实业务项目等)
- 有与工程团队协作,将模型部署或集成到系统中的经验
我们提供
- 参与国家级 AI 项目与真实复杂场景的机会
- 覆盖数据、模型、评测、系统的完整算法工程挑战
- 稳定且高水平的技术团队与合作氛围
- 与研究人员和工程专家密切协作、共同成长的环境
- 具有竞争力的薪酬与福利
申请方式
请将简历发送至 modelware@zgci.ac.cn,邮件标题请注明「软件智能研究所-AI 算法工程师-姓名」。
欢迎附上:
- 你负责或深度参与过的模型项目说明
- GitHub / Hugging Face / 技术博客 / Google Scholar 等能展示你实际工作内容的材料
- 你认为“最有价值的一次模型失败经验”(可简述)
我们不是在找“会用某个模型的人”,
而是在找“能把 AI 真的做成系统、并知道它为什么有效的人”。