中国互联网大厂大模型求职指南
从 2023 年 ChatGPT 发布开始,大模型就成为国内互联网大厂的招聘重点。从预训练、后训练算法到 AI Infra,从大模型产品到大模型运营,相关岗位的薪资也随之水涨船高。
根据公开报道和我掌握的零散信息,2024 年清北或海外名校的大模型相关专业博士,进入互联网大厂顶尖人才计划的,拿到的校招 offer 大致在 150 万左右,顶级档位是字节 3-1 或者腾讯 9/10 级。而到了今年,各大厂再次加码,在顶尖人才计划中的清北博士们,校招生 offer 已经普遍涨到 200 万以上。个别顶级候选人,在校招阶段就有机会拿到字节 4-1、腾讯 T12 等档位,对应 400~500 万量级的整体薪酬包(不同公司口径略有差异)。
除了“疯狂”的校招生之外,众多算法大佬被高薪挖走的消息也是屡见不鲜:从传言中周畅 4 年 5000 万人民币被字节挖走,到字节 Seed 的乔思远 4 年 5000 万美元加入 Meta。具体数字未必完全准确,但可以肯定的是,在这些传闻里,一个字节 3-1 或 3-2 的研究员跳槽到硅谷,往往都能拿到数百万美元级别的薪酬(这也被不少人视为字节 Seed 近期开启“人才流失”讨论的原因之一)。
那么,在 2025 年的最后一个月,中国大模型行业的顶级玩家(包括主流互联网大厂和 AI“六小龙”)大致可以分为哪几档?各自又有哪些优势、不足或潜在问题?下面做一个粗略的总结和分类(注:仅代表个人视角和有限信息,难免有偏差,欢迎理性交流)。
从底层技术和算法视角来看,中国大模型行业的大致分布是:
第一档:字节、阿里、DeepSeek
字节虽然没有在第一时间押中大模型赛道,早期技术和人才储备也并不突出,但胜在有钱、动作快、组织架构灵活激进。直接成立了专注算法基建的 Seed 和专注产品的 Flow,并且是直连 CEO 的重点项目。经过两年多的追赶,无论是大模型算法还是 To C 产品,字节都已经稳居国内第一梯队。
从工作机会的角度看,字节大模型相关部门中,Seed 有钱、有卡、有项目,给求职者(包括校招生)开出的职级和薪资也相对更有竞争力,同事里大模型算法大牛也非常多。在大模型产品创新上,豆包输入法、豆包 AI 助手等也都在积极试水。
当然,字节 Seed 当前的人才密度极高(某种意义上是“除清北外、清北博士密度最高”的地方之一),整体竞争会非常激烈,内部氛围也会更“卷”。
阿里在大模型业务上,基建部分主要放在通义实验室。虽然周畅已跳槽字节,但在靖人的带队下,以林俊旸为代表的一批青年才俊,依然让阿里在大模型基座上保持着相当领先的位置。淘天、夸克、阿里国际等子集团,在大模型应用算法层面也积累了一定经验。不过,由于阿里职级和薪酬体系相对稳固,要“破格引进”外部人才不太容易,在定级和薪酬上的灵活度、竞争力,相比字节略逊一筹。
在 C 端产品上,夸克和刚刚改名为“千问”的 App(原名通义)是阿里 AI To C 的主力阵地,在业内人士和部分用户心中口碑也不错。
2025 年春节,DeepSeek 一战成名,成为现象级产品,并倒逼大厂在策略和产品上做出调整。但由于 DeepSeek 走的是“贵精不贵多”的人才路线,版本更新节奏也相对偏稳,后续在用户体验和产品热度上,部分维度已经被字节豆包和通义反超。不过,DeepSeek 招聘标准依然非常高,对算法类求职者来说,仍然是值得优先考虑的去向之一。当然,从 To C 产品矩阵角度看,DeepSeek 当下可以说是“产品极少”(目测整个公司产品经理人数也不会太多),更偏技术驱动型公司。
第二档:腾讯、百度、月之暗面、快手
(排名不分先后,腾讯在这一档里略高半级)
作为移动互联网时代的最大赢家之一,腾讯经常被外界认为在 AI 领域“偏保守”,但从实际动作看,腾讯在关键节点上还是比较灵活的。DeepSeek 爆火之后,腾讯元宝是最早引入满血 DeepSeek 模型的主流产品之一。经历组织架构调整、从硅谷持续吸引顶级大模型人才之后,腾讯在大模型基建和算法能力上的差距,有望在短期内快速缩小。同时,腾讯在 C 端产品上的多年积累,也让元宝在用户心中有了一定认知度和信任度。
作为最早喊出 “All in AI” 口号的大厂之一,百度在大模型时代是非常早期的入局者,也在相当长一段时间内保持领先。但现实是,如今百度在体量、现金流和增长空间上,和字节、阿里、腾讯已经有明显差距,在资金和人才投入强度上很难持续硬刚,只能更多依赖内部挖潜和局部发力。
在 AI 六小龙中,月之暗面整体表现相对亮眼,也是当前六小龙里,在国内 C 端大模型产品上发力较多的公司之一。在大语言模型维度,仍保持一定领先。但归根结底,月之暗面仍是一家创业公司,需要依靠融资维持高投入。如果后续上市不顺、融资环境收紧,系统性风险是客观存在的。再加上期权价值的不确定性,对于校招生来说,选择加入月之暗面,风险收益比需要更加谨慎地权衡。
快手的优势在于有一个“可灵”,不利之处在于目前对外声量最大的,基本也就“可灵”这一条线。也就是说,在大模型整体版图里,快手当前主要在多模态大模型方面保持一定话语权和竞争力;在大语言模型、语音等其他方向上公开动作相对较少。所以,对求职者而言,如果想在快手做大模型算法或业务,对口岗位大概率会与“可灵”强相关。当然,快手对算法人才一贯比较重视,在薪资上也具备一定吸引力。
如果从“多模态能力”和“语音交互”等维度再看一层,其实还有一批厂商也值得一提,比如 Minimax、智谱、百度文心多模态线、商汤、昆仑万维天工等。这些团队在语音对话助手、音视频大模型、Agent 平台等方向上,都有各自的技术积累和产品探索。只是相较于上文提到的字节 / 阿里 / 腾讯 / DeepSeek 等,它们在 C 端消费级品牌心智上的声量略小一些,更多还是被业内人士关注。
第三档:蚂蚁、美团、小红书、京东、滴滴等
蚂蚁是大厂中涉足大模型相对较早的一批,旗下有“百灵”大模型以及刚刚上线的“灵光” App。但从 C 端用户视角来看,“互联网 + 金融”这个赛道的整体存在感,相比纯内容或社交平台还是偏弱一些。
美团在大模型上的投入整体偏稳健,早期以尝试 C 端“轻量级”应用为主。虽然今年发布了 “Loong Chat”,但在大众层面几乎没有掀起太大水花。同时,美团在主营业务上正遭遇京东、淘宝等的强势竞争,不得不将大量资源继续投入到外卖和本地生活主战场。
除此之外,京东、小红书等公司虽然也陆续发布了自己的大模型相关产品,但整体仍以应用层探索为主,规模和投入都更偏“小步慢跑”。一方面是利润体量暂时不足以长期支撑每年数百亿甚至上千亿级别的持续投入;另一方面,大模型在这些业务里的核心战略地位,目前仍在探索和博弈中。至于滴滴,除在官网上可以看到持续招聘大模型人才外,对外高曝光度的落地产品目前还比较少见。
写在最后:格局已定,选择比努力更重要
总体来看,2025 年中国大模型行业的基本格局已经成型:头部玩家之间的竞争会越来越激烈,而中腰部玩家则需要找到清晰的差异化定位,才能在这个赛道上长期生存和发展。
对于求职者来说,选择一个有前景、有资源、有人才密度、也愿意给机会的平台,是进入大模型行业的关键一步。具体怎么选,取决于你更看重:
- 技术平台和成长速度;
- 薪酬回报和短期收益;
- 风险偏好与期权预期;
- 以及你自己未来 3~5 年的职业规划。
不同角色的求职建议(校招 & 社招)
最后补充几条更细一点的求职建议,按角色简单拆一下:
- 算法 / 研究岗:如果你是博士 / 硕士,科研基础扎实,有顶会论文或大模型相关实习,第一梯队(字节 Seed、阿里通义实验室、DeepSeek 等)通常是首选,这些团队对“论文 +工程 + 业务”的综合能力要求更高,但能接触到的算力、数据和项目也最顶。校招时可以优先冲刺这些团队,再把第二档(腾讯混元 / 元宝、百度文心、月之暗面等)作为稳妥兜底。
- 工程 / Infra 岗:更适合去有完整业务闭环、工程体系成熟的大厂,比如字节、阿里、腾讯、美团、百度等。大模型时代的“工程”不只是写 API,而是包括推理服务、高性能分布式训练、调度平台、数据平台等,选 offer 时可以重点看:有没做大规模线上服务、有没 close-loop 的业务场景,而不是只做“配合型开发”。
- 产品岗:如果想做大模型产品,优先找“真有 C 端 / B 端用户”的团队,而不是只有 Demo 的研究组。字节豆包系、阿里的千问 / 夸克、腾讯元宝、月之暗面、DeepSeek、快手可灵、小红书等,都在不同程度上有真实用户反馈。对产品来说,“能和算法团队高频协作”“能接触真实数据和增长目标”,往往比“模型参数多大”更重要。
- 运营 / 商业化 / 行业解决方案:这类岗位更看重对行业的理解和 To B 推进能力,适合有传统行业背景、又想切入 AI 的同学。可以重点关注阿里云、腾讯云、百度智能云、字节火山引擎等云厂商的大模型解决方案团队,以及部分行业大客户导向的创业公司。
无论是校招还是社招,进入这一轮大模型浪潮,除了“拿到好 offer”,更重要的是:
- 能不能在 1~2 年内真正参与到有挑战的核心项目,而不是长期停留在外围配合;
- 能不能跟一批你认可的同事一起做事,从他们身上快速“提级”;
- 能不能把这段经历沉淀成可对外讲清楚的项目闭环,而不是“我也在大厂大模型部门上过班”。