软件工程师 - pytorch训练框架国产芯片适配北京全职职位描述将前沿的端到端自动驾驶等模型训练，在国产GPU训练芯片上进行适配，并管理大规模训练集群。在这个岗位上，你会负责：1. 把基于Nvidia GPU的pytorch训练，迁移到阿里平头哥等国产训练GPU上；2. 把基于CUDA实现的自定义算子，迁移到国产训练GPU上；3. 把pytorch中的一些复杂算子，迁移到国产训练GPU上；4. 深入分析国产GPU训练芯片的设计和软件接口，充分挖掘GPU性能；5. 深入了解自动驾驶领域的各类前沿模型设计，深入分析模型训练瓶颈；6. 管理大规模训练集群，提升GPU利用率。职位要求 1. 有把pytorch训练任务，从Nvidia迁移到阿里平头哥等某一家国产训练GPU的经验；2. 精通某一家国产训练GPU训练框架；3. 熟悉GPU设计理念，熟悉CUDA编程；4. 熟悉pytorch训练框架，能够分析训练性能瓶颈；5. 优秀的python、GPU编程能力。加分项：1. 有过GPU自定义算子的开发经验。投递...

Premium Full-time

Pony.ai 25 days ago

AI Research Scientist 大模型研究科学家

Canva ( Beijing ) +1 other locations

Company Description 该岗位现面向所有经验阶段的候选人开放，包括社会招聘、应届毕业生，同时开放实习生岗位。工作地点为北京。欢迎申请，期待你的加入！ Notice: This position is open to candidates at all experience levels, including experienced candidates, graduates, as well as internship opportunities. The role is based in Beijing. We welcome your application and look forward

Premium Internship Interpreting AI Novel Synthetics Emerging Technologies

Canva 28 days ago

Upload Your Resume — Let employers contact you directly

AI Software Engineering Intern

Intel ( Shenzhen )

Job Details: Job Description: Join Intels Technical Enablement Group (under Sales Marketing Group), Client ADC team as an AI Software Engineering Master Intern. In this role, you will focus on the development and enablement of Agentic

Premium Full-time Knowledge Sharing Business Alliances PyTorch Python Usability

Intel 28 days ago

端到端大模型算法工程师(Mstar)

Momenta ( Shanghai )

端到端大模型算法工程师(Mstar) 北京、苏州、上海正式技术 - 软件工程职位描述 1. 设计并实现端到端智驾大模型，整合感知、规划与决策功能，提升模型的整体性能与效率；2. 运用深度学习、强化学习、机器学习等技术，优化模型结构，提高模型对复杂驾驶场景的理解和应对能力；3. 负责收集、标注和处理自动驾驶相关数据，构建高质量的数据集，为模型训练提供有力支持；4. 利用数据增强、迁移学习等方法，提升数据利用效率，优化模型的泛化能力；5. 跟踪自动驾驶和人工智能领域的最新研究成果，探索新技术在端到端大模型中的应用可能性。职位要求 1. 计算机、软件工程、机器人、自动化等相关专业硕士及以上学历；2. 具备数据驱动算法的研发能力，熟练相关技术栈，包括C++、Python，某种训练框架，如PyTorch；3. 掌握相关领域的基础知识，算法基础(机器学习、深度学习、强化学习等)、数理基础；4. 具有相关领域(如CV、NLP、PNC都可)的论文发表、业务研发经验。 Mstar专项招聘计划旨在招聘改变世界的顶尖人才，重塑未来人类出行方式。如果你是竞赛大牛、学术达人、工程达人、超级学霸，欢迎应聘！改变世界，百万年薪；超越智驾摩尔定律的世界级难题；全球化研发资源、大牛导师、十倍速成长！投递...

Premium Full-time

Momenta 28 days ago

大模型应用开发工程师-北京

Z.ai ( Beijing )

大模型应用开发工程师-北京北京全职互联网 / 电子 / 网游职位描述 1、金融业务场景AI落地：深入理解银行信贷风控、反欺诈、客户画像、智能投顾等业务逻辑，设计并开发AI解决方案，推动数据驱动的业务决策。与业务部门协作，将金融需求转化为AI模型开发任务，确保技术方案贴合实际业务场景。2、大模型微调与优化：负责GPT、LLaMA等主流大语言模型的领域适配微调，结合银行私有数据优化模型性能。应用Prompt工程、RAG（检索增强生成）技术提升模型在金融文本生成、合规审查等任务中的准确率。3、AI Agent与智能体开发：设计并实现基于大语言模型的智能体(Agent)系统架构，包括任务理解、规划、执行和反馈循环等核心模块。熟练运用Function Calling/Tooling机制，将模型能力与内外部API、工具和服务进行安全、可靠的集成。4、机器学习全流程开发：主导从数据清洗、特征工程、模型训练（机器学习/深度学习）到部署上线的全流程，覆盖监督学习、无监督学习及强化学习等场景。优化高并发金融场景下的模型推理效率，应用模型压缩、分布式计算等技术。5、Vibe Coding与AI辅助开发：遵循Vibe Coding理念，高效利用AI辅助开发工具（如Claude Code、Cursor等）提升编码效率和质量，负责对AI生成的代码进行严格的审查、重构和测试。6、跨部门协作与技术赋能：协同算法团队、产品经理及风控部门，确保AI项目按时交付，并编写技术文档推动知识沉淀。职位要求 1、基础要求 -计算机科学、人工智能、金融工程等相关专业本科及以上学历，3年以上AI项目开发经验。-精通Python，熟悉Java，具备扎实的编程能力和算法基础。-熟悉主流深度学习框架（PyTorch/TensorFlow），具备大模型部署经验。2、技术能力 -大模型技术栈：熟悉LangChain、LlamaIndex等大模型应用开发框架，掌握Prompt Engineering、RAG、Agent等核心技术。-向量数据库：熟悉向量数据库（如Milvus、FAISS、Pinecone）的使用和优化。-分布式系统：熟悉分布式系统设计，具备模型部署（云平台AWS/Azure或边缘设备）及性能优化经验。-工程化能力：熟悉Docker容器化技术、Git版本控制以及CI/CD流程，具备独立将应用部署到云环境的能力3、金融业务理解 -熟悉银行风控、客户分析、智能营销等业务逻辑，有金融科技项目经验者优先-具备信贷风控、反欺诈、智能投顾等场景AI模型落地案例者优先4、加分项 -熟悉金融知识图谱构建、智能投顾系统开发。-具备AI Agent框架（如LangChain）、金融领域多模态交互开发经验。-有构建复杂Agent或Multi-Agent系统的实践经验。-在NeurIPS/ICML等顶会或GitHub高星项目有成果。5、软性素质 -强大的跨部门沟通能力，能将技术术语转化为业务语言。-对AI在金融领域的创新应用有热情，能快速学习新技术并解决复杂问题。-具备良好的团队合作和沟通能力，能够在压力下工作。投递...

Premium Full-time

Z.ai 28 days ago

大模型算法工程师- 金融行业应用

Z.ai ( Beijing )

大模型算法工程师- 金融行业应用北京全职互联网 / 电子 / 网游职位描述我们团队专注于将GLM系列大型模型推向商业市场，服务于中央企业、国有企业、金融机构、能源行业等高端企业客户。我们致力于帮助这些客户迅速搭建起新一代人工智能的平台架构，培育技术力量，并实现场景化的应用部署。依托于我们构建的企业级原生大模型应用开发平台，我们为用户提供了一系列专业化的产品与服务，覆盖音视频智能分析、多源异构知识整合管理、项目全生命周期研发支持、零代码的大模型应用快速开发，以及客户关键业务流程的智能化应用等多个领域。我们的目标是通过提升企业的运营效率，推动客户智能化转型，从而为企业带来更加深远的价值增长。岗位职责：1、负责大模型的研究和应用，包括但不限于LLM、SFT、Agent/MultiAgent、 Tool Learning、RAG、RLHF等技术探索，研究前沿模型训练和优化方法，开发国际顶尖级大模型；2、根据业务场景需求设计微调方案、适配算法和调优工程方案；3、参与智谱AI的行业大模型语料知识库建设和训练语料优化，知识图谱、知识FAQ、知识增强大模型等基础算法方向；4、研究和跟踪前沿技术发展，探索AI在助力数字民生服务普惠和智能化方面的新方法和新范式，推动相关领域技术创新。职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域；2、具有大模型应用经验，丰富的深度学习经验，熟悉常见的深度学习框架（如TensorFlow、PyTorch等）；4、在预训练语言模型（如LLAMMA，GPT等）的设计、训练和优化方面有实际项目经验者优先；5、出色的问题解决能力和创新能力，能够解决复杂的技术挑战；6、良好的团队合作和沟通能力，能够与跨职能团队合作，推动项目进展；7、良好的英文读写能力，能够阅读和理解相关的研究论文和文档；8、发表过相关领域的学术论文或专利者优先。投递...

Premium Full-time

Z.ai 28 days ago

Get Hired 2x Faster
Connect with Top Employers Directly

AI院-GLM团队-预训练算法工程师

Z.ai ( Beijing )

AI院-GLM团队-预训练算法工程师北京全职研发 - 算法职位描述职位描述1. 参与数学或代码大模型预训练的研发工作，包括模型的预训练、对齐和评测等2. 负责构建和优化数学或代码的预训练和对齐数据，提升模型在数学或代码任务上的效果3. 探索针对数学或代码任务的数据合成方法，提升模型在数学或代码任务上的泛化能力职位要求职位要求1. 自然语言处理、机器学习等相关专业，硕士及以上学历；2. 较强的算法开发能力，熟悉常用的机器学习、深度学习算法；3. 熟练使用Pytorch、Huggingface、DeepSpeed等框架；4. 对Transformer的架构有较为深入的理解，了解Transformer的各种变体，有相关的研究经验者优先；加分项：1. 在ACL，NeurIPS，ICLR，EMNLP等顶级会议或期刊上发表过论文者优先；2. 熟悉并行训练框架，有多机多卡训练经验者优先；3. 熟悉CUDA编程/Triton编程，有相关算子加速经验者优先；投递...

Premium Full-time

Z.ai 28 days ago

AutoGLM-Agent算法工程师

Z.ai ( Beijing )

AutoGLM-Agent算法工程师北京全职互联网 / 电子 / 网游职位描述 1. 负责大模型智能体相关的基础性和应用性算法开发和调优，包括任务定义，数据构造，SFT/RL 等算法设计开发，以及智能体能力评测；2. 跟进工业界/学术界最新动态，在骨干模型上实现和尝试新的算法和方案，开发包括 API 调用、GUI 智能体、Function Call 等新的 LLM 系统性应用；3. 在专业领域和应用场景适配基座模型，并取得专用领域的良好表现；职位要求 1. 统招硕士及以上学历（优秀者本科亦可），有较强的算法和工程能力，熟练掌握 PyTorch、DeepSpeed、Megatron、VeRL、OpenRLHF框架，有文本/多模态大模型的强化学习训练经验；2. 良好的沟通能力和跨团队协作能力，表达能力清晰，善于与人沟通；3. 有良好的自我驱动能力，能快速推进新任务的完成；对于新技术的学习抱有热情，有持续自我学习和提高的意识和能力；4. 在 ICML、NeurIPS、ICLR、ACL、EMNLP、KDD 等人工智能顶级会议或期刊上发表论文，取得过 ICPC、NOI、ACM 等比赛奖项者优先；5. 在大模型相关岗位有实习和工作经验者优先；6. 有超算经验和大规模分布式计算知识和经验者优先；投递...

Premium Full-time API

Z.ai 28 days ago

AI 院-MOE 训练/推理Infra工程师

Z.ai ( Beijing )

AI 院-MOE 训练/推理Infra工程师北京全职互联网 / 电子 / 网游职位描述我们正在寻找一位经验丰富的 MOE 训练/推理 Infra 开发工程师，负责设计、实现并优化我们的 MOE（Mixture of Experts）训练和推理框架。该职位需要您具备扎实的分布式系统、高性能计算、深度学习框架以及硬件加速优化的相关知识，能够解决 MOE 训练和推理过程中的各种技术难题，并与算法团队紧密合作，确保算法的顺利实现。主要职责：1、设计并实现高效的 MOE 训练/推理框架：•设计并开发支持大规模分布式训练和推理的 MOE 框架，确保其在各种硬件配置下的高效运行；•优化训练和推理性能，通过算法优化、并行计算、缓存策略等方式，缩短训练和推理时间，提高效率；2、解决 MOE 训练/推理过程中的技术难题：•针对专家网络的选择问题，研究和实现有效的专家选择算法，确保模型在训练和推理过程中的稳定性和准确性；• 解决负载均衡问题，通过动态调整专家网络的负载分配，提高系统资源的利用率，避免过载或空闲状态；• 优化通信过程，减少分布式训练和推理中的通信开销，提高数据传输效率，缩短训练和推理时间3、与算法团队密切合作：•与算法团队保持密切沟通，了解算法需求，根据需求调整和优化训练和推理基础设施，确保算法的顺利实现；•跟踪业界最新技术动态，引入适合项目需求的新技术、新方法，提升团队整体技术水平；职位要求关键技能：分布式训练技术：•掌握分布式训练框架（如 Horovod、PyTorch Distributed）的使用和优化。•具备设计和实现高效分布式训练系统的能力。硬件加速优化：•熟悉 GPU、TPU 等硬件架构，能够进行硬件级性能调优。•了解 CUDA、cuDNN 等相关技术，能够利用硬件加速提升训练和推理效率。模型优化技术：•了解量化、剪枝、压缩等模型优化方法，以提升推理效率•能够在实际项目中应用这些技术，优化模型大小和推理速度•负载均衡与通信优化•能够设计高效的负载均衡策略和通信机制，以应对

Premium Full-time MOE Linux AI

Z.ai 28 days ago

大模型算法实习生

Z.ai ( Beijing ) +1 other locations

大模型算法实习生北京实习互联网 / 电子 / 网游职位描述 1. 大模型训练与优化： - 参与大规模语言模型（LLM）的预训练、微调、对齐（Alignment）及性能优化（如SFT、DPO、RLHF等）。 2. 应用场景落地： - 结合业务需求（如对话系统、内容生成、ChatBI、Agent），熟练运用不同训练方法解决实际问题，有实际项目经验者优先。3. 前沿技术研究： - 跟踪大模型领域最新论文（如Transformer架构改进、多模态融合、Agent技术等），复现并验证创新点。 4. 经验总结： - 协助撰写技术文档、报告职位要求必需项： 1. 技术基础： - 熟悉Python和主流深度学习框架（PyTorch/TensorFlow）。 - 掌握NLP基础知识（如Transformer/BERT/GPT等模型原理）。 2. 经验要求： - 有NLP相关项目经验。3.

Premium Full-time

Z.ai 28 days ago

AI院-GLM团队-后训练算法工程师

Z.ai ( Beijing )

AI院-GLM团队-后训练算法工程师北京全职研发 - 算法职位描述我们正在寻找充满激情和创造力的你，加入我们与大模型领域领军企业合作的前沿项目！你将有机会参与到行业领先的模型研发中，共同推动大模型技术在真实的、知名的、有影响力的应用的边界。【希望你可以承担以下工作】1、数据艺术的缔造者：针对模型特定能力进行数据构造、筛选和优化，特别是在数学、代码、复杂推理等领域的特定数据筛选和合成；并负责对齐数据的质量和多样性控制，让数据成为模型进化的沃土。2、思维链的延伸者：探索模型如何通过更长的思维链推理，在复杂任务上取得更优的效果，并提升post-training阶段训练和推理的扩展能力，让模型拥有更强大的逻辑推理能力。3、强化学习的优化师：提升算法的可扩展性和稳定性，优化后训练 scaling 性能；优化多目标奖励模型，并探索结合CoT和过程监督来优化奖励模型，让强化学习算法更高效、更稳定。4、对齐范式的创新者：结合模型监督、self-improve 等进行训练优化探索；攻克交互任务复杂推理难题；让模型的理解和生成能力更上一层楼。职位要求【我们需要这样的你】1、0-5 年经验，高潜人才：拥有自然语言处理、机器学习、计算机视觉等相关专业背景，硕士及以上学历，我们相信经验不是唯一的衡量标准，潜力同样重要。2、算法高手：具备较强的算法开发能力，熟悉常用的机器学习、深度学习算法，能够将理论转化为实践。3、框架专家：熟练使用Pytorch、Huggingface等框架，让技术成为你挥洒创意的工具。4、Transformer 深度理解者：对Transformer的架构有较为深入的理解，了解Transformer的各种变体，有相关研究经验者优先，让我们一起探索Transformer的更多可能。5、翻译、多语言项目参与者：参加过大模型翻译、多语言项目加分。【我们提供】1、前沿的技术视野：置身于大模型技术发展的最前沿，与行业顶尖团队并肩作战。2、有影响力的项目：参与到具有挑战性并且有知名度、影响力的项目中，发挥你的最大潜力。3、完善的成长体系：提供完善的培训体系和职业发展路径，助力你的个人成长。4、有竞争力的薪酬：提供具有市场竞争力的薪酬和福利待遇。【我们期待你的加入！】投递...

Premium Full-time

Z.ai 28 days ago

AutoGLM-算法实习生

Z.ai ( Beijing )

AutoGLM-算法实习生北京实习互联网 / 电子 / 网游职位描述部门介绍我们是一支专注于 AIAgent 研发创新的技术与产品团队——智谱 AutoGLM。团队成员来自多所国内外知名高校，覆盖人工智能、数据科学、软件工程等多个领域，具备丰富的算法创新研究、智能系统设计和产品落地经验。我们致力于打造智能、通用、可拓展的 AIAgent 应用产品与解决方案，赋能多领域行业的智能升级，为使用者带来全新的人机交互体验。目前，基于技术团队在语言模型、多模态模型和工具使用等多方面努力的成果，AutoGLM 的使用场景覆盖手机、电脑、网页等多端设备，涵盖生活提效、深度研究等多个领域方向，并且能力持续提升中。同时，我们也等在内的多个领域客户展积极开展深入合作，不断推动产品的商业化落地与实际业务的深度融合。AutoGLM 算法实习生（Agent方向）岗位职责：1、参与大模型智能体相关的基础性和应用性算法开发和调优，包括任务定义，数据构造，SFT/RL 等算法设计开发，以及智能体能力评测；2、跟进工业界/学术界最新动态，在骨干模型上实现和尝试新的算法和方案，开发包括 API 调用、GUI 智能体、Function Call 等新的 LLM 系统性应用；3、在专业领域和应用场景适配基座模型，并取得专用领域的良好表现；任职要求：1、统招硕士及以上（优秀者本科亦可）在读，有较强的算法和工程能力，熟练掌握 PyTorch、DeepSpeed、Megatron、VeRL、OpenRLHF框架，有文本/多模态大模型的强化学习训练经验；2、良好的沟通能力和跨团队协作能力，表达能力清晰，善于与人沟通；有良好的自我驱动能力，能快速推进新任务的完成；对于新技术的学习抱有热情，有持续自我学习和提高的意识和能力；3、在 ICML、NeurIPS、ICLR、ACL、EMNLP、KDD 等人工智能顶级会议或期刊上发表论文，取得过 ICPC、NOI、ACM 等比赛奖项者优先；4、在大模型相关岗位有实习经验者优先；5、有超算经验和大规模分布式计算知识和经验者优先；职位要求 - 投递...

Premium Full-time API

Z.ai 28 days ago

AI院-GLM后训练团队-算法工程师（社招）

Z.ai ( Beijing )

AI院-GLM后训练团队-算法工程师（社招）北京全职互联网 / 电子 / 网游 - 研发职位描述 1. 高阶推理能力提升：针对DeepResearch、CodeAgent等复杂推理任务开发专门的能力提升方案；探索长思维链推理机制，提升模型在Agent相关任务上的表现和泛化能力；2. 复杂推理训练扩展性研究：探索模型通过长思维链推理在Agent相关任务上的效果提升；实现不同- Agent任务间的能力迁移和扩展3. 对齐训练范式探索：探索新型对齐训练范式，整合多类型监督信号进行训练优化；研究不同监督条件下的训练可扩展性，推动后训练效果向预训练scaling效果靠拢4. 对齐数据构造与优化：针对特定能力领域（数学、代码、复杂推理等）进行数据构造、筛选和优化；设计数据合成策略，控制对齐数据的质量和多样性职位要求【职位要求】1. 985高校计算机、电子、自动化等相关专业硕士或博士学位(优秀本科生亦可考虑)；1-3 年工作经验，或以上。2. 深入理解常用的大模型算法；具备后训练及数据处理相关项目经验者优先3. 在CCF-A类会议发表过相关论文者优先考虑4. 熟练运用Pytorch、transformers、megatron等主流框架5. 工作态度认真负责,具备良好的团队协作能力【加分项】6. 在ACL，NeurIPS，ICLR，EMNLP，ICML等顶级会议或期刊上发表过论文者优先；7. 熟悉并行训练框架，有多机多卡训练经验者优先。投递...

Premium Full-time

Z.ai 28 days ago

大模型应用算法工程师

Z.ai ( Beijing ) +1 other locations

大模型应用算法工程师北京全职互联网 / 电子 / 网游职位描述【大模型应用算法工程师】—— 驱动生产力变革的AGI探索者我们正在寻找一位对大模型技术充满热忱、追求极致的应用算法工程师，与我们共同探索大模型在生产力场景的无限可能，驱动下一代智能应用的诞生。你将有机会：主导大模型全生命周期技术攻坚：深度参与并大模型微调（SFT/LoRA等）、对齐优化（DPO/RLHF等）全流程，以极致技术追求，不断突破模型性能、效率与鲁棒性的边界，攻克训练与推理中的核心技术瓶颈。定义下一代生产力应用算法范式：独立设计并推动大模型在对话系统、内容生成、智能Agent、端侧多模态等前沿生产力场景的算法方案落地，持续优化准确率、生成质量等核心指标，打造用户极致体验。引领技术前沿探索与创新：敏锐洞察并持续跟踪NLP/LLM领域顶会动态及开源进展，主导Transformer架构改进、多模态融合、AI Agent等前沿技术的探索与预研，将最前沿的技术转化为产品创新的核心驱动力。驱动技术价值规模化实现：与产品、工程等团队高效协同，清晰输出技术方案与实施路径，推动大模型产品从原型验证到规模化商用的全流程落地，实现技术价值的最大化。职位要求我们期望你具备：必需项：硬核编程与框架驾驭能力：精通Python，熟练掌握PyTorch/TensorFlow等深度学习框架，并具备框架底层调优（如算子优化、分布式配置优化）的实战经验。深厚的NLP与LLM理论功底：拥有扎实的自然语言处理基础，深入理解Transformer及主流LLM（如GPT、BERT等）的原理与细节，具备出色的模型设计与优化能力。丰富的大模型研发与落地经验：3年以上大模型研发经验，作为核心成员主导过至少1个完整的大模型从研发到落地的项目，熟悉其中的关键挑战与解决方案。卓越的技术攻坚与问题拆解能力：具备复杂技术问题的系统性拆解能力，能够快速定位并有效解决模型训练、调优或落地过程中的各类瓶颈与难题。出色的跨团队沟通与协同能力：拥有优秀的跨团队沟通技巧，能够清晰、准确地传递技术方案与进展，有效推动多方协同，确保项目高效落地。加分项（若你拥有以下特质，将更具优势）：学术影响力或开源贡献：在NLP/LLM相关顶会（如ACL, EMNLP, NeurIPS, ICML等）发表过高质量论文，或为LLaMA、Alpaca等知名开源项目做出过核心贡献。大规模分布式训练实战：具备DeepSpeed、FSDP等分布式训练框架的大规模实践经验，熟悉千亿级参数模型的训练策略与优化技巧。跨模态或Agent架构经验：拥有跨模态大模型（如视觉-语言模型）或AI Agent（如LangChain等）的架构设计与实际落地经验。如果你对技术有极致追求，渴望将前沿大模型技术转化为改变生产力的实际应用，并乐于在充满挑战与机遇的环境中快速成长，那么我们期待你的加入，一同用技术创造未来！投递...

Premium Full-time

Z.ai 28 days ago

AI技术实习生-深圳

Z.ai ( Wenchang )

AI技术实习生-深圳深圳实习互联网 / 电子 / 网游职位描述 1. 参与大模型全流程技术工作，包括算法适配与调优、推理训练工程优化、国产芯片框架适配等，根据项目需求承担相应模块任务；2. 结合行业场景需求，参与大模型微调工具的设计与开发，协助业务团队完成模型定制化训练，支撑场景化应用落地；3. 跟踪大模型领域算法、工程、硬件适配等方向的前沿技术，参与技术调研与验证，为团队技术选型提供参考；4. 参与团队技术讨论与分享，协助整理项目技术文档，推动团队技术能力共同提升。职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域；2、熟悉常见的深度学习框架，如：Pytorch 等3、了解Megtron，Deepspeed等大模型通用框架；4、了解vLLM，TGI，Transforms等大模型通用框架；5、出色的问题解决能力，良好的owner意识，能够持续推动问题解决；6、良好的团队合作和沟通能力，能够与跨职能团队合作，推动项目进展；7、在预训练语言模型（如Llama，GPT等）的设计、训练和优化方面有实际项目经验者优先。投递...

Premium Full-time

Z.ai 28 days ago

大模型算法工程师- 行业应用

Z.ai ( Beijing ) +3 other locations

大模型算法工程师- 行业应用北京全职研发 - 算法职位描述我们团队专注于将GLM系列大型模型推向商业市场，服务于中央企业、国有企业、金融机构、能源行业等高端企业客户。我们致力于帮助这些客户迅速搭建起新一代人工智能的平台架构，培育技术力量，并实现场景化的应用部署。依托于我们构建的企业级原生大模型应用开发平台，我们为用户提供了一系列专业化的产品与服务，覆盖音视频智能分析、多源异构知识整合管理、项目全生命周期研发支持、零代码的大模型应用快速开发，以及客户关键业务流程的智能化应用等多个领域。我们的目标是通过提升企业的运营效率，推动客户智能化转型，从而为企业带来更加深远的价值增长。岗位职责：1、负责大模型的研究和应用，包括但不限于LLM、SFT、Agent/MultiAgent、 Tool Learning、RAG、RLHF等技术探索，研究前沿模型训练和优化方法，开发国际顶尖级大模型；2、根据业务场景需求设计微调方案、适配算法和调优工程方案；3、参与智谱AI的行业大模型语料知识库建设和训练语料优化，知识图谱、知识FAQ、知识增强大模型等基础算法方向；4、研究和跟踪前沿技术发展，探索AI在助力数字民生服务普惠和智能化方面的新方法和新范式，推动相关领域技术创新。职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域；2、具有大模型应用经验，丰富的深度学习经验，熟悉常见的深度学习框架（如TensorFlow、PyTorch等）；4、在预训练语言模型（如LLAMMA，GPT等）的设计、训练和优化方面有实际项目经验者优先；5、出色的问题解决能力和创新能力，能够解决复杂的技术挑战；6、良好的团队合作和沟通能力，能够与跨职能团队合作，推动项目进展；7、良好的英文读写能力，能够阅读和理解相关的研究论文和文档；8、发表过相关领域的学术论文或专利者优先。投递...

Premium Full-time

Z.ai 28 days ago

AI 院-多模态音频团队-音频生成算法工程师（社招）

Z.ai ( Beijing )

AI 院-多模态音频团队-音频生成算法工程师（社招）北京全职互联网 / 电子 / 网游职位描述 1. 负责agent场景下的多模态理解、生成算法研究、训练、应用，包括但不限于context-aware ASR、指令控制TTS、omni understanding等。2. 负责模型的多机多卡训练、高性能推理等；职位要求 1. 硕士及以上学历，计算机、数学、通信等相关专业；具备良好的学习能力、逻辑思维能力、沟通协作能力；2. 有三年及以上语音合成、语音识别算法经验，或三篇及以上顶会论文（各类CCF-A会、ICASSP/INTERSPEECH等）；3. 熟练使用Python和Pytorch/Tensorflow深度学习框架；4. 对以下至少一种熟悉并有相关经验：1）语音大模型的框架&理论，包括但不限于Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM；2）音频理解大模型/ASR大模型，包括但不限于qwen-audio、sensevoice、whisper等；3）熟悉omni多模态大模型，包括但不限于qwen-omni、mimo-omni、Step‑Audio、Covo‑Audio等；4）有业务落地工程经验优先。投递...

Premium Full-time AI

Z.ai 28 days ago

AI 院-多模态团队-多模态理解算法研究员-强化学习方向

Z.ai ( Beijing )

AI 院-多模态团队-多模态理解算法研究员-强化学习方向北京全职互联网 / 电子 / 网游职位描述【团队介绍】智谱多模态大模型团队是全球领先的多模态研究团队之一，专注于推动视觉语言大模型的认知与推理能力的突破。团队拥有从多模态理解到生成的全栈自研技术体系，依托强大的计算资源和全链路研发能力，持续引领行业创新。团队负责多模态基座模型研发（视觉语言模型+多模态生成模型），先后推出GLM-V系列多模态基座模型，以及GLM-Image、CogView、CogVideo等前沿生成模型。2025年连续发布GLM-4.1V-Thinking、GLM4.5V和GLM-4.6V系列模型，其中GLM-4.1V-Thinking创新性地引入思维链推理机制，采用课程采样强化学习策略，系统性提升模型跨模态因果推理能力与稳定性，在28项业界权威评测中有23项达成10B级模型的最佳成绩(SOTA)；而GLM-4.5V采用MoE架构(总参数106B、激活参数12B)，在100B级视觉推理模型中树立起新的标准，在41个业界主流benchmark上达到同级别SOTA，且OCR、视频理解、AI解题、长文档解读、前端复刻、空间定位与推理等核心能力获得显著提升；GLM-4.6V则在多模态感知和深度推理方面进一步增强，且支持128k long-context、多模态工具调用和图文交错输出，为执行复杂、长程、多模态Agentic任务奠定坚实基础；9B版本的GLM-4.6V-Flash整体表现超过 Qwen3-VL-8B，106B参数12B激活的GLM-4.6V表现比肩2倍参数量的Qwen3-VL-235B。顺应技术发展趋势和业界需求，2026年初团队研发和开源GLM-Image和GLM-OCR。前者是智谱新旗舰图像生成模型，全程基于国产芯片完成训练，采用独创的「自回归+扩散解码器」混合架构，兼顾全局指令理解与局部细节刻画，克服了海报、PPT、科普图等知识密集型场景生成难题，是面向以Nano Banana Pro为代表的新一代「认知型生成」技术范式的一次重要探索。GLM-OCR则是轻量级OCR和文档解析专用模型，以“小尺寸、高精度”树立新标杆，其性能登顶 OmniDocBench，擅长公式、手写体、表格等高难场景，仅 0.9B 参数，推理高效易部署，在HuggingFace上获得超过360万下载量。岗位职责：学科解题方向，负责VLM的混合SFT/RL训练优化及RL训练的数据处理，通过人类偏好学习提升多模态大模型的对齐和推理能力。职位要求 1、统招硕士及以上学历，计算机科学/机器学习/人工智能相关专业；2、0-3年工作经验，在NLP/CV/RL等至少一个AI领域有过深入的研究经历；3、熟悉主流的多模态大模型，能持续跟进学术界和工业界的最新研究和产品；4、熟悉强化学习，有RLHF/DPO训练经验者优先；熟悉Linux,Python,Pytorch和Transformer，了解分布式训练框架如Deepspeed,Megatron-LM等；5、了解对多模态数据（如文本、图像、视频、音频等）的基本处理，能够独立完成数据收集、清洗和构造的pipeline；投递...

Premium Remote Friendly Full-time AI

Z.ai 28 days ago

AI院-GLM后训练团队-推理优化/推理Infra工程师（RL）

Z.ai ( Beijing )

AI院-GLM后训练团队-推理优化/推理Infra工程师（RL）北京全职互联网 / 电子 / 网游 - 研发职位描述 1. 基于SGLang进行大模型推理引擎与服务侧开发，提升吞吐、降低时延与成本，保障线上稳定性。2. 支持RL训练相关的推理链路，包括rollout生成、打分/奖励模型推理等，优化训练闭环效率与资源利用。3. 建设推理侧的监控与性能分析能力，参与线上问题定位与故障处理。4. 与算法/训练团队协作，将模型与训练需求落地到可运行、可维护的推理系统，并输出必要的技术文档。职位要求 1. 熟练使用Python/C++（至少一种），具备良好的工程能力与性能意识。2. 熟悉GPU推理与常见深度学习框架（如 PyTorch），了解分布式通信与并行基本概念（NCCL 等）。3. 了解并使用过SGLang（或能快速上手并承担核心模块开发与调优）。4. 理解RL训练中推理侧的作用，能够与训练流程协同推进落地。5. 具备线上系统排障能力，能通过日志/指标定位性能与稳定性问题。加分项6. 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。7. 有推理性能profiling、算子/运行时优化经验。8. 有MoE模型优化经验。投递...

Premium Full-time

Z.ai 28 days ago

大模型算法框架实习生

Z.ai ( Beijing )

大模型算法框架实习生北京实习互联网 / 电子 / 网游职位描述大模型算法适配与优化：参与主流大模型（如Llama、GPT等）在国产芯片上的算法适配和性能调优，包括模型结构优化、算子优化等；推理与训练工程优化：对大模型的推理和训练过程进行工程化优化，提升性能、降低资源消耗，包括但不限于模型量化、剪枝、蒸馏等技术的应用；国产芯片适配：大模型推理、训练框架（如Megatron、DeepSpeed等）在国产芯片上的适配与优化，解决兼容性问题，充分发挥硬件性能；微调工具链开发：根据不同行业场景需求，设计并实现高效的大模型微调工具链，包括数据预处理、参数配置、效果评估等功能模块；技术方案设计与评估：参与大模型相关技术方案的制定，进行技术可行性评估和性能测试，撰写技术文档。职位要求计算机科学、人工智能、自然语言处理或相关专业本科或硕士在读，每周到岗4-5天，实习3个月以上熟悉至少一种主流深度学习框架（PyTorch优先），熟悉深度学习模型开发全流程；熟悉大模型训练和推理框架，如Megatron、DeepSpeed、vLLM、TGI、Transformers等；具备良好的编程能力，熟练掌握Python/Go/Java/C++，有良好的代码风格和工程实践；出色的问题解决能力和技术攻关能力，具备owner意识，能够独立负责技术模块并推动问题解决；良好的团队合作和沟通能力，能够与跨职能团队高效协作，推动项目进展。【加分项】有国产芯片（如昇腾、寒武纪、海光等）上的模型适配和优化经验者优先；熟悉模型压缩、量化、蒸馏等相关技术并有实践经验者优先投递...

Premium Full-time

Z.ai 28 days ago