系统内核工程师(Linux Kernel / OS) 北京、上海 社招 全职 研发 - 基础架构 职位描述 我们正在寻找具备深厚 Linux 内核与操作系统工程能力的系统工程师,负责 AI 基础设施中内核层的研发、优化与问题治理。你的工作将覆盖进程调度、内存管理、文件系统、网络协议栈、安全隔离等内核核心子系统,面向大模型训练/推理、AI Agent 执行环境(Sandbox)、大规模集群等真实场景,从 OS 层提供性能、稳定性和安全性的底层支撑。你将参与1. Linux 内核核心子系统研发与优化:围绕进程调度、内存管理、文件系统、块 IO、网络协议栈等方向,分析并解决 AI 基础设施场景下的性能瓶颈,提升系统吞吐与时延表现。2. 内核级安全隔离机制设计与实现:基于 namespace、cgroup、seccomp、capabilities、eBPF、AppArmor/SELinux 等内核机制,构建进程隔离、系统调用过滤、资源访问控制和逃逸防护能力,支撑 Agent Sandbox、容器运行时、多租户环境等场景的安全需求。3. OS 层资源调度与管控:设计和优化面向多任务、多租户、高并发场景的 CPU 调度策略、内存分配与回收机制、IO 调度和网络资源管控,保障大规模工作负载下的资源公平性与隔离性。4. 内核级问题定位与治理:定位并解决复杂的内核级性能、稳定性及兼容性问题,包括死锁、内存泄漏、性能抖动、资源竞争、内核崩溃等,具备从现象到根因的完整排查能力。5. OS
Ubuntu is the most widely used Linux distribution in the world, delivering kernels across a vast matrix of versions, architectures, and configurations – with up to 15 years of security and maintenance commitments for Long Term Support
Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: Company Overview Qualcomm is a company of inventors that unlocked 5G ushering in an age of rapid acceleration in connectivity and new possibilities that
机器学习系统工程师(应届) 北京 正式 研发 - 基础架构 职位描述 1、负责构建支撑具身智能体的核心机器学习系统,开发面向机器人场景的VLA大模型训练与推理系统,支撑多模态感知、运动控制、任务规划等核心能力的持续进化;2、研发新一代具身智能系统工具链,涵盖数据采集、仿真训练、物理部署、持续优化全生命周期。 职位要求 1、计算机、人工智能、软件工程等相关专业,硕士及以上学历,2026年毕业; 2、熟练使用C++/Python/Pytorch/CUDA开发生态,具有嵌入式系统开发经验者优先;3、加分项:在以下一个或多个领域有深度实践: a. 大模型训练推理:多模态大模型分布式训练、端上推理加速、Transformer模型优化; b. 高性能计算:GPU Kernel编写,高性能通信(NCCL、RDMA),AI编译器(TVM、Triton),模型量化等; c. 机器人系统:ROS2、运动控制算法、传感器数据处理pipeline。 投递...
AI Infra实习生 北京 实习 研发 - 基础架构 职位描述 1、负责构建支撑具身智能体的核心机器学习系统,开发面向机器人场景的VLA大模型训练与推理系统,支撑多模态感知、运动控制、任务规划等核心能力的持续进化;2、研发新一代具身智能系统工具链,涵盖数据采集、仿真训练、物理部署、持续优化全生命周期。 职位要求 1、计算机、人工智能、软件工程等相关专业,硕士及以上学历,2026年及之后毕业; 2、熟练使用C++/Python/Pytorch/CUDA开发生态,具有嵌入式系统开发经验者优先;3、能至少保障3个月以上的实习时间,每周4天以上出勤;4、加分项:在以下一个或多个领域有深度实践: a. 大模型训练推理:多模态大模型分布式训练、端上推理加速、Transformer模型优化; b. 高性能计算:GPU Kernel编写,高性能通信(NCCL、RDMA),AI编译器(TVM、Triton),模型量化等; c. 机器人系统:ROS2、运动控制算法、传感器数据处理pipeline。 投递...
Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: Role Summary We are seeking a AI solution Software Engineer focused on end-to-end latency optimization across heterogeneous compute IPs (GPU, NPU, ISP, CPU). You
Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: General Summary Qualcomm is leveraging its expertise in wireless and computing technologies to drive a major technological revolution in the automotive industry. Having led
具身智能算法实习生(训练效率方向) 上海 实习 职位描述 1. 参与具身智能训练效率的度量、分析与系统性优化,覆盖预训练与后训练全链路。2. 理解不同模型架构与训练算法的计算特性,参与针对性优化方案的设计与实现。3. 参与训练效率监控体系建设,包括 GPU 利用率、训练吞吐、通信效率等核心指标的可视化与自动化追踪。4. 参与模型训练效率优化:算子融合、CUDA graph、kernel 调优等。5. 参与并行与通信效率优化:梯度同步、云边通信、权重分发等通信开销分析与优化。6. 参与数据加载效率优化:数据预处理 pipeline、IO 吞吐优化。 职位要求 计算机、AI 等相关专业硕士在读或优秀本科生。- 熟悉 Python/C++,有 CUDA 编程经验或 GPU 性能调优兴趣。- 对深度学习模型架构与训练算法有基本理解,愿意深入学习计算特性与优化方法。- 具备良好的工程意识与代码规范。- 实习 3 个月以上优先,能长期实习更佳。加分项- 有 CUDA graph / 算子融合 /
Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: Responsibilities We’re looking for skilled senior engineer to develop linux audio drivers on snapdragon SoC based products. You will be responsible for new audio
Tätigkeitsbereich:Forschung & Entwicklung incl. Design Fachabteilung:MBOS Software Architecture & Base Software Gesellschaft:Mercedes-Benz Digital Tech Ltd. Standort:Shanghai, Xingchi Tower, No. 399, Keqiao Road, Jinqiao, Pudong Startdatum:sofort Veröffentlichungsdatum:26.05.2026 Stellennummer:MER0003XSU Arbeitszeit:Vollzeit Bewerben Aufgaben Objective: Lead a small-scale outsourcing engineer
NVIDIA is seeking for an experienced Software Engineer with a strong background in networking and virtualization technologies. This full-time position requires close collaboration with other NVIDIA SW and SW architecture teams, pre-sale teams and different industry
Key Responsibilities Inference Platform & Optimization: Build and optimize enterprise LLM serving platforms (e.g., vLLM, TensorRT-LLM) using techniques like PagedAttention, continuous batching, and quantization (AWQ/FP8) for high throughput and low latency. GPU Pooling & AI Infra:
Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: As part of the Qualcomm China engineering team focused on Robotics, Drones, Wearable, and Action Camera products, we are looking for a technically strong
NVIDIA has been transforming computer graphics, PC gaming, and accelerated computing for more than 25 years. It’s a unique legacy of innovation that’s fueled by great technology—and amazing people. Today, we’re tapping into the unlimited potential
Are you excited about building world-class quality systems for advanced GPU software? Do you enjoy combining automation, product validation, and code analysis to support fast-moving compiler and kernel innovation? We are seeking a strong test engineer to
Agent Sandbox 系统工程师 北京、上海 社招 全职 研发 - 基础架构 职位描述 我们正在构建面向 AI Agent 的 Sandbox 基座,为 Agent 提供安全、可控、可观测、可复现的执行环境。系统需要覆盖浏览器自动化环境、容器运行环境、Kubernetes 集群、虚拟机环境、物理机集群等多种资源形态,并在操作系统和内核层面提供坚实的隔离、调度与安全能力支撑。这个岗位的核心定位是:用 Kernel 和 OS 层的底层能力,解决 Agent Sandbox 场景中的隔离执行、资源管控、安全防护和性能优化问题。你既需要理解 Agent 执行环境的上层需求,也需要深入内核与操作系统层面设计和实现关键机制。你将参与1. Sandbox 资源层架构设计与实现:覆盖容器、Kubernetes、虚拟机、浏览器自动化环境、物理机集群等执行资源的统一抽象,提供一致的环境初始化、生命周期管理、资源限额、状态回收和故障隔离能力。2. 内核级安全隔离机制建设:基于 cgroup、namespace、seccomp、AppArmor/SELinux、eBPF 等内核机制,构建 Agent 不可信代码的执行隔离、系统调用过滤、资源访问控制和逃逸防护能力。3. OS 层资源调度与性能优化:针对多
Job Posting Title:Senior Web Developer Req ID:10151651 Job Description: Job Summary We are seeking a skilled and experienced technical engineer to join our APAC Product and Technology team. As a technical engineer, you will play a
MiMo算法研究员-预训练 北京 社招 全职 职位 ID:A180229 职位描述 我们在做什么?核心预训练(Core Pre-training)我们不仅是在训练模型,更是在探索智能的本质边界。我们致力于从零构建下一代通用的智能基座:1. Backbone & Architecture - 下一代基座:Model size scaling & context length scaling - 原生多模态:设计文本、视觉、音频原生融合的统一架构,实现端到端的物理世界感知与推理。 - Co-design:坚持 Algorithm-Infra Co-design,结合底层硬件特性(Kernel/拓扑)设计架构,突破训练与推理的效率瓶颈。2. Data - 真实数据 scaling:建设超大规模多模态数据发掘、采集、清洗与配比流水线,覆盖所有人类已有数据。 - 合成数据 scaling:攻克高质量合成数据的生成与验证难题,解决数据稀缺性,提升数据知识密度、推理密度、推理长度。3. Optimization - 极致收敛:研发适应万卡集群、超大 Batch
VLA训练infra算法工程师 - XiaomiRobotics 北京 社招 全职 职位 ID:A243642 职位描述 1. 基于 PyTorch 生态(FSDP / DeepSpeed / Megatron 等)设计并实现 VLA 模型的分布式训练方案(DP / TP / PP / MoE),构建稳定高效的训练框架2. 推动混合精度(BF16 / FP8)与算子融合(FlashAttention / Triton kernel)3. 构建高吞吐数据pipeline,设计数据格式与 shard 策略,实现高效的数据加载4. 支持大规模实验追踪、管理、指标可视化 职位要求
We are now looking for a Deep Learning Performance Software Engineer! We are expanding our research and development for deep learning. We seek excellent Software Engineers and Senior Software Engineers to join our team. We specialize