“FlagOS开放计算全球挑战赛”是众智FlagOS社区、北京智源人工智能研究院、CCF ODTC联合主办的综合性大赛，设置算子开发、大模型推理优化、自动数据标注三大核心赛道，旨在深度优化大模型性能与效率。

“FlagOS开放计算全球挑战赛”是众智FlagOS社区、北京智源人工智能研究院、CCF ODTC联合主办的一项多赛季、综合性赛事。大赛鼓励开发者基于统一AI系统软件栈FlagOS的能力进行创作实战和创新探索，促进AI开发者能力提升。赛事总奖金池高达200万元，优胜者将共享奖金并获得主办方颁发的荣誉证书。诚邀AI算法与系统工程师、硬件与编译器开发者，以及所有致力于突破AI芯片编程复杂性的技术实践者与梦想家参与挑战，共同推进开放计算生态的蓬勃发展。赛季一将于2026年1月9日启动注册，2026年6月上旬公布最终结果。本赛季聚焦算子开发、大模型推理优化、自动数据标注三大核心赛道，以深度优化大模型性能与运行效率，推动技术落地与行业创新。S1 挑战概览本赛季挑战赛设三大赛道，分别聚焦不同维度的开发能力：赛道一考察算子底层实现与跨平台深度优化能力；赛道二考察全栈推理性能的极致挖掘与系统调优能力；赛道三考察长上下文场景中模型自动数据标注能力。赛道一：基于FlagOS能力，开发大模型算子并提升算子性能本赛道围绕FlagOS体系下通用算子库FlagGems的实际应用需求设计了20道赛题任务，核心考察参赛者的算子实现和性能极致优化能力。组委会将从 “功能正确性、性能竞争力、开源适配性、跨平台兼容性、测例完整度、代码可读性” 六个纬度对提交作品进行量化评分。8 道简单算子题（基础数学 / 通用基础算子）8 道中等算子题（经典深度学习算子）4 道困难算子题（前沿复杂场景算子）赛道二：基于FlagOS体系下大模型多芯片框架，对大模型推理吞吐性能优化本赛道重点考察参赛者/队伍对大模型推理性能的优化能力，要求参赛者在严格保持模型精度与不显著增加时延的前提下，对Qwen3-4B进行极限推理吞吐优化。参赛者需综合利用并行策略、显存管理、计算内核及采样算法等全栈技术，在指定框架与硬件上挖掘最大性能潜力。指定的大模型推理框架 vllm-plugin-FL：https://github.com/flagos-ai/vllm-plugin-FL指定的高性能算子库FlagGems：https://github.com/FlagOpen/FlagGems指定的Qwen3-4B模型赛道三：长上下文场景中大模型自动数据标注本赛道重点考察参赛者的模型应用能力，要求每个参赛者/队伍基于Qwen3-4B模型，使用组委会提供的统一数据集，设计有效的ICL方案进行自动数据标注，并在统一评测数据集上进行推理验证。最终，组委会将以标准化榜单形式统计各参赛者/队伍的评测分数和排行榜。赛事奖金赛道一赛道二赛道三简单算子任务：1000 RMB/个中等算子任务：2000 RMB/个困难算子任务：3000 RMB/个Prize 1: 30000 RMBPrize 2: 20000 RMBPrize 3: 10000 RMBPrize 1: 30000 RMBPrize 2: 20000 RMBPrize 3: 10000 RMB赛程安排赛道一赛道二赛道三报名阶段：1月9日-5月20日开发阶段：2月24日-5月20日评审阶段：“实时评审”，详见赛题一时间安排结果发布：6月上旬报名阶段：1月9日-5月20日算力申请阶段：1月9日-3月11日官方算力评审及发放：3月12日-3月19日开发阶段：3月20日-5月20日评审阶段：5月21日-6月4日结果发布：6月上旬报名阶段：1月9日-5月20日算力申请阶段：1月9日-3月11日官方算力评审及发放：3月12日-3月23日开发阶段：3月24日-5月20日评审阶段：5月21日-6月4日技术报告与代码开源：5月21日-5月31日结果发布：6月上旬赛事须知1.参赛资格和方式参赛对象：欢迎所有对赛事主题感兴趣的个人或团队报名参与。参赛形式：可以个人名义参赛，也可以团队形式参赛，每支团队人数不得超过3人。团队报名时，仅需由一名成员代表填写完整的团队及作品信息即可，切勿多名成员重复提交。每人或每队在整个赛期内仅能拥有一个参赛身份，不得重复报名。参赛者报名前必须填写【报名信息表】：jwolpxeehx.feishu.cn，确保报名信息真实、准确、有效，否则会被取消参赛资格及激励。2.赛道规则每位参赛者（个人或团队）只能选择其中一个赛道提交作品。在任一赛道提交作品后，即视为确认参赛赛道，不可更改。在不同赛道重复提交将被视为无效参赛，主办方有权取消其参赛资格。3.作品提交要求内容规范：参赛作品必须必须遵守普遍认可的国际准则与公序良俗。严禁作品内容包含或涉及安全、色情、民族歧视、宗教歧视、侵犯个人隐私等；赛事主办方有权认定并处理其他任何不适宜在全球公开场合展示或传播的内容。如有骚扰、歧视或其他不当行为将被取消参赛资格，FlagOS社区保留全权取消任何参赛者或参赛团队资格的权利。原创性与版权：参赛作品必须是参赛者（个人或团队）的原创成果，拥有完整的知识产权。严禁任何形式的剽窃、抄袭、盗用他人作品或创意。一经发现核实，将立即取消参赛及获奖资格，并由参赛者承担全部法律责任。作品如使用第三方素材（如开源代码等），须在提交时明确标注出处，并确保已获得合法授权，不侵犯任何第三方的合法权益。组委会提供算力使用要求：专用于比赛相关实验，禁止用于转借、挖矿等与比赛无关任务提交格式与方式：请严格按照官方发布的【每个赛道的具体提交格式】要求准备作品。在规定的提交截止日期前，通过官方指定的通道进行提交。逾期提交或未按格式要求提交的作品，将无法进入评审环节。4.评审和奖项评审将基于各赛道公布的评审标准进行。奖项设置将根据各赛道参赛情况独立评定，具体奖项及奖励发放办法详见后续公告。5.其他注意事项参赛作品一经提交，即视为参赛者同意主办方及其授权单位拥有对作品进行宣传、展示、出版等无偿使用权。参赛者须保证所提交信息的真实性。如有虚假，主办方有权取消其资格。赛事主办方拥有对本次赛事规则及安排的最终解释权。如有任何争议，以主办方解释为准。请各位参赛者仔细阅读以上规则，祝您参赛顺利，取得佳绩！如有疑问，请联系：contact@flagos.io添加小助手+发送“参赛”discord 频道赛事主办方众智FlagOS社区、北京智源人工智能研究院、CCF ODTC

赛题综述随着大模型的发展，算子性能已经成为影响模型吞吐与延迟的关键因素。Triton 作为一种开源的 GPU 编程语言及编译器，兼具跨硬件适配能力与良好的易用性，正逐渐成为产业界与学术界编写自定义算子的主流选择之一。FlagGems 作为聚焦 Triton 生态的开源算子库，旨在为大模型训练推理提供高效、通用、可扩展的算子解决方案，构建活跃且有竞争力的开源生态。本次算子开发赛道以 “赋能开源生态，吸纳核心贡献者” 为核心宗旨，面向开发者搭建技术交流与能力展示平台。本赛道围绕实际开源需求设有20 道不同难度算子开发赛题，覆盖基础数学运算、深度学习高频算子、前沿复杂场景算子三大类，既为新手开发者提供低门槛的开源入门路径，也为资深技术专家预留突破技术边界的探索空间。所有参赛方案将经过社区严格评审，获奖作品将直接纳入 FlagGems 开源库，参赛者同步成为社区正式贡献者，享受贡献者专属权益（如生态 roadmap 参与权、技术资源倾斜等）。本赛道希望通过以赛促建的方式，汇聚全球开发者智慧，丰富算子库的功能覆盖、提升核心性能、强化跨平台适配能力，推动 FlagGems 成为 AI 领域极具影响力的开源算子生态。2. 赛题概览本赛道共设有20 道赛题，按难度与技术考察维度划分，适配不同技术水平的开发者，力求更多开发者加入比赛。难度分布：8 道初级算子题（基础数学 / 通用基础算子）、8 道中级算子题（经典深度学习算子）、4 道高级算子题（前沿复杂场景算子）；设计逻辑：以 “基础实现→性能优化→创新突破” 为核心脉络，从基础数学算子的功能实现，到深度学习高频算子的性能调优与反向传播适配，再到前沿复杂算子的算法创新与场景落地，形成完整的能力考察体系；核心导向：所有赛题均源于 Flaggems 开源生态的实际需求与技术缺口，聚焦通用数学计算、计算机视觉、语音识别、深度学习框架适配等核心场景，确保参赛成果具备直接的开源应用价值；考察维度：兼顾 “功能正确性、性能竞争力、开源适配性、跨平台兼容性、测例完整度、代码可读性多个维度，既重视工程落地能力，也鼓励技术创新探索。3. 时间安排报名阶段：1月9日-5月20日开发阶段：自备算力和开发环境：1月9日-5月20日使用主办方提供的算力和开发环境：2月24日-5月20日评审阶段：采用“实时评审”规则，评委一旦收到符合要求的PR，立即review并对符合要求的PR进行merge。PR一经合入采用，表明对应的算子任务结束且对应奖金被领走，组委会将及时加入新的算子任务进行任务补充。结果发布：6月上旬4. 赛题详情 20道赛题列表如下：算子编号算子名称难度schema算子分类Torch API1log10初级log10(Tensor self) -> Tensorlog10_(Tensor(a!) self) -> Tensor(a!)log10.out(Tensor self, *, Tensor(a!) out) -> Tensor(a!)pointwisehttps://docs.pytorch.org/docs/stable/generated/torch.log10.html2logaddexp初级logaddexp(Tensor self, Tensor other) -> Tensorlogaddexp.out(Tensor self, Tensor other, *, Tensor(a!) out) -> Tensor(a!)pointwisehttps://docs.pytorch.org/docs/stable/generated/torch.logaddexp.html3cosh初级cosh(Tensor self) -> Tensorpointwisehttps://docs.pytorch.org/docs/stable/generated/torch.cosh.html4gcd初级gcd(Tensor self, Tensor other) -> Tensorpointwisehttps://docs.pytorch.org/docs/stable/generated/torch.gcd.html5tril初级tril(input, diagonal=0, *, out=None) → Tensorpointwisehttps://docs.pytorch.org/docs/stable/generated/torch.tril.html6roll初级torch.roll(input, shifts, dims=None)layouthttps://docs.pytorch.org/docs/stable/generated/torch.roll.html#torch.roll7leaky reLU初级torch.nn.LeakyReLU(negative_slope=0.01, inplace=False) → Tensorpointwisehttps://docs.pytorch.org/docs/stable/generated/torch.nn.LeakyReLU.html#torch.nn.LeakyReLU8asinh初级asinh(input: Tensor, *, out: Optional[Tensor]) → Tensorpointwisehttps://docs.pytorch.org/docs/stable/generated/torch.asinh.html

Description