跳转到内容

贡献分配机制规则细化

关联章程: APDX-RES-001 研究员公约 第六章 目的: 减少歧义,公正公开。本文为 APDX-RES-001 第六章多人成果贡献分配机制的规则细化。


分配按以下流程进行(以下 i 表示员工的 index,k 表示 idea 的 index):

  1. 每个 idea 开始前,由 idea 所属组确定该 idea 的 Base Weight。Base Weight 认定详见后文。
  2. 每个 idea_k 开始前,确定其 owner、co-owner、contributors,以及该 idea 内各参与者的局部贡献权重 v_i^k,满足:
    Σ_i v_i^k = 1
  3. owner、co-owner、contributors 以及 v_i^k 可在 idea 执行中调整,也可在 idea 完成后复盘调整。
  4. 在 idea_k 完成后,计算:
    • 完成度: 上限 3.0,具体计算详见后文;
    • idea_k_contribution = Base Weight × 完成度
  5. 对不归属于单个 idea、但对多个 idea 或整个版本起关键支撑作用的工作,可在复盘时单独认定 Enablement / Cross-Idea Score,并计入相应员工的贡献:enablement_i。 该类贡献需满足:
    • 不可归属于单一 idea;
    • 对多个 idea 或整体版本产生影响;
    • 需提供可验证证据。
  6. 在版本发布后的正式复盘中,由 Version Owner 联合领域 Lead 确定每个版本参与者的角色 R(Contributor / Core Member / Lead or Version Owner / Paradigm Shift)。如有重大争议,再提交 CEO 及技术委员会仲裁。
  7. 经复盘确认,可从版本总 IMP 中划出 20%–30% 作为基础分,授予被认定为该版本核心 Owner 的成员;该部分不参与 w_i 分配。
  8. 可分配版本 IMP 为剩余 70%–80% 的版本总 IMP,按以下方式分配:
    score_i = Σ_k (idea_k_contribution × v_i^k) + enablement_i
    w_i = score_i / Σ_i score_i
    R_i = 员工 i 的参与者角色系数
    alloc_i = 可分配版本 IMP × w_i × R_i

  • 表示:工作量 / 技术复杂度
  • 在项目开始前确定;
  • 不包含 impact 预期。

完成度为原版本公约中突破系数(B)的细化,遵循以下公式:

完成度 = min(Quality × Impact, 3.0)

Quality 默认是 1.0,经团队讨论后可上下调整:

  • 降低:实现不完整;
  • 降低:存在明显设计问题;
  • 降低:不可复现或不稳定;
  • 提高:实现路径上遇到 unexpected 的技术困难(risk),并提出 novel(业界没有或很少使用)的方法解决。
分数定义
1.5 / 2.0完整实现并利用 novel 的 solution
1.0完整实现,质量高
0.8基本完成,有少量问题
0.5部分完成
0质量较差 / 不可用

Impact(实际效果 / 对 Apodex 整体贡献度)

Section titled “Impact(实际效果 / 对 Apodex 整体贡献度)”

默认是 1.0。经团队认定可以大于 1.0 或小于 1.0,以下只是参考:

分数定义
3.0Apodex 因这个 idea 被广泛认可
2.0显著提升 / 能力突破
1.5明显提升
1.0有一定提升
0.5有少量提升
0.0无提升 / 负影响

2.3 Idea 内各参与者的局部贡献权重 v_i^k

Section titled “2.3 Idea 内各参与者的局部贡献权重 v_i^k”

每个 idea 的 v_i^k 由这个 idea 的所有参与者共同决定。在 idea 执行过程中,以及版本发布后的复盘阶段可动态调整。如有分歧,可用贡献过程的可追溯记录与领域 Lead 及科学委员会讨论调整。基本 guideline 如下:

  • Idea / Direction(想法与方向): 0% – 30%(常规执行型任务可为 0,算法数据 recipe 可大于 0);
  • Implementation(实现,含 core + supporting): 60% – 100%;
  • Coordination / Enablement(对接与支撑): 0% – 20%(采购数据,与标注员对接等)。

① 数据管线 + 有效性验证:8–12

  • 构造新训练数据(reasoning / tool-use 等)
  • rollout + filtering pipeline(采样 + 筛选)
  • 数据 → 训练 → 验证闭环

若细分:

  • 构造题目:5
  • rollout 数据管线:2.5
  • 训练分析验证:2.5

② data mixture / 训练调优:5–10

  • 调整数据比例提升指标
  • SFT / RL 配方调优
  • 针对专项能力优化

③ 已有 dataset 验证(开源等):2–5

  • 清洗 + 格式对齐
  • 小规模训练验证
  • 人工抽查 + case 分析

④ 数据分析:1–2

  • 基础统计 / error case 汇总
  • rollout 行为分析
  • 若分析带来关键改进,其价值通过 Impact 体现,而非提高 Base Weight。

⑤ 新 benchmark:6 – 20

  • 设计复杂任务(multi-step / research)
  • 构建可验证评测集
  • judge / rubric 体系
  • 当 ≥15 时,需要说明为何该项目无法合理拆分为两个独立的 ≤10 分项目。

⑥ 评测管线:3–6

  • 自动评测系统
  • benchmark runner
  • dashboard

⑦ 接入评测:1–2

  • 接入外部 benchmark
  • 数据格式转换
  • 跑通评测

⑧ 接入已有 agent:1–3

  • 接入开源 agent
  • tool / prompt 适配
  • workflow 跑通

⑨ 榜单优化:2–4

  • prompt / strategy 调优
  • heuristic 优化
  • 针对任务结构优化

⑩ 新 agent 框架:8–12

  • 新 agent 架构
  • planning / memory / tool 设计
  • execution loop

⑪ agent 新功能:2–8(按影响范围)

  • 小功能:单点增强
  • 中功能:模块改进
  • 核心功能:影响整体能力

⑫ 功能开发(infra / agent):2–8

  • trace / logging / debug
  • 调度、caching 等优化
  • pipeline 增强
  • 工具集成

⑬ 新 infra 框架:10 – 20

  • 训练 / RL 框架
  • 数据引擎
  • 调度系统
  • 当 ≥15 时,需要说明为何该项目无法合理拆分为两个独立的 ≤10 分项目。

⑭ 算法 / 范式:8–15

  • 新训练算法
  • reasoning / search 方法
  • 架构级改动