贡献分配机制规则细化

关联章程： APDX-RES-001 研究员公约第六章 目的： 减少歧义，公正公开。本文为 APDX-RES-001 第六章多人成果贡献分配机制的规则细化。

1. 分配流程总览

分配按以下流程进行（以下 i 表示员工的 index，k 表示 idea 的 index）：

每个 idea 开始前，由 idea 所属组确定该 idea 的 Base Weight。Base Weight 认定详见后文。
每个 idea_k 开始前，确定其 owner、co-owner、contributors，以及该 idea 内各参与者的局部贡献权重 v_i^k，满足：
```
Σ_i v_i^k = 1
```
owner、co-owner、contributors 以及 v_i^k 可在 idea 执行中调整，也可在 idea 完成后复盘调整。
在 idea_k 完成后，计算：
- 完成度： 上限 3.0，具体计算详见后文；
- idea_k_contribution = Base Weight × 完成度
对不归属于单个 idea、但对多个 idea 或整个版本起关键支撑作用的工作，可在复盘时单独认定 Enablement / Cross-Idea Score，并计入相应员工的贡献：enablement_i。该类贡献需满足：
- 不可归属于单一 idea；
- 对多个 idea 或整体版本产生影响；
- 需提供可验证证据。
在版本发布后的正式复盘中，由 Version Owner 联合领域 Lead 确定每个版本参与者的角色 R（Contributor / Core Member / Lead or Version Owner / Paradigm Shift）。如有重大争议，再提交 CEO 及技术委员会仲裁。
经复盘确认，可从版本总 IMP 中划出 20%–30% 作为基础分，授予被认定为该版本核心 Owner 的成员；该部分不参与 w_i 分配。

可分配版本 IMP 为剩余 70%–80% 的版本总 IMP，按以下方式分配：

score_i = Σ_k (idea_k_contribution × v_i^k) + enablement_i
w_i    = score_i / Σ_i score_i
R_i    = 员工 i 的参与者角色系数
alloc_i = 可分配版本 IMP × w_i × R_i

2. 关键变量定义

2.1 Base Weight（事前）

表示：工作量 / 技术复杂度；
在项目开始前确定；
不包含 impact 预期。

2.2 完成度（事后）

完成度为原版本公约中突破系数（B）的细化，遵循以下公式：

完成度 = min(Quality × Impact, 3.0)

Quality / Novelty（实现质量）

Quality 默认是 1.0，经团队讨论后可上下调整：

降低：实现不完整；
降低：存在明显设计问题；
降低：不可复现或不稳定；
提高：实现路径上遇到 unexpected 的技术困难（risk），并提出 novel（业界没有或很少使用）的方法解决。

分数	定义
1.5 / 2.0	完整实现并利用 novel 的 solution
1.0	完整实现，质量高
0.8	基本完成，有少量问题
0.5	部分完成
0	质量较差 / 不可用

Impact（实际效果 / 对 Apodex 整体贡献度）

默认是 1.0。经团队认定可以大于 1.0 或小于 1.0，以下只是参考：

分数	定义
3.0	Apodex 因这个 idea 被广泛认可
2.0	显著提升 / 能力突破
1.5	明显提升
1.0	有一定提升
0.5	有少量提升
0.0	无提升 / 负影响

2.3 Idea 内各参与者的局部贡献权重 v_i^k

每个 idea 的 v_i^k 由这个 idea 的所有参与者共同决定。在 idea 执行过程中，以及版本发布后的复盘阶段可动态调整。如有分歧，可用贡献过程的可追溯记录与领域 Lead 及科学委员会讨论调整。基本 guideline 如下：

Idea / Direction（想法与方向）： 0% – 30%（常规执行型任务可为 0，算法数据 recipe 可大于 0）；
Implementation（实现，含 core + supporting）： 60% – 100%；
Coordination / Enablement（对接与支撑）： 0% – 20%（采购数据，与标注员对接等）。

3. Base Weight 分类（含示例）

3.1 数据 / 训练

① 数据管线 + 有效性验证：8–12

构造新训练数据（reasoning / tool-use 等）
rollout + filtering pipeline（采样 + 筛选）
数据 → 训练 → 验证闭环

若细分：

构造题目：5
rollout 数据管线：2.5
训练分析验证：2.5

② data mixture / 训练调优：5–10

调整数据比例提升指标
SFT / RL 配方调优
针对专项能力优化

③ 已有 dataset 验证（开源等）：2–5

清洗 + 格式对齐
小规模训练验证
人工抽查 + case 分析

④ 数据分析：1–2

基础统计 / error case 汇总
rollout 行为分析
若分析带来关键改进，其价值通过 Impact 体现，而非提高 Base Weight。

3.2 评测

⑤ 新 benchmark：6 – 20

设计复杂任务（multi-step / research）
构建可验证评测集
judge / rubric 体系
当 ≥15 时，需要说明为何该项目无法合理拆分为两个独立的 ≤10 分项目。

⑥ 评测管线：3–6

自动评测系统
benchmark runner
dashboard

⑦ 接入评测：1–2

接入外部 benchmark
数据格式转换
跑通评测

3.3 Agent / 应用

⑧ 接入已有 agent：1–3

接入开源 agent
tool / prompt 适配
workflow 跑通

⑨ 榜单优化：2–4

prompt / strategy 调优
heuristic 优化
针对任务结构优化

⑩ 新 agent 框架：8–12

新 agent 架构
planning / memory / tool 设计
execution loop

⑪ agent 新功能：2–8（按影响范围）

小功能：单点增强
中功能：模块改进
核心功能：影响整体能力

3.4 系统 / 功能

⑫ 功能开发（infra / agent）：2–8

trace / logging / debug
调度、caching 等优化
pipeline 增强
工具集成

⑬ 新 infra 框架：10 – 20

训练 / RL 框架
数据引擎
调度系统
当 ≥15 时，需要说明为何该项目无法合理拆分为两个独立的 ≤10 分项目。

3.5 算法

⑭ 算法 / 范式：8–15

新训练算法
reasoning / search 方法
架构级改动