← 返回 MedLoom

医学垂类标注与评估

对标 Scale AI 的战略定位:专家标注 + 标注质量评估
内部资料 · 2026年5月
1 核心逻辑

AI 企业构建生成模型。MedLoom 提供专家标注与质量评估。

AI 企业训练和评估医学模型依赖高质量数据。医学数据标注要求临床领域专家参与——通用众包平台无法满足这一精度要求。

第一层:专家标注
我们直接为 AI 公司提供医学领域的专家级标注服务:视频/图像/文本/RLHF
第二层:标注评估
当头部企业自建垂类标注团队时,MedLoom 提供标注质量评估、准确性基准测试、合规认证
两层服务模型
2 为什么是现在

Meta 收购 Scale AI → 医疗标注市场出现供给缺口

时间事件影响
2025.06 Meta 以 143 亿美元收购 Scale AI 49% 股权 Scale AI 资源转向 Meta 需求
2025 H2 谷歌 / OpenAI / xAI 暂停与 Scale 合作 大客户流失,Scale 裁员 14%
2026 Scale AI 医疗方向大幅收缩 梅奥诊所等合作搁置 → 市场缺口
$2.57B
全球医疗数据标注市场(2026)
$5.62B
全球预测(2031)· 年复合增长率 16.9%
Scale AI 在医疗领域曾有专门的医学术语协议、解剖学精度标准、多层质控体系(训练标注员 → 医学专业人员 → AI 辅助质控)。这些能力现在因为 Meta 收购被重新定向了。
— IntuitionLabs,《生物技术领域的 RLHF 平台》,2026
3 两层服务模型

第一层:专家医学标注

核心收入

为 AI 企业提供高质量的医学领域标注数据,要求具备医学背景的专业标注员参与,通用众包模式无法胜任。

标注类型说明客户需求
医学图像标注 放射影像、病理切片、皮肤病变的精确标注 医学影像 AI 模型训练
临床文本标注 病历、处方、临床指南的实体识别和关系抽取 医学自然语言处理 / 临床决策支持
医学视频结构化 视频切片的内容标注、时间线对齐、知识点映射 多模态医学 AI 训练
医学 RLHF 大模型输出的临床准确性评估、偏好排序、安全性审核 医学大模型对齐
核心竞争优势:已完成标注的 60,000+ 条金标准数据(核心资产 ①),以及 10 年沉淀的标注方法论与专家网络(核心能力 ②)。 两者均已通过实际商业交付验证。

第二层:标注质量评估

高壁垒

当头部科技企业的医疗部门自建标注团队时,仍需要独立的第三方评估标注质量。MedLoom 提供这一专业评估服务。

评估类型说明价值
准确性基准测试 用我们的金标准数据集测试标注质量 量化标注员/团队的准确率
一致性审计 跨标注员的标注一致性评估 识别系统性偏差
合规认证 标注流程是否符合医疗数据安全法 / 美国 HIPAA 要求 合规性背书
模型输出评估 评估 AI 模型在医学任务上的表现 模型上线前的质量门禁
类比:就像会计行业的"四大"——企业可以自己做账,但需要独立审计。我们是医学标注领域的"独立审计方"。
4 目标客户
客户分层
客户类型 需要什么 第一层 / 第二层 市场
AI 公司 / AI 实验室
训练医学大模型
高质量医学标注数据、RLHF 偏好数据 第一层 标注 中国 + 国际
头部科技企业医疗部门
自建标注能力
标注质量评估、基准测试、合规认证 第二层 评估 中国
药企 / 合同研究组织
合规数据需求
临床试验数据标注、药物安全性文本标注 第一层 标注 中国 + 国际
医院 AI 系统供应商
医学影像 / 辅助诊断
放射影像标注、模型评估 第一层 + 第二层 中国
监管机构 / 认证机构
AI 医疗器械审批
标注质量标准、测试数据集、评估报告 第二层 评估 中国 + 国际
5 对标参考:Scale AI
维度 Scale AI MedLoom(目标定位)
服务范围 全行业:自动驾驶、政府、AI 通用 聚焦医学垂类
标注模式 9,000+ 通用众包标注员(全球分布) 医学专家网络(三甲主任+专科医生)
定价 图片 2 美分/张,标注 6 美分/个
企业合约平均 9.3 万美元/年
专家标注溢价更高(领域壁垒)
质控 AI 预标注 + 众包审核 + 客户验收 专家 ground truth + AI 辅助 + 独立审计
评估能力 安全评估与对齐实验室 医学标注评估服务(医学垂类版)
数据资产 无自有数据(纯服务) 60,000+ 专家审核切片,可直接作为行业基准
医疗合规 美国 HIPAA / SOC2(通用合规) 美国 HIPAA + 中国医疗数据安全法(双合规)
当前状态 20 亿美元营收,但医疗方向已收缩(Meta 收购后) 概念验证完成,待市场验证
核心差异:Scale AI 依赖通用众包标注员,MedLoom 依赖医学领域专家。在临床数据标注中,标注员的专业背景直接决定数据质量的上限。
业界案例:通用 AI 生成的医学科普内容(如解剖结构图示)普遍存在临床错误。同理,缺乏医学背景的通用标注在临床精度上难以保障。
6 核心资产与能力

MedLoom 的竞争力来自两项已通过商业交付验证的核心能力

核心资产 ①:已标注的高质量数据集

10 年积累
60K+
专家审核的结构化切片
150+
覆盖常见疾病
16
标准知识模块 / 疾病

每个疾病按 16 个标准模块结构化(定义/症状/病因/诱因/检查/治疗/药物/护理/预防/危害…), 每条切片标注:文字内容、在知识点中的位置、上下文语义、唯一编码。

这些数据本身就是金标准: 第一层 → 直接作为训练数据交付给 AI 公司; 第二层 → 作为基准数据集评估其他标注的质量。 这些数据已完成标注并通过专家审核,可直接用于商业交付。

核心能力 ②:标注与评估的方法论和专家网络

市场验证

10 年的标注实践不只产出数据,更沉淀了一套可复制的标注方法论经过验证的专家协作网络

能力维度具体内容市场验证
标注规范体系 16 模块知识结构 × 分级标注流程 × 质控标准 150+ 疾病一致应用
专家网络 三甲主任+专科医生组成的审核团队 长期合作、已完成批量交付
质量评估能力 交叉审核、一致性检验、金标准数据比对 头部 AI 公司验收通过
规模化交付 从单疾病概念验证到批量万级别交付的全流程 10,000+ 条清洁版已交付
关键洞察:数据可以采购或生成,但标注规范的制定、评估标准的建立、质量体系的运营需要长期领域积累。 这是 MedLoom 提供第二层标注评估服务的核心基础。
7 近期收入通道

医学内容制作服务

独立业务线

基于同一批核心资产(已标注的医学视频素材库 + 专家网络),为药企和学术机构提供专业医学内容制作服务。对外定位为专业制作服务,而非 AI 生成工具。

服务客户交付物
医学教育视频 药企市场部、学术推广部门 疾病科普视频、药物机制动画
学术插图与素材包 合同研究组织、学术期刊、临床研究机构 合规的医学图示和视频素材
医学内容运营 药企、医疗器械企业 科普账号内容、患者教育材料
与标注业务的关系:共享核心资产,独立客户群和销售体系。近期可产生稳定现金流,支撑标注平台的长期建设。
8 待讨论

需要验证的

  • AI 公司对中文医学标注数据的实际需求量
  • 第二层(标注评估)的付费意愿和定价空间
  • 医学专家标注员的招募成本和质控流程
  • 美国 HIPAA + 中国医疗数据安全法的双合规路径

风险

  • AI 生成技术进步是否会降低人工标注的需求
  • Scale AI 的医疗方向收缩是暂时还是永久
  • 从"数据资产"到"服务能力"的组织建设
  • 头部企业自建标注团队的速度是否快于 MedLoom 建立市场的速度