从风险外包到基础设施锁定:AI 正在改写 40 年 Biotech 产业结构

2003 年,阿斯利康推出了一款叫吉非替尼的肺癌药,FDA 加速批准了它。

两年后,确认性研究没能证实它能延长病人的生存期。FDA 随后把它的使用范围一步步收紧,几年后它从美国市场彻底退了出去。

整体有效率大约 10%。生存期和安慰剂组几乎没差别。整个医学界把它判了死刑。

故事本来应该在这里结束。

但 2004 年前后,有人注意到一件事。

某些病人对这款「失败的药」反应完全不同。他们的肿瘤里有一种叫 EGFR 的激活突变。在欧美肺癌人群里,这样的病人大约 10% 到 15%;亚洲肺腺癌里比例还要更高。

对 EGFR 阳性的这批病人,吉非替尼的有效率不是 10%——

是 55% 到 75%。

同一个分子,同一种机制。整体人群 10%,精准亚群 75%。成倍的差距,来自一件事:

给对的病人用。

2015 年,FDA 重新批准了这款药——这次是专门给 EGFR 突变阳性的肺癌病人。

01 癌症新药的赌场

吉非替尼是靶向抗癌药历史上最经典的「找到对的病人」案例之一。

不是每款成功的靶向药都走过这条路——有些从一开始就瞄准了精准亚群。但「整体人群失败、精准亚群救活」的反转,在过去二十年里反复出现过。

那些真正改写了癌症治疗的突破,从来不是发现新分子。是找到对的病人。

问题是:找到对的病人太难了。

一款新药从立项到上市,行业里常见的估算是:平均烧掉 26 亿美元,耗时 10 到 15 年。

走到最后拿到批准的概率,只有 5% 上下。

二十个里挑一个。

那剩下的 95% 死在哪里?

一半死在「没效果」上。但不是分子不对,是分子给错了病人。

三成死在「毒性不可控」。

剩下的,死在「做不成药」或者「临床上能用、商业上赔钱」。

第一类是 AI 有机会修的。

后三类,不是。

我们这个时代最聪明的一批人,过去四十年做的事情,本质上就是在这张赌桌上下注,然后接受注定的输。

02 一笔不一样的交易

2026 年 1 月的某个工作日,GSK 宣布了一笔交易。

对方是一家叫 Noetik 的美国小公司。金额:5000 万美元——预付加近期里程碑。

新闻不大。大部分主流财经媒体都没细讲。但在 Biotech 圈内部,它引起了一阵不寻常的讨论。

因为 GSK 买的不是药。

不是候选分子的优先购买权,也不是研发合作。

他们买的,是 Noetik 的 AI 模型在肺癌和结直肠癌上的使用权——加上未来几年双方一起生成的多模态癌症数据集。

把它放在行业历史上对比,你才看得出有多异常。

2022 年,中国英矽智能和法国赛诺菲签过一笔「价值 12 亿美元」的合作。数字听起来远比 Noetik 这笔大。

但仔细看条款——真正预付的现金只有 2150 万。剩下的是「如果将来 AI 真做出一款能卖的药,再一步步付」。

这是生物医药行业的老套路:我不相信你的 AI。但你要是真做出了药,我有优先买单权。

GSK 这次不一样。

那 5000 万直接到账。外加按年续订阅费。没有「药做出来才付」这种条件句。

Noetik 把这笔交易定位为「生物技术行业最早、最大的基础模型授权之一」。

听起来像公关话术。但如果它真的是——那意味着一件不小的事。

03 大药厂为什么四十年不自己做

要理解这件事为什么重要,我们得先回到 1976 年。

那一年,一个叫 Bob Swanson 的年轻人刚离开一家风投公司。他 28 岁。

他给几个在做「重组 DNA」研究的科学家打电话,问能不能把这项技术商业化。

大部分人拒绝了他。

只有加州大学旧金山分校的一位教授 Herbert Boyer 愿意聊十分钟。

十分钟最后谈了三个小时。两周后,他们各出 500 美元开了家公司,叫 Genentech。

这是现代 Biotech 产业的起点。

接下来四十年,Genentech 的剧本被无数创业公司复制。

几个科学家加一个 VC,赌一个单点技术。烧十年的钱。九成的同类公司会死掉。

少数活下来的,要么上市,要么被大药厂收购。

这套模式看起来很浪费。一个显然的问题是:大药厂为什么不自己做?

因为他们赌不起。

一家大药厂一年营收可能有五百亿美元,但他们的股东不允许他们在某个冷门靶点上押十亿美元然后归零。

所以他们的策略是——把风险外包出去。

让成千上万的 Biotech 小公司去赌。赌输的自己死,赌赢的自己卖。大药厂等在终点线上,拿着支票簿。

2009 年,罗氏花了 468 亿美元吞掉 Genentech。

2023 年,辉瑞花 430 亿收购 Seagen。

这个系统能运转四十年,有一个前提——大药厂预判不了谁会赢。

所以他们只能等。等 Biotech 用时间和金钱把风险消化完,数据跑到确定的那一天,再扫货进场。

04 当赌场变成计算题

Noetik 做的事情,就是在动摇这个前提。

他们的核心产品叫 OCTO-VC。说简单点——让 AI 在药物进入临床之前,就预测出哪类病人会响应。

怎么做到的?

两年时间,2500 多例真实癌症病人,四种不同模态的数据:空间转录组、蛋白组、病理切片、全外显子。配对、标注、喂进模型。

这件事如果能做成一半,吉非替尼的故事就不会再重演。

阿斯利康 2003 年就能直接招 EGFR 阳性那批病人,省下五年时间和数亿美元。

这里要非常诚实一下。

即便 Noetik 做到了,癌症新药的总失败率也不可能从 95% 降到 5%。

前面拆过——「给错病人」只是失败原因之一,占一半。剩下的毒性、成药性、商业判断失误,跟 AI 匹配没关系。

乐观的天花板大概是:把失败率从 95% 降到 80% 左右。

这个数字听起来不惊艳。但对整个产业的冲击是剧烈的。

05 一次性的护城河,和会滚雪球的护城河

过去四十年,Biotech 公司的护城河是技术

Genentech 的护城河是重组 DNA。Moderna 的护城河是 mRNA 递送平台。

技术护城河有一个致命特点——它是一次性的。

论文一发,细节公开。两三年内顶级实验室能复现。五年内大药厂能自己做。

CRISPR 从 2012 年那篇论文到今天全球数千实验室在用,前后不到八年。

Noetik 走的是另一条路。

他们的护城河不是模型架构——Transformer 是公开的,训练方法是公开的。

真正的护城河,是那批花了两年时间、跨越多家合作医院采集的多模态病理数据。

别家买不到。

不是钱的问题。是组织的问题——多中心临床协作、病理切片数字化、知情同意、数据脱敏、标准化。每一步都是几十上百人的长期工程。有钱想追,也要两年起步。

但真正让 Noetik 变得危险的,不是这批数据本身。

是它会自己长大

想象一下 2029 年。

GSK 的一位肿瘤研发总监,在给管理层写季度汇报。过去五年里,他们有十几款肺癌和结直肠癌候选药用 Noetik 预测过病人亚群。其中几款已经在 II 期临床——Noetik 的模型随着每次试验回流的数据在微调。

另一家 AI 平台上门推销,价格便宜一半。

这位总监算了一下切换成本。

不是钱的问题。是五年来 Noetik 模型对 GSK 药物库的专属优化——那十几款药的响应数据、每一次修正的微调权重、Noetik 服务工程师熟悉 GSK 内部流程的那些隐性知识——一旦换平台,全部归零。

他放弃了切换。

这不是技术锁定。是基础设施锁定。和 AWS 早期把企业锁住的逻辑,一模一样。

Noetik 还不是孤例。

Recursion Pharmaceuticals 和拜耳签了 15 亿美元级的精准肿瘤合作。Alphabet 旗下的 Isomorphic Labs 和礼来、诺华分别签了类似结构的协议。

这件事正在变成一个新行业的标准姿势——大药厂不买断你,不收购你,只是长期租用你。

但是一旦租下,就租到合同结束为止。

06 如果这条路走通了

假设 Noetik 这条路真的走通——全球会出现三五家这样的 AI 平台,掌握着肿瘤病人的多模态数据。

大药厂的行为会变。

以前,大药厂想进某个赛道,标准动作是出 50 亿美元收购一家 III 期的 Biotech。

现在,他们会先把模型跑一遍,看看这家 Biotech 的药在 III 期成功的概率。

如果模型说八成会输?那就不买。等 Biotech 自己耗死,几年后捡点剩的 IP 资产。

如果模型说大概率会成?

他们会做一件以前不敢做的事——不收购,直接抢。自己内部用同样的 AI 去跑同一个靶点。谁先到 III 期谁赢。

对 Biotech 小公司来说,这是灾难。

以前你赌中了一个靶点,终点线是等大药厂来扫货。

现在终点线可能根本不存在——大药厂会在你跑到 II 期的时候,用 AI 判断你的数据、自己组团队来做同一个靶点。

「早期风险承担者」这个角色被取消了。

连锁反应是明显的。

Biotech 公司的估值会被压缩——「单点技术」不值钱了,因为 AI 在早期就能预判它的成败。

早期 VC 的回报倍数会被压缩——这个行业的数学依赖「赌中一个 Moderna 一夜暴富」,收购溢价下降直接压掉回报的尾部。

整个产业的权力,会向少数几家握有数据的 AI 公司集中。

这个图景有一个熟悉的历史对照——1980 年代。

那时候 Biotech 革命刚起步。全球新药发现几乎完全由辉瑞、默克、罗氏这些大药厂掌握,从基础研究到临床到销售,一条龙。

如果 AI 平台路线走通,这个格局会部分回归。

只是这次多了一层:大药厂 × AI 平台公司。

Biotech 不会消失,但它从「产业核心创新引擎」降级为「药厂基础设施的应用场景」。VC 不会消失,但他们从「押单点技术」转向「押 AI 平台本身」。

AI 不会让医药普惠。AI 会让医药更集中。这是一个反直觉但结构上顺理成章的结论。

07 但是——

说到这里你可能已经接受了这个叙事。我得按一个暂停键。

因为这条路并不一定能走通。

过去十年,第一代 AI biotech 公司的成绩单几乎全军覆没。

BenevolentAI——英国 AI 制药的代表——主力候选药 2023 年 II 期失败。

Exscientia 和日本住友合作开发、号称「全球第一个完全由 AI 设计的药物」,2022 年 I 期终止。

Recursion——纽约上市的明星公司——2024 年宣布合并 Exscientia,2025 年完成合并后砍掉了四个临床项目。

截至 2025 年,还没有一款被广泛认可的「AI 设计药物」在 III 期临床成功或获批。

一个没有。

还不止商业表现。

2026 年 2 月 bioRxiv 上有一篇论文,直接反驳了 Noetik 这种「scaling law」的叙事。

核心论点是:虚拟细胞模型的瓶颈不是参数量,是数据覆盖的生物情境不够多样。

你可以把参数堆到 40 亿、一千亿、一万亿,都救不了一个只见过几千例某几家医院病人的模型。

还有一篇更刺耳的——2024 年预印本、2025 年发表在 Nature Methods 上的研究,作者来自海德堡/EMBL 体系。他们发现:在一部分基因扰动预测任务上,一个简单的加法基线模型,表现并不比复杂的深度学习模型差。

这是对整个「生物学基础模型」叙事最冷的一盆水。

所以 Noetik 这笔 5000 万交易,可能是一个新时代的开场。

也可能是又一次被高估的叙事,五年后变成下一个 Recursion。

现在没人知道答案。

这个答案大概会在 2030 年到 2031 年之间揭晓——也就是 GSK-Noetik 合作期结束的时候。

到那时候,如果 Noetik 预测过的药物在 III 期临床的成功率显著高于行业基线,这条路就成立。

如果没有,Noetik 会加入 BenevolentAI 的墓碑。

但不管 Noetik 最终成不成,这个产业的旧秩序已经在动摇。

08 Biotech 一代人的黄昏

2025 到 2026 年,Biotech 行业发生了几件事,放在一起看很耐人寻味。

美国 Biotech 的 IPO 数量,降到了近些年的低点。

追踪 Biotech 的 ETF——XBI——从 2021 年高点跌了一大截。

几家大药厂的高管在公开场合反复透露一个同样的意思:「我们在等 AI 工具成熟,再做重大投资。」

VC 的钱,开始从「下一个 Moderna」流向「下一个 Noetik」。

一个产业的黄昏,往往不是突然倒下。

它更像是某一天,你发现聪明的年轻科学家,不再出来创业了。

因为大公司里已经有了所有工具。而自己出来的回报倍数,已经不够了。

1976 年的那个下午,Bob Swanson 敲开 Boyer 办公室的门。

那一刻开启了一个产业。半个世纪过去,它可能正在翻过自己最精彩的那一章。

下一章的主角,不再是 Boyer 这样的教授。

是一组服务器。

参考文献:

Noetik × GSK:5000 万美元基础模型授权深度访谈Latent Space / 2026GSK & Noetik Strategic Collaboration AnnouncementGSK / 2026-01Simple Additive Baselines in Gene Perturbation PredictionNature Methods / 2025(预印本 2024)