华霖资本 ASIC：定制芯片经济学

ASIC / 定制芯片不是新东西华霖资本。

博通业绩会上提到第4个“神秘客户”(Open AI）的100亿美金订单，却让这个“GPU VS ASIC”的讨论重新上了个高度。

趁着周末重新整理了一下ASIC的经济学，和接下来芯片行业的一些叙事变化。文中借用了TD Cowen的一个分析框架，写的挺好的。

自研芯片的ROI框架

1/ 哪有什么ASIC vs GPU，说白了大家都是 "ASIC”；

传统观点里，GPU为了灵活性，牺牲性能；而ASIC则为特定任务优化，效率更高；这种框架现在已经没那么适用，因为最先进的GPU在芯片架构层面已经高度特化，大部分计算能力都用于AI加速，特别是矩阵乘法运算，与图形处理关系很小；

大语言模型LLM中，超过90%的计算都是矩阵乘法，这些芯片实际上都是为同一个特定应用（AI加速）而生的ASIC。（比如NV的Tensor Core / 谷歌的Matrix Multiply Unit / 亚马逊的Tensor Engine）；下图中黄色的这块。

某种程度上，大家都是搞AI的“ASIC”；

2/ 区分ASIC vs GPU的本质其实不是技术路线，而是商业模式。用另外一种角度看，其实主要区别只有，

A. 商业芯片 (Merchant) 芯片厂搞，卖给很多人。B. 定制芯片 (Custom) 云厂搞，自己用。随着Google之前传出卖TPU的新闻之后，这个界限也开始模糊。

说白了，只是哪一个路线更加“省钱” + 有长远的战略意义。

既然是从“钱”的角度出发，用ROI的框架来分析，可能会更加直观一些。化繁为简，只有两种情况，“买”（buy） vs “自研”（build）；

3/ “自研”的诱惑 vs 代价

商业芯片，利润太高了（这里不需要我赘述，大家都知道。看看4万亿市值的英伟达）；80%的芯片成本，都转化成了英伟达的利润。

自研当然是为了吃掉这部分利润，但是定制芯片是高度“二元化”/binary的。要么成功，要么失败；并不存在说，我自研的芯片虽然垃圾，也能跑一跑的这种“中间态”。

4/ 为什么定制芯片“不成功便成仁”？TD Cowen这里给了一个“暴论”，只要你自研的芯片不能达到英伟达最先进芯片性能的50%，那就通通都是电子垃圾，就算流片了，也不应该量产。

几个基本假设（假设有点长华霖资本，用灰色处理了），

学习老黄用“AI工厂”的概念去理解这个芯片投资；这个工厂的“产品”就是通过API调用生成的“tokens”。

市场存在一个公开的“推理服务”价格；OpenAI、Anthropic、Google都在以API的形式提供其LLM服务，这个价格通常以“美元/每百万tokens”（$/1M tokens）来计费。

硬件性能决定了“产品”的生产速度；一个AI芯片的性能，可以直接体现在它处理一个模型时每秒钟能生成多少个tokens，即吞吐量（Throughput, measured in tokens/second）。性能越强的芯片，生成tokens的速度越快。

也就是说，收入/秒 = (价格/token) × (吞吐量, tokens/秒)

有了上面的假设之后，

性能=算力=收入，AI工厂的核心竞争力；一个性能是对手两倍的芯片，在相同的时间内，就能产生两倍的收入。

目前市场上的API定价实际上是基于一个隐藏的共同基础：它们绝大多数都运行在NVIDIA的GPU上。这使得NVIDIA的性能成为了市场定价的“黄金标准”（其他人只能“吞下”这个标准）。

换句话说，你的收入不完全是取决于你自己的芯片绝对性能，而是取决于你的芯片vs英伟达芯片的相对性能（因为英伟达定义了收入标准）；

假设结束，直接上结论。（TD Cowen的报告有一个很详细的计算，这里篇幅限制我直接跳到结论。）

买老黄芯片的IRR很高，大概有24% （大家不需要太较真这个数字，主要是解释决策思路）。“买的越多，省得越多”；

如果云厂自研出来的东西，性能能达到英伟达芯片的70%表现，那么IRR就可以有35%（英伟达的利润被省下来了，转化成了成本节省，最终转化成为IRR）；

如果自研的东西，性能能达到英伟达芯片的50%，那么IRR刚好差不多，来到了临界点。这个时候你仍然可以推进量产，因为有战略意义。

但是如果你自研的东西，性能仅仅能达到英伟达芯片的30%，那么IRR骤降（这里不是线性的，因为电力，数据中心成本很多都是fixed costs），那么你应该果断放弃自研，流片了也不要量产。在这个情况下，IRR甚至比不上你公司的资金成本/WACC;（放在Open Ai语境下，他家拿的是VC的钱，WACC肯定高过谷歌非常多）；