西西河

主题:【江湖典故 III】 一百万美金的学费 (下) -- 小宋一刀

共:💬21 🌺72 新:
分页树展主题 · 全看 下页
  • 家园 【江湖典故 III】 一百万美金的学费 (下)

    取了个这么唬人的标题, 又故意卖个关子.

    非是小刀存心哗众取宠, 只是用心险恶的图谋着为了咱们科技版增加些人气而已, 恕罪恕罪.

    我想每个职业都有个最害怕的东西.

    小刀做IT时, 最怕SENDMAIL CRASH.

    做PROGRAMMER时, 最怕DEBUG前一任写的没有说明的原码.

    在打工读书的时候, 最怕雨后清扫伐木工人用过的厕所 (那份迷惑...)

    不过今天讲的是IC DESIGN, 哪位哥们姐们想要切磋吸尘和刷马桶的技术, 咱们另开一贴.

    做IC DESIGN最怕什么呢? 自然是晶片不工作.

    做为一个设计者, 把做好的资料交给代工厂去加工后, 并不意味着工作的结束, 那才是恶梦的开始.

    为什么?

    因为资料在自己手上的时候, 发现什么问题, 还可以改

    顶多就是熬夜 推迟SCHEDULE 被CEO臭骂而已. 公司还不会有财务上的损失.

    到了代工厂以后, 基本上就是铁板钉丁, 而且一大笔钱也开出去了, 如果真出了什么问题, 那只好是, 还是俺们家乡话说的实在: "死猪不怕开水烫了".

    所以每次设计完成之后, 小刀睡的比赶工时更不蹋实.

    脑海中翻来复去想的都是每个设计的步骤有什么纰漏.

    有几次还真的把自己吓到从睡梦中醒来. (苦孩子啊)

    再来讲NVIDIA的故事

    我师哥到了台湾, 把晶片一切开, 叫了声苦.

    为什么叫苦?

    (【借机灌水:】老婆孩子嗷嗷待哺啊!

    姐们,把手上的砖放下, 咱们苦孩子不砸苦孩子, 成不?)

    要了解这个原因, 请大家看下面这张图

    点看全图

    外链图片需谨慎,可能会被源头改

    (这是一张晶片切图, 是一张0.18um的晶片, 不过用来做说明 足够了)

    晶片中有成千上万条信号线, 这些信号线都是由金属制成.

    因为有这么多信号线, 所以晶片要有好几层金属.

    这样就可以提供足够的空间铺开这些信号线.

    那么不同层次的金属怎样才可以连接到下一层呢?

    请大家看看图中白色的东东, 这样的东东叫"VIA"

    METAL6就是通过VIA连到METAL5, 再通过VIA连到METAL4...等等

    我师哥切开晶片一看, 发现许多联接金属之间的"VIA"都消失了. 因为这些消失的"VIA", 许多应该连接在一起的金属都没有连接.

    信号自然也无法传播.

    那"VIA"又是怎么消失的呢?

    大家记得上文提到了这块晶片是0.13um的工艺做的.

    "

    在0.13um的工艺中, 很关键的一个变化就是用铜来作晶片中的导电线.

    在0.13um以上的工艺中, 是用铝来做导电线的.

    用铜有什么好处? 它的电阻比铝要小, 电流可以跑的更快.

    但是铜比铝的材质也有不如的地方.

    比如说铜的比重比铝大, 容易下沉.

    铜的热力伸展性比铝要大.

    "

    在做BURN-IN TEST的时候, 一般是要跑上至少几百个小时的.

    电流都是在顺着金属线跑, 到了"VIA"的地方, 再往下跑.

    刚开始工作的晶片, 电流就象是小溪, "VIA"就好像是小溪中的一块石头.

    流量不大的时候, 石头完全不会动摇.

    晶片是越跑越热, 温度升高后, 每条金属线承受的电流也越来越强. (其实这个说法不是很严谨 大家姑妄听之吧)

    这时的小溪就变成了五月的金沙江了, 那么这块石头受到的冲击力是不是会变得很大?

    这样已经够糟糕了, 大家还要记得金属线的本身也会在高温下扩展, 这种扩展也是对"VIA"(石头)施加了更大的压力.

    石头被冲走了, VIA也是这样消失的.

    晶片也就是这样死掉了.

    那要怎么解决这个问题呢?

    大家不要想的太复杂, 答案很简单.

    重复的加"VIA", 多加一个, "VIA"消失的机率就少了50%

    所以从这以后, "DOUBLE VIA"这个词就成了工业界在做0.13um的一条金课玉律

    问题找出来了, 那谁要扛刀子?

    客观的讲, NVIDIA的设计没有错, 但是也不正确.

    (呵呵 我的那套即非零又非一的又来了)

    NVIDIA的设计从电路上来讲, 没有错. 因为如果错了, 晶片跟本就不会工作.

    但他们做的也不正确, 因为他们没有深刻的预料到新工艺的复杂性, RISK ANALYSIS做的不够好.

    那么是台基电的错吗? 我看也不是.

    台基电为了完善0.13um的工艺, 也着实做了不少实验.

    但那只是实验, 象NVIDIA这样真刀真枪的晶片他们不可能做.

    就是说 许多问题 不真刀真枪的干到那一步, 不可能被发现!

    不过当真的走到那一步的时候, 损失已经造成了.

    当时工业界除了暗暗庆幸自己走运之外, 没有嘲讽他们的. 老美老印提到NVIDIA, 仍然是竖起大姆指.

    为什么? 因为象这样的问题, 可能发生在任何公司, 没有人可以预料的到.

    大家都是练家子, 知道走在最前端要有多大的勇气.

    这些都是课本上 实验室里学不到的东西

    这也是为什么很多人做的苦哈哈的 也愿意接着玩下去的原因 多刺激啊!

    这次学费, (光付给代工厂的代工费 还不包括NVIDIA损失的MARKET SHARE)

    差不多就是100万美金

    后记

    1

    NVIDIA现在的013晶片是在IBM做 良品率好了不少 也抢回了不少MARKET SHARE

    2

    我师哥后来主动辞职 被NVIDIA对手ATI抢去 接着做押司

    3

    写了这么多 我唯一希望大家可以带走的印象就是:

    科技发展的路程真的是非常不平坦!

    有许多人许多公司为哪怕是很细小的科技进步都做出了巨大的牺牲, 这些牺牲通常鲜为人知.

    我对他们充满了敬意.

    通宝推:南风,rentg,老树,蚂蚁不爱搬家,

    本帖一共被 3 帖 引用 (帖内工具实现)
    • 家园 测试芯片都没有?

      我觉得象这样级别的芯片怎么着也得有几版测试芯片吧?而且还是换到新工艺。

    • 家园 看完小宋兄此贴,胜读十年书,这个贴真让人长见识。

      多谢。

    • 家园 你师哥应该百万身家喽

      NVDA没赶上ATI总应赶上了。

      没看清楚VIA熔掉后去了哪,是否绝缘层太薄啊。只玩过PADS,确实是Technician的功夫,增多VIA的话layout的要骂娘了,一般在layout时不会留太多空位吧。曾经没空位了干脆加多一层,又简洁又易改,不过那玩艺有点象块石头了。

      自己设计的硬件work的那一刹的兴奋是软件无法比拟的,因为后者跟着的是越杀越多的bug。

      很久以前学生时的事了,小刀见笑。

    • 家园 感动于这句话:

      这也是为什么很多人做的苦哈哈的 也愿意接着玩下去的原因 多刺激啊!

    • 家园 做软件也是一样的

      集成测试还不算难受,压力测试是最让人痛苦的,几百个、上千个用户一起登陆,什么设计、实现问题全出来了。

    • 家园 有些没有看明白

      VIA从功能看似乎应该理解为那条河流才对, 而不是河流中的石头,

      因为电流是在VIA通过的阿

      怎么你的比方是石头被冲走呢?

      • 家园 【被揪出来了】

        您理解的没错 电流的确是在要从VIA里面跑

        把VIA比喻成石头 是想要形容VIA受到的压力

        可能以下的比喻更恰当一些

        电流是高架的灌溉渠道 有好几层

        最高的一层会通过中间的一些细小的水管分流到下一层

        那么中间分流水管受到的压力也会随着主水线水流量的增大而增大

        这样会不会好一点?

        • 家园 不知道芯片中的VIA是什么工艺。

            PCB上的VIA是沉积铜,厚度不如铜箔,截面积小,密度也可能较低。

            这样的话,这一段电阻就比较高,通过电流时这里承受的功率就比较高,会比其他地方热,发热后电阻进一步升高,恶性循环。

            当电流过高时这一部分就容易熔化甚至汽化。

        • 家园 样的比喻怎么样?

          金属层是一条条大街,之间建筑隔着,总之是不能跨过。VIA是十字路口。大街上的流量一大,这十字路口受到的压力也大。

          两个VIA也就是相当于两个路口,一个不通了,另一个还能救急。

          或者是连接河两岸的独木桥。

    • 家园 做软件也一样,在下面测试都是好好的。

      但一旦进入Production,或是发售给用户,还是暗中祷告,乞求千万别出什么差错。

      好的设计到好的产品中间并不是坦途,你的故事就是最好的一个佐证。

      我听一个搞产品设计的人说,同样一个东西(比如一个电子芯片),工业品级的成本是普通消费级的10倍,而军品级又是工业品级的十倍。让一个产品百无一失和让它万无一失的难度不是一个级别的。

    • 家园 鼓掌!另外就是算俺们中国本土的,中芯的.13也起步乐!
分页树展主题 · 全看 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河