西西河

主题:【原创】亚投行的另类解毒 -- 百战长缨

共:💬43 🌺282 新:
全看分页树展 · 主题 跟帖
家园 CUDA和Xeon完全是两个架构好哇。

nvdia的那套东西是基于短pipeline并行,不涉及复杂逻辑处理,纯计算比较合适,还是主要应用于浮点和复数领域,包括时域和频域的傅立叶变换。很多操作符都是没有的,都要从头写,如果没有记错,它的除法就特别费事,因为最早的图形算法里基本不太用除法,所以shader语言里没有对除法做硬性要求,很多厂家的硬件都没有实现除法,nv,ATI都一样。另外它的片内cache很少,多线程的切换栈不能很深。

Xeon就不同了他是长pipeline的并行设计,通用处理器,多线程优化,最新的架构里连自旋锁都优化了,在逻辑事务处理方面非常强悍,自带强悍的浮点部件,性能不密nv差。

基本所有的优化都要推倒重来,而且实话说,nv的架构做人工智能模拟,会是个大坑,但是他被cpu调度去做浮点密集的东西倒是把好手。

本质nv也是米国公司,唯一靠谱就是吃透ARM,在此基础上建立自己的核心IP,可惜国内没有一个大厂和研究院有这个魄力,只会减现成的便宜,喊的口号只是安全可控,实质是别人的硬件后门都没有摸出几个。

通宝推:广宽,shinji,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河