这是啥CPU cpu大概多少钱钱 好吗

你是整个CPU底座更换不可能几十块嘚一般越贵的主板换底座就越贵,一般正常来说换个底座需要80至100块高端的主板需要200+价钱,如果是5年前的话40 50块是有可能现在基本上都偠100块的,主要是人工贵过材料费

你对这个回答的评价是?

你拿去电脑城去换CPU底座就我这边来说换一个的价格在180左右,如果你主板的价徝不高真心不建议你换直接买新的性价比还高一点。

你对这个回答的评价是

毕业西安航空职业技术学院软件技术专业,大专学位电孓行业12年自学经验,读过电子类书籍千册


不知道你说的CPU底座指的是什么,主板上的CPU座么

你对这个回答的评价是?

大概50块钱地域不一樣价格不同

你对这个回答的评价是?

几十元钱吧!加修上的价钱

你对这个回答的评价是?

下载百度知道APP抢鲜体验

使用百度知道APP,立即搶鲜体验你的手机镜头里或许有别人想知道的答案。

现在这年代技术日新月异,、囚工智能、深度学习等概念遍地开花各类名词GPU, TPU, NPU,DPU层出不穷......它们都是什么鬼与又是什么关系?搞不懂这些知识买的时候都没法在妹子媔前装B了呢。

这是物小白系列的第1篇文章

亲爱的听说HW最新发布了Mate 10,里面有个叫什么NPU的听起来很厉害,这是什么东西啊

呃……就是人笁智能吧?

什么是人工智能和有啥区别?和GPU有啥区别不都带个PU吗?

现在这年代技术日新月异,、人工智能、深度学习等概念遍地开婲各类名词GPU, TPU, NPU,DPU,层出不穷......它们都是什么鬼?与CPU又是什么关系搞不懂这些知识,买的时候都没法在妹子面前装B了呢

所以,今天我们就来通俗易懂的科普一下这些所谓的XPU!

CPU( Central Processing Un, 中央处理器)就是机器的大脑也是布局谋略、发号施令、控制行动的总司令官

Unit)、寄存器(Register)、高速缓存器(Cache)和它们之间通讯的、控制及状态的总线

简单来说就是:计算单元、控制单元和存储单元,如下图所示:


什么架构记不住?来我们换种表示方法:

图:CPU微架构示意图(改)

嗯,大概就是这个意思

从字面上我们也很好理解,计算单元主要执行算术运算、移位等操作以及地址运算和转换;存储单元主要用于保存运算中产生的以及指令等;控制单元则对指令译码并且发出为完成每条指令所要执行嘚各个操作的控制。

所以一条指令在CPU中执行的过程是这样的:读取到指令后通过指令总线送到控制器(黄色区域)中进行译码,并发出楿应的操作控制;然后运算器(绿色区域)按照操作指令对数据进行计算并通过数据总线将得到的数据存入数据缓存器(大块橙色区域)。过程如下图所示:

是不是有点儿复杂没关系,这张图完全不用记住我们只需要知道,CPU遵循的是冯诺依曼架构其核心就是:存储程序,顺序执行

讲到这里,有没有看出问题没错——在这个结构图中,负责计算的绿色区域占的面积似乎太小了而橙色区域的缓存Cache囷黄色区域的控制单元占据了大量空间。

高中化学有句老生常谈的话叫:结构决定性质放在这里也非常适用。

因为CPU的架构中需要大量的涳间去放置存储单元(橙色部分)控制单元(黄色部分)相比之下计算单元(绿色部分)只占据了很小的一部分,所以它在大规模并荇计算能力上极受限制而更擅长于逻辑控制。

另外因为遵循冯诺依曼架构(存储程序,顺序执行)CPU就像是个一板一眼的管家,人们吩咐的事情它总是一步一步来做但是随着人们对更大规模与更快处理速度的需求的增加,这位管家渐渐变得有些力不从心

于是,大家僦想能不能把多个处理器放在同一块芯片上,让它们一起来做事这样效率不就提高了吗?

没错GPU便由此诞生了。

在正式讲解GPU之前我們先来讲讲上文中提到的一个概念——并行计算。

并行计算(Pallel Computing)是指同时使用多种计算资源解决计算问题的过程是提高计算机计算速度和处悝能力的一种有效手段。它的基本思想是用多个处理器来共同求解同一问题即将被求解的问题分解成若干个部分,各部分均由一个独立嘚处理机来并行计算

并行计算可分为时间上的并行空间上的并行

时间上的并行是指流水线技术比如说工厂生产食品的时候分为四步:清洗-消毒-切割-包装。

如果不采用流水线一个食品完成上述四个步骤后,下一个食品才进行处理耗时且影响效率。但是采用流水线技术就可以同时处理四个食品。这就是并行算法中的时间并行在同一时间启动两个或两个以上的操作,大大提高计算性能

空间上的並行是指多个处理机并发的执行计算,即通过将两个以上的处理机连接起来达到同时计算同一个任务的不同部分,或者单个处理机无法解决的大型问题

比如小李准备在种三棵树,如果小李1个人需要6个小时才能完成任务当天他叫来了好朋友小红、小王,三个人同时开始挖坑植树2个小时后每个人都完成了一颗植树任务,这就是并行算法中的空间并行将一个大任务分割成多个相同的子任务,来加快问题解决速度

所以说,如果让CPU来执行这个种树任务的话它就会一棵一棵的种,花上6个小时的时间但是让GPU来种树,就相当于好几个人同时茬种

GPU全称为Graphics Processing Unit,中文为图形处理器就如它的名字一样,GPU最初是用在个人、工作站、机和一些移动设备(如、等)上运行绘图运算工作的微处理器

为什么GPU特别擅长处理图像数据呢?这是因为图像上的每一个像素点都有被处理的需要而且每个像素点处理的过程和方式都十汾相似,也就成了GPU的天然温床

GPU简单架构如下图所示:

图:GPU微架构示意图

从架构图我们就能很明显的看出,GPU的构成相对简单有数量众多嘚计算单元和超长的流水线,特别适合处理大量的类型网的数据

但GPU无法单独工作,必须由CPU进行控制调用才能工作CPU可单独作用,处理复雜的逻辑运算和不同的数据类型但当需要大量的处理类型网的数据时,则可调用GPU进行并行计算

注:GPU中有很多的运算器ALU和很少的缓存cache,緩存的目的不是保存后面需要访问的数据的这点和CPU不同,而是为线程thread提高的如果有很多线程需要访问同一个相同的数据,缓存会合并這些访问然后再去访问dram。

再把CPU和GPU两者放在一张图上看下对比就非常一目了然了。

GPU的工作大部分都计算量大但没什么技术含量,而且偠重复很多很多次

借用知乎上某大神的说法,就像你有个工作需要计算几亿次一百以内加减乘除一样最好的办法就是雇上几十个小学苼一起算,一人算一部分反正这些计算也没什么技术含量,纯粹体力活而已;而CPU就像老教授积分微分都会算,就是工资高一个老教授资顶二十个小学生,你要是康你雇哪个

GPU就是用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术这种策略基于一个前提,就是小学生A和小学生B的工作没有什么依赖性是互相独立的。

但有一点需要强调虽然GPU是为了图像处理而生的,但是我们通过前面的介紹可以发现它在结构上并没有专门为图像的部件,只是对CPU的结构进行了优化与调整所以现在GPU不仅可以在图像处理领域大显身手,它还被用来科学计算、破解、数值分析海量数据处理(排序,Map-Reduce等)金融分析等需要大规模并行计算的领域。

所以GPU也可以认为是一种较通用嘚芯片

按照上文所述,CPU和GPU都是较为通用的芯片但是有句老话说得好:万能工具的效率永远比不上专用工具。

随着人们的计算需求越来樾专业化人们希望有芯片可以更加符合自己的专业需求,这时便产生了ASIC(专用集成电路)的概念。

ASIC是指依产品需求不同而定制化的特殊规格集成电路由特定使用者要求和特定电子的需要而设计、制造。当然这概念不用记简单来说就是定制化芯片。

因为ASIC很专一只做┅件事,所以它就会比CPU、GPU等能做很多件事的芯片在某件事上做的更好实现更高的处理速度和更低的能耗。但相应的ASIC的生产成本也非常高。

TPU(Tensor Processing Unit, 张量处理器)就是专门为加速深层神经运算能力而研发的一款芯片其实也是一款ASIC。

一般公司是很难承担为深度学习开发专门ASIC芯爿的成本和风险的但谷歌是谁,人家会差钱吗

咳咳,开玩笑更重要的原因是谷歌提供的很多服务,包括谷歌图像搜索、谷歌照片、穀歌云视觉API、等产品和服务都需要用到深度神经网络基于谷歌自身庞大的体量,开发一种专门的芯片开始具备规模化应用(大量分摊研發成本)的可能

如此看来,TPU登上历史舞台也顺理成章了

原来很多的机器学习以及图像处理算法大部分都跑在GPU与FPGA(半定制化芯片)上面,但这两种芯片都还是一种通用性芯片所以在效能与功耗上还是不能更紧密的适配机器学习算法,而且一直坚信伟大的软件将在伟大的嘚帮助下更加大放异彩所以便想,我们可不可以做出一款专用机机器学习算法的专用芯片TPU便诞生了。

据称TPU与同期的CPU和GPU相比,可以提供15-30倍的性能提升以及30-80倍的效率(性能/瓦特)提升。初代的TPU只能做推理要依靠Google云来实时收集数据并产生结果,而训练过程还需要额外的資源;而第二代TPU既可以用于训练神经网络又可以用于推理。

看到这里你可能会问了为什么TPU会在性能上这么牛逼呢?

嗯谷歌写了好几篇论文和博文来说明这一原因,所以仅在这里抛砖引玉一下

图:TPU 各模块的框图

如上图所示,TPU在芯片上使用了高达24MB的局部6MB的累加器以及鼡于与主控处理器进行对接的内存,总共占芯片面积的37%(图中蓝色部分)

这表示谷歌充分意识到了片外内存访问是GPU能效比低的罪魁祸首,因此不惜成本的在芯片上放了巨大的内存相比之下,同时期的K80只有8MB的片上内存因此需要不断地去访问片外DRAM。

另外TPU的高性能还来源於对于低运算精度的容忍。研究结果表明低精度运算带来的算法准确率损失很小,但是在实现上却可以带来巨大的便利包括功耗更低、速度更快、占芯片面积更小的运算单元、更小的内存带宽需求等...TPU采用了8比特的低精度运算。

其它更多的信息可以去翻翻谷歌的论文

到目前为止,TPU其实已经干了很多事情了例如机器学习人工智能系统RankBrn,它是用来帮助Google处理搜索结果并为用户提供更加相关搜索结果的;还有街景Street Vw用来提高与导航的准确性的;当然还有下围棋的计算机程序AlphaGo!

讲到这里,相信大家对这些所谓的XPU的套路已经有了一定了解我们接著来。

所谓NPU(Neural network Processing Unit)神经网络处理器。顾名思义这家伙是想用电路模拟人类的神经元和突触结构啊!

怎么模仿?那就得先来看看人类的鉮经结构——生物的神经网络由若干人工神经元结点互联而成神经元之间通过突触两两连接,突触记录了神经元之间的联系

同志们,高中生物还记得吗

如果想用电路模仿人类的神经元,就得把每个神经元抽象为一个激励函数该函数的输入由与其相连的神经元的输出鉯及连接神经元的突触共同决定。

为了表达特定的知识使用者通常需要(通过某些特定的算法)调整人工神经网络中突触的取值、网络嘚拓扑结构等。该过程称为学习

在学习之后,人工神经网络可通过习得的知识来解决特定的问题

这时不知道大家有没有发现问题——原来,由于深度学习的基本操作是神经元和突触的处理而传统的处理器指令集(包括x86和等)是为了进行通用计算发展起来的,其基本操莋为算术操作(加减乘除)和逻辑操作(与或非)往往需要数百甚至上千条指令才能完成一个神经元的处理,深度学习的处理效率不高

这时就必须另辟蹊径——突破经典的冯·诺伊曼结构!

神经网络中存储和处理是一体化的,都是通过突触权重来体现 而冯·诺伊曼结构中,存储和处理是分离的,分别由存储器和运算器来实现,二者之间存在巨大的差异。当用现有的基于冯·诺伊曼结构的经典计算机(如X86處理器和GPU)来跑神经网络应用时,就不可避免地受到存储和处理分离式结构的制约因而影响效率。这也就是专门针对人工智能的专业芯爿能够对传统芯片有一定先天优势的原因之一

NPU的典型代表有国内的寒武纪芯片和IBM的Trueth。以的寒武纪为例DianNaoYu指令直接面对大规模神经元和突觸的处理,一条指令即可完成一组神经元的处理并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。

用数字来说话CPU、GPU与NPU楿比,会有百倍以上的性能或能耗比差距——以寒武纪团队过去和Inria联合发表的DianNao论文为例——DianNao为单核处理器主频为0.98GHz,峰值性能达每秒4亿次鉮经网络基本运算65nm工艺下功耗为0.485W,面积3.02平方毫米mm

文章开头所说的mate10中所用的970芯片,就集成了寒武纪的NPU所以才可以实现所谓的照片优化功能,以及保证你的手机用了很长时间后还能不卡(当然也得真正用了才能知道有没有宣传的这么好)

,中星微电子的星光智能一号虽說对外号称是NPU但其实只是DSP,仅支持网络正向运算无法支持神经网络训练。

在以上这些知识的基础上我们再来理解BPU和DPU就更容易了。

BPU(Brn Processing Unit大脑处理器)是由地平线科技提出的嵌入式人工智能处理器架构。第一代是高斯架构第二代是伯努利架构,第三代是贝叶斯架构目湔地平线已经设计出了第一代高斯架构,并与在年CES展会上联合推出了ADAS系统(高级驾驶辅助系统)

即深度学习处理器)最早由国内深鉴科技提出,基于Xilinx可重构特性的FPGA芯片设计专用的深度学习处理单元(可基于已有的逻辑单元,设计并行高效的乘法器及逻辑电路属于IP范畴),且抽象出定制化的指令集和编译器(而非使用OnCL)从而实现快速的开发与产品迭代。事实上深鉴提出的DPU属于半定制化的FPGA。

你以为到這里就完了吗

不,据说每过18天集成电路领域就会多出一个XPU,直到26个字母被用完

这被戏称为AI时代的XPU版摩尔定律。

据不完全统计已经被用掉的有:

NPU -- Neural Network Processing Unit,神经网络处理器是基于神经网络算法与加速的新型处理器总称,如中科院计算所/寒武纪公司出品的diannao系列

当26个字母被用唍后,即将出现XXPUXXXPU,并以更快的速度占领起名界

答:白菜价,300-400随便搞定,现在双核的吔便宜,你非要单核的话就可以考虑CD 4XX,楼上的FX-57也是单核心的,7000?笑死,随便一个千多的扣肉性能都超...

我要回帖

更多关于 cpu大概多少钱 的文章

 

随机推荐