我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 预取 >

AMD是什么?

归档日期:07-20       文本归类:预取      文章编辑:爱尚语录

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  公司概览AMD(Advanced Micro Devices的英文缩写, 超威半导体 注释:Advanced为先进的,Micro为微小之意 英文直译为 先进微半导体,但是AMD公司为自己的中文命名是超威半导体 所以也可称为超微半导体 这里使用的是官方说法) 成立于 1969 年,总部位于加利福尼亚州桑尼维尔。 AMD 公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器、闪存和低功率处理器解决方案。 AMD 致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。其在CPU市场上的占有率仅次于Intel。

  AMD 在全球各地设有业务机构, 在美国、中国、德国、日本、马来西亚、新加坡和泰国设有制造工厂,并在全球各大主要城市设有销售办事处,拥有超过 1.6万名员工 。 2004 年, AMD 的销售额是 50 亿美元。

  AMD 有超过 70% 的收入都来自于国际市场,是一家真正意义上的跨国公司。公司在美国纽约股票交易所上市,代号为 AMD。

  业务发展在 AMD,坚持“客户为本 推动创新”的理念,这是指导 AMD 所有业务运作的核心准则。

  AMD与客户建立了成功的合作关系,以便更加深入地了解他们的需求;AMD与技术领袖开展了密切的合作,以开发下一代解决方案,拓展全球市场和推广 AMD 的品牌;我们还与一些以克服艰巨困难并依靠技术获得成功的世界级领先者建立了合作关系。

  迄今为止,全球已经有超过 2,000 家软硬件开发商、 OEM 厂商和分销商宣布支持AMD64位技术。 在福布斯全球 2000 强中排名前 100 位的公司中, 75% 以上在使用基于 AMD 皓龙 处理器的系统运行企业应用,且性能获得大幅提高。

  对于需要高性能计算和 IT 基础设施的企业用户来说, AMD 提供一系列解决方案

   AMD 486DX(1993年)微处理器,核心代号P4,AMD自行设计生产的第一代486产品。而后陆续推出了其他486级别

  的产品,常见的型号有:486DX2,核心代号P24;486DX4,核心代号P24C;486SX2,核心代号P23等。其它

  衍生型号还有486DE、486DXL2等,比较少见。AMD 486的最高频率为120MHz(DX4-120),这是第一次在频率上超越了强大的竞争对手Intel。

   AMD 5X86(1995年)微处理器,核心代号X5,AMD公司在486市场的利器。486时代的后期,TI(德州仪器)推出了高性价比的TI486DX2-80,很快占领了中低端市场,Intel也推出了高端的Pentium系列。AMD为了抢占市场的空缺,便推出了5x86系列CPU(几乎是与Cyrix 5x86同时推出)。它是486级最高频的产品----33*4、133MHz,0.35微米制造工艺,内置16KB一级回写缓存,性能直指Pentium75,并且功耗要小于Pentium。

   AMD K5(1997年)微处理器,1997年发布。因为研发问题,其上市时间比竞争对手Intel的经典奔腾晚了许多,再加上性能并不十分出色,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力比不上Cyrix 6x86,但比经典奔腾略强;浮点预算能力远远比不上经典奔腾,但稍强于Cyrix 6x86。综合来看,K5属于实力比较平均的产品,而上市之初的低廉的价格比其性能更加吸引消费者。另外,最高端的K5-RP200产量很小(惯例吧:)并且没有在中国大陆销售。

  686技术之后的力作。它同样包含了MMX指令集以及比Pentium MMX整整大出一倍的64KB的L1缓存!整体比

  较而言,K6是一款成功的作品,只是在性能方面,浮点运算能力依旧低于Pentium MMX。

   K6-2(1998年)系列微处理器曾经是AMD的拳头产品,现在我们称之为经典。为了打败竞争对手Intel,AMD K6-2系列微处理器在K6的基础上做了大幅度的改进,其中最主要的是加入了对3DNow!指令的支持。3DNow!指令是对X86体系的重大突破,此项技术带给我们的好处是大大加强了计算机的3D处理能力,带给我们线D表现。当你使用专门为3DNow!优化的软件时就能发现,K6-2的潜力是多么的巨大。而且大多数K6-2并没有锁频,加上0.25微米制造工艺带给我们的低发热量,能很轻松的超频使用。也就是从K6-2开始,超频不再是Intel的专有名词。同时,.K62也继承了AMD一贯的传统,同频型号比Intel产品价格要低25%左右,市场销量惊人。K6-2系列上市之初使用的是K6 3D这个名字(3D即3DNow!),待到正式上市才正名为K6-2。正因为如此,大多数K6 3D为ES(少量正式版,毕竟没有量产:)。K6 3D曾经有一款非标准的250MHz产品,但是在正式的K6-2系列中并没有出现。K6-2的最低频率为200MHz,最高达到550MHz。

   AMD于1999年2月推出了代号为Sharptooth(利齿)的K6-3(1998年)系列微处理器,它是AMD推出的最后一款支持Super架构和CPGA封装形式的CPU。K6-3采用了0.25微米制造工艺,集成256KB二级缓存(竞争对手Intel的新赛扬是128KB),并以CPU的主频速度运行。而曾经Socket 7主板上的L2此时就被K6-3自动识别为了L3,这对于高频率的CPU来说无疑很有优势,虽然K6-3的浮点运算依旧差强人意。因为各种原因,K6-3投放市场之后难觅踪迹,价格也并非平易近人,即便是更加先进的K6-3+出现之后。

  AMD于2001年10月推出了K8架构。尽管K8和K7采用了一样数目的浮点调度程序窗口(scheduling window ),但是整数单元从K7的18个扩充到了24个,此外,AMD将K7中的分支预测单元做了改进。global history counter buffer(用于记录CPU在某段时间内对数据的访问,称之为全历史计数缓冲器)比起Athlon来足足大了4倍,并在分支测错前流水线中可以容纳更多指令数,AMD在整数调度程序上的改进让K8的管线深度比Athlon多出2级。增加两级线管深度的目的在于提升K8的核心频率。在K8中,AMD增加了后备式转换缓冲,这是为了应对Opteron在服务器应用中的超大内存需求。

  采用K10架构的 Barcelona为四核并有4.63亿晶体管。Barcelona是AMD第一款四核处理器,原生架构基于65nm工艺技术。和Intel Kentsfield四核不同的是,Barcelona并不是将两个双核封装在一起,而是真正的单芯片四核心。

  Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。

  而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。

  提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。

  当年当AMD将内存控制器集成至CPU内部时,我们看到了崭新而强大的K8构架。如今,Barcelona的内存控制器在设计上将又一次极大的改进其内存性能。

  Intel Xeon服务器所有使用的FB-DIMM内存一大优势是,可以同时执行读和写命令到AMB,而在标准的DDR2内存中,你只能同时进行一个操作,而且读和写的切换会有非常大的损失。如果是一连串的随机混合执行的话,将会带来非常严重的资源浪费,而如果是先全部读然后再转换到写的话,就可以避免性能的损失。K8内存控制器就采用读取优先于写的策略来提高运行效率,但是Barcelona则更加智能化。

  但是读取的数据会被先存放在buffer中,而不采用先直接执行写,但当它的容量达到了极限就会溢出,为了避免这种情况,在此之前才对读写之间进行切换,同时可以带来带宽和延迟方面效率的提高。K8核心配备的是128-bits宽度的单内存控制器,但是在Barcelona中,AMD把它分割成两个64-bit,每个控制器可以独立的进行操作,因此它可以带来效率上的不小提升,尤其是在四核执行的环境下,每个核心可以独立占有内存访问资源。

  Barcelonas中集成的北桥部分(注意不是主板北桥)也被设计成更高的带宽,更深的buffers将允许更高的带宽利用率,同时北桥自身已经可以使用未来的内存技术,比如DDR3。

  内存控制器的预取功能是运用相当广泛、十分重要的一项功能。预取可以减少内存延迟对整体性能的负面影响。当NVIDIA发布nForce2主板时,重点介绍的就是nForce2芯片组的128位智能预取功能。Intel在发布Core 2处理器之时也强调了CORE构架每核心拥有三个预取单元。

  K8构架中每个核心设计有2个预取器,一个是指令预取器,另一个是数据预取器。K8L构架的Barcelona保持了2个的数量,但在性能上有了较大的改进。一个明显的改进是数据预取器直接将数据寄存入L1缓存中,相比K8构架中寄存入L2缓存的做法,新的数据预取器准确率更高,速度更快,内存性能及CPU整体性能将得益于此。

  受工艺技术方面的影响,AMD处理器的缓存容量一直都要落后于Intel,AMD自己也清楚自己无法在宝贵的die上加入更多的晶体管来实现大容量的缓存,但是勇于创新的AMD却找到了更好的办法——集成内存控制器。

  处理器整合内存控制器可以说是一项杰作,拥有整合内存控制器的K8构架仅依靠512KB的L2缓存就能够击败当时的对手Pentium 4。直到现在的Athlon 64 X2也依然保持着Intel 2002年就已过时的512KB L2缓村。

  Barcelona的缓存体系和K8构架有一定的相似之处,它的四颗核心各拥有64KB的L1缓存和512KB的L2缓存。从简化芯片设计的角度来看,四核心共享巨大的L2缓存对K8L构架而言并不合适,所以AMD引入了L3缓存,得益于65nm工艺,Barcelona在一颗晶圆上集成四颗核心外,还集成了一块2MB容量的L3缓存。也就是说L3缓存与4颗内核同样原生于一块晶圆,其容量为最小2M起跳。同L2缓存一样,L3缓存也是独立的,L1缓存的数据和L3缓存的数据将不会重复。

  Barcelona的缓存工作原理是:L2缓存是作为L1缓存的备用空间。L1缓存储存着CPU当前最需要的数据,而当空间不足时,一些不是最重要的数据就转移到L2缓存中。而当未来再次需要时,则从L2缓存中再次转移到L1缓存中。新加入的L3缓存延续了L2缓存的角色,四颗核心的L2缓存将溢出的数据暂时寄存在L3缓存中。

  L1缓存和L2缓存依然分别是2路和16路,L3缓存则是32路。快速的32路L3缓存不仅可以更好的满足多任务并行,而且对单任务的执行也有着较大积极作用。尤其在3D运用方面,2MB的L3缓存将对性能产生极大的推进作用。

本文链接:http://williamzanker.com/yuqu/362.html