在2002年之前,跟着芯片密度的添加, CPU的时钟频率也一向不断添加。 关于一般顾客而言,CPU 的频率就代表核算机的快慢。 1981年最早出厂的 IBM PC, CPU 的频率是 4.77 兆赫, 相当于一秒钟四百七十七万个时钟周期。 假定 CPU 一个时钟周期能够运转一条指令, 频率越高, 就算得越快。
1995年的飞跃芯片,时钟频率达到了 100 兆赫, 是 1980年的二十倍还多。
而到了 2002年, 英特尔新式飞跃芯片时钟频率第一次打破 3000 兆赫 (3 GHz)。
约束时钟频率的第一个首要物理约束条件是: 信号在晶体管之间传输的迟滞。 这也是为什么晶体管密度越大,时钟频率能够越高。
2002年之后, CPU 时钟频率添加遇到了第二个技能瓶颈: 能量消耗。
简单说, CPU的能量消耗和时钟频率的三次方近似成正比, 在 3 Ghz 之后, 频率的持续前进会使芯片过热而面对被焚毁的危险。
实际上, 2002 年之后, 英特尔CPU 的时钟频率大多一向在 2 GHz – 4 GHz 之间, 十四年来没有实质前进。
但时钟频率不再添加, 并不意味着 CPU 功能的停滞不前。 就像人类的大脑, 曩昔二十万年没有实质改变, 但并不意味着人类文明不会产生开天辟地的前进。
这时分,最有用的思路,是寻觅新的维度,去进攻解决问题。
假如说, CPU的时钟速度比如人脑的核算速度, 那么 CPU 的内存读取速度就比如人获取信息的速度。 这是提高 CPU 功能的第一个不同的维度。
有过根本作业或许研讨经历的人,都会有这样的领会:
大多数时分,约束作业效率的瓶颈是: 查材料,找东西。
找不到就只精干着急。
二十年前的科研者,查材料要去图书馆,小图书馆没有材料就要去更大的图书馆,没有核算机检索之前需求一张张翻卡片查。 查找材料的时刻,动辄便是几个小时乃至更多,超越了真实研讨剖析的时刻。 这和今日,十秒钟内就能够在互联网上,精准查找和下载世界上大部分论文材料,彻底不可同日而语。
电脑的内存架构,实际上要细分为 Register (寄存器), Cache (高速缓存), Memory(内存), Disk (硬盘)。 而缓存又能够细分为一级缓存 (Level 1 Cache), 二级缓存, 三级缓存, 乃至四级缓存。
打个比如, 寄存器上的数据,比如你手中那张纸上写的信息, 信息量很少,但立等可取。
一级缓存, 比如桌面上的书, 信息量多一些, 伸一下手能够拿到;
二级缓存, 比如抽屉里的书,翻开抽屉后依然很快能够拿到;
内存,比如书架上的书,要站起往来不断查找;
硬盘,便是图书馆的材料,需求花几个小时到外面跑一趟才能够查到了。
研讨者,假如无法敏捷获取需求的材料,天天要往图书馆跑,即便牛顿/爱因斯坦再世, 聪明的脑瓜也只能像高速的 CPU 相同, 无效地空转, 痛苦地在往来不断图书馆的道路上等候。
以 Intel 的 i7-4770 CPU 为例,其时钟频率 3.4 GHz. 一级和二级缓存,读取数据的推迟一般在 5 – 12个时钟周期,相当于约 2-4 纳秒。假如要到内存读取数据,迟滞则约 70 纳秒,等价于200多个时钟周期。假如内存找不到,不幸地要去硬盘查找,推迟超越 4 毫秒 (等价于四百万纳秒),再快的 CPU 时钟频率, 此刻也然并卵矣。
摩尔定律的开展,关于 CPU 的时钟速度,和一般内存 (DRAM) 的读取推迟上,前进速度是不相同的。其距离每年以 50%的速度添加。
为了缓解这个对立,高速缓存 (Cache) 最早是以外置的方式呈现在1985年的英特尔的 386的处理器上。
真实的芯片上的内置的缓存,最早是在1989年的 486处理器上呈现,其时容量只要 8 KB, 到九十年代容量前进到 16 KB.
缓存容量过大,会影响搜索速度,所以又呈现了二级, 三级缓存。 这里有许多奇妙的规划细节,此处不表。
缓存, 实质上便是以 SRAM (静态随机存储器)为根底的内存。 而SRAM, 实质上便是六个晶体管结构组成的逻辑单元, 如下图。
跟着晶体管的小型化,芯片规划者就不断在 CPU 芯片上添加更多的内置的高速缓存。
以 2015年九月英特尔出品的 14 纳米 i7-6560U 处理器为例, 它有两个内核 (core), 每个内核有 64 KB 的一级缓存, 256 KB 的二级缓存, 并同享一个 4 MB的三级缓存。
用于缓存的晶体管占整个CPU 芯片上的晶体管的份额,也从 486年代的 40%左右,到今日许多CPU上挨近 90%. (数据出处来自威斯康辛大学 Doug Burger 的论文, “Syetem-level Implication of Processor Memory Integration” )
换句话说,核算的办理,将近90%的内在, 实际上是对内存回忆的办理。
不论在什么职业,假如做到了高效地搜索和存储海量的数据, 你或许就现已成功了90%.