您的位置:首页 - 硬件频道 - CPU - CPU行情|新闻 - 正文
Intei秘密测试双核CPU内部传输
文章来源:天新网 文章作者: 发布时间:2006-06-21
[摘要]
    2006年,双核处理器的普及趋势势不可挡,各项测试均表明了双核处理器在多线程运算中的巨大优势,但在之前似乎还没有谁测试过两颗核心间的数据交换速度。
[正文]
   

Intel Core Duo (Yonah)

 

  下面测试的对象是当前Intel移动平台的主力军Core Duo T2400 ,该CPU主频为1833MHz,Core Duo作为Intel目前主流技术的代表,最大的特点就是采用了共享型的二级缓存设计。

Intel Core Duo


  由于采用共享L2缓存,因此当数据在第一核心内进行操作时应该可以被第二核心“看到”,我们很期待好成绩的诞生。

Pic.21: Intel Core Duo (Yonah). 顺序读取载入另一核心未修改数据.

Pic.21: Intel Core Duo (Yonah). 随机读取载入另一核心未修改数据.


  在进行1MB以下的未修改数据读取时,延迟为14个时钟周期,可以确信这来自于L2缓存内部的延迟。也许会有爱好者提出疑问,Core Duo拥有2MB缓存,但为什么数据块在2MB时延迟会大幅度提升?这主要是由于TLB的大小决定的,由于TLB只能同时处理1024KB的,当新页面被读取时,将会进行相当耗时的虚拟地址转换过程。那么再让我们来看一下Core Duo在读取修改数据时的成绩如何。

Pic.22 : Intel Core Duo (Yonah). 顺序读取载入另一核心已修改数据

Pic.23: Intel Core Duo (Yonah). 随机读取载入另一核心已修改数据

  结果似乎不是很清晰,但让我们试着理解一下。数据块为1MB时延迟最低,但随着数据块的减小,延迟逐渐增大,在32KB时达到峰值,注意,32KB其实就是L1的大小。难道测试结果出错了?对比一下我们就可以发现读取接近L1大小数据块时的图形和前面的Athlon 64 X2 很相似,同样的阶梯型变化,每阶的为11个时钟周期,恰好为T2400的倍频。因此,我们可以得出结论:在读取修改数据时Core Duo采用了和Athlon 64 X2、Pentium D 相同的方式,待处理数据首先要通过系统总线的传送才能到达第二颗核心。这是由于Core Duo采用了回写型缓存策略,因此当数据没有在L2中命中时,第二核心会通过系统总线发出请求指令,第一核心也就会通过系统总线传送数据。暂时我们还不清楚Intel选择系统总线交换数据的原因,但这肯定是针对Core Duo的一些特性作出的最佳选择。

Intel Conroe

  本次测试的最后一颗处理器是将于下个月正式上市的Conroe,测试使用的为Conroe工程样板,工作于2.4G的频率,高达4MB的共享缓存。

Pic.24: Intel Conroe. 顺序读取载入另一核心未修改数据

Pic.25: Intel Conroe. 随机读取载入另一核心未修改数据

Pic.26: Intel Conroe. 顺序读取载入另一核心已修改数据

Pic.27: Intel Conroe. 随机读取载入另一核心已修改数据

  从图中可以马上发现测试结果与Yonah很相似,但在延迟上还有些差异。
首先,未修改数据的读取延迟和L2缓存延迟吻合(图24、25)。很有趣的是,Conroe居然在随机读取和顺序读取中具有不同的延迟周期,顺序读取时延迟有12个时钟周期(图24),而随机读取时延迟增加到了14个时钟周期(图25),因此我们很难判断L2缓存的实际延迟。
接下来,在读取修改数据时 Conroe的表现和Yonah很相似,但延迟增加的幅度相对Yonah小了不少(图26、27)。止第一条线程的操作测试系统内存的读取速度。

 

Pic.28: Intel Conroe. 从系统内存顺序读取数据

Pic.29: Intel Conroe.从系统内存随机读取数据


  可以看到Conroe在这种情况下工作效率相当高(图28、29),如此高速的内存传输解释了读取时的低延时现象。

  因此,修改数据在Conroe平台上的传输速度远高于Yonah平台,但仍然需要经过系统内存。

结论

  从测试中可以看到,使用独立缓存的双核处理器在两个逻辑核心交流上速度均比较慢,仅有Intel的Core Duo(Yonah)及Conroe采用了共享缓存并具有较快的核心间交流速度,但在数据被修改后速度也将减慢。当前对于双核处理器来说运行效率最高的方式是多线程在独立缓存上操作或对共享缓存上的未修改数据进行操作。由于操作系统在任务交换时会改变线程的分配方式,降低了缓存中的命中率,当前提高性能最现实的方法就是严格执行对各核心间的线程分配。


 
共3页: 上一页 [1] [2] 3 下一页
↑返回顶部   打印本页   关闭窗口↓  
 推荐文章
·[CPU价格战]令AMD汗颜的31款CPU
 
 热点文章
·2006年 Intel至强服务器处
·解密AMD K8L核心架构图
·Core和45纳米:英特尔反击
·温度逼近绝对零度,IBM将
·CPU双雄7月决战前夜实录
·英特尔单核上演壮士断腕
·[CPU价格战]令AMD汗颜的31
 
 相关文章