请选择 进入手机版 | 继续访问电脑版

Exynos4412/4418/6818/i.MX6开发板俱乐部

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1359|回复: 1

中立者的话,别小看ARM,实测结果显示Cortex-A9单核同频胜过Atom单线程!

[复制链接]

44

主题

123

帖子

389

积分

版主

Rank: 7Rank: 7Rank: 7

积分
389
发表于 2014-8-14 22:44:54 | 显示全部楼层 |阅读模式
作为中立者,深信不带感情色彩、以最普通的常识看待问题就会得到比较客观的结论。
(想发言的人请先看完3楼实测结果)

先看大背景,Intel作为业界巨头,资金技术上实力底蕴深厚,设计能力绝不作第二人想,事实也是如此,Atom以物理单核+超线程来抗衡ARM的物理双核而不落下风,还在不少地方能占到上风,这充分表现出Intel的实力,而ARM作为后来者,有前人的经验作参考,站在前人的肩膀上,设计成果即使不能超过前辈,也理应相差无几。而Atom和Cortex A9都不属于芯片技术的最尖端,即使在几年前它们诞生时使用的也都是成熟的芯片技术,而非前沿科技,因此,没有理由认为任何一方在设计上能够做到对手所做不到的事情,双方理应是旗鼓相当。

再看双方的架构比较(这里顺便加上A15),其实双方的相似度很高,主要差别在于:

1、Atom和A9都是双发射,Atom是顺序执行,而A9是乱序执行,乱序执行可以带来性能提升约10%~20%;
2、Atom有2个浮点单元,而A9只有1个,浮点是ARM的传统弱项,即使A15也不能和Atom相提并论;
3、整数部分都有2个运算单元ALU,A9多1个专用乘法单元,Atom则多1个地址单元AGU(也许这是Atom的预取能力和分支能力强过ARM的部分原因?);
4、Atom有2份寄存器文件,这是为超线程准备的,Atom超线程的效率很高,性能提升可达40%~50%,而非core架构的通常30%,但这恰恰反映了Atom的弱点而非优点,因为Atom是顺序执行,所以很多时候不能充分利用计算资源,所以HT效率反而更高,而HT大大弥补了Atom单线程能力不强的弱点,这充分反映了Intel的技术实力,另一方面,ARM则直接使用物理双核,计算资源加倍;
5、ARM的L1数据cache和L2 cache都要超过Atom。

从以上的比较可以看出,在物理资源上,A9双核大大超过Atom单核HT,A9双核有4发射、4 ALU、2 MUL、2 AGU,L1、L2都至少双倍于Atom单核HT,还能乱序执行,而Atom单核HT只有2发射、2 ALU、0 MUL、2 AGU,L1、L2都不到一半,且只能顺序执行。Atom所能凭借的只有提高单核频率,通过高频+HT来对抗双核。但要说Atom单核同频就能超过A9双核,这在双方设计能力相当的情况下,从常理上看是说不通的,它所依赖的物理资源从何而来?由于物理资源所限,即使Intel的设计能力再强,还是不能无中生有,能够凭借只有一半的物理资源就能达到基本相当的性能,已经充分说明Intel的强悍了。

顺便说一下A15,它有3发射,乱序执行,AGU和FPU方面和Atom比也补上了数量上的不足,还多1个MUL,cache也多得多,因此,即使3发射+乱序的效率不能超过HT,也应该相差无几,所以A15单核同频的性能和Atom单核HT的性能很可能是相当的,也许还会略胜一筹。


回复

使用道具 举报

44

主题

123

帖子

389

积分

版主

Rank: 7Rank: 7Rank: 7

积分
389
 楼主| 发表于 2014-8-14 22:45:44 | 显示全部楼层
最后看实际测试结果。

先作一个粗略计算,Atom 1.6G Hz,加上HT算提高30~50%效率,性能指数就是2.1~2.4,而ARM的A9双核1G Hz,乱序执行可提高10%~20%效率,双核加倍,性能指数就是2.2~2.4,和前者正好相当。

所以,Atom 1.6G Hz单核双线程和A9 1G Hz双核的性能是大致相当的,实际测试结果也基本证实这一结论。


实测贴中的 OMAP4 PandaBoard ES 的成绩和另外一个测试成绩帖子中的相当,而另一个A9平台 Exynos 4210 1.2GHz 的测试成绩则基本都胜过Atom,且成绩换算下来降频为1G Hz左右和Atom就差不多了,这证实了上述结论,也侧面说明了 OMAP4 PandaBoard ES 的成绩是平台问题。

简单分析一下全部测试项目,

1、Dhrystone 2,整数MIPS性能测试,单线程,200万对320万,正好符合频率比1:1.6,说明单核单线程同频整数性能相当;
2、cache性能不分析,有人说没用,但能够接近PM和Core2 T2400的cache性能总是好事;
3、C-Ray,不知道是什么测试,多线程,比PM1.86G还快,说明双核还是有用;
4、压缩测试,多数能快于Atom,但慢于PM和C2,不过考虑到ARM平台是SD卡,PM和C2平台是机械硬盘,实际差距可能没有那么大;
5、MP3编码,快于Atom,慢于PM和C2,看起来应该是多线程的表现,但PM又和T2400一样,不解;
6、dcraw,慢于Atom,如果是单线程,那很好理解,频率差距,如果是多线程,PM又和T2400一样,不解;
7、Graphics smagick,都是大大强于atom,而接近PM1.86G的水平;
8、MAFFT,强于atom;
9、N-Queens,看起来是单线程,略强于Atom,别忘了ARM是单核1.2G;
10、NAS Parallel Benchmarks,看起来是和存储服务器有关的测试,大大强于Atom;
11、openssl RSA 4096bit,大大强于Atom;
12、Disk transaction,以SD卡来比机械硬盘,当然是完败;
13、RAMspeed SMP,有些测试强于Z530弱于N270,有些测试则大大弱于Atom,有些测试却强于PM1.86G,但其中不少测试Atom大大超过PM1.86G,看来Atom也不是人们所说的那么弱;
14、SciMark,与Atom互有胜负;
15、AI chess,单线程,考虑到频率差距,恰好处于N270和Z530中间;
16、解压linux内核,考验磁盘;
17、视频编码,弱于Atom,考虑到不可避免有浮点运算,很正常
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|迅为电子 ( 京ICP备12036083号-2

GMT+8, 2019-6-20 22:59 , Processed in 0.071205 second(s), 21 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表