|
|
s****y 发帖数: 581 | 3 看这个CPU info的按几个processor买Oracle DB license?
现在要买Oracle Databse的Processor License, 怎么用cat /proc/cpuinfo发现有
这么多(16个)processor,那一个server的license就得几十万,老板不疯掉? 不
知道我按16x $/per processor license 来算对不对?下面是我们的server的CPU
info:
>cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 10
model name : Intel(R) Xeon(R) CPU X5570 @ 2.93GHz
stepping : 5
cpu MHz : 2926.154
cache size : 8192 KB
physical id : 1
siblings : 8
core id : 8... 阅读全帖 |
|
s****y 发帖数: 581 | 4 【 以下文字转载自 Database 讨论区 】
发信人: sexboy (塞葫芦), 信区: Database
标 题: 看这个CPU info的按几个processor买Oracle DB liense?
发信站: BBS 未名空间站 (Sun Aug 28 21:55:09 2011, 美东)
看这个CPU info的按几个processor买Oracle DB license?
现在要买Oracle Databse的Processor License, 怎么用cat /proc/cpuinfo发现有
这么多(16个)processor,那一个server的license就得几十万,老板不疯掉? 不
知道我按16x $/per processor license 来算对不对?下面是我们的server的CPU
info:
>cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 10
model name : Intel(R) Xeon(R... 阅读全帖 |
|
s****y 发帖数: 581 | 5 【 以下文字转载自 Database 讨论区 】
发信人: sexboy (塞葫芦), 信区: Database
标 题: 看这个CPU info的按几个processor买Oracle DB license?
发信站: BBS 未名空间站 (Sun Aug 28 21:55:09 2011, 美东)
看这个CPU info的按几个processor买Oracle DB license?
现在要买Oracle Databse的Processor License, 怎么用cat /proc/cpuinfo发现有
这么多(16个)processor,那一个server的license就得几十万,老板不疯掉? 不
知道我按16x $/per processor license 来算对不对?下面是我们的server的CPU
info:
>cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 10
model name : Intel(R) Xeon(... 阅读全帖 |
|
s****y 发帖数: 581 | 6 有谁知道下面的配置算4个processor吗?是不是也是2 sockets?
>cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 7
model name : Intel(R) Xeon(R) CPU E5405 @ 2.00GHz
stepping : 6
cpu MHz : 1995.018
cache size : 6144 KB
physical id : 0
siblings : 4
core id : 0
cpu cores : 4
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 10
wp : yes
flags :... 阅读全帖 |
|
y***e 发帖数: 676 | 7 提供了很多信息,慢慢看
CHENGDU B1/B2 VALIDATION STUDY
¶1. (U) SUMMARY: Consulate Chengdu's Fraud Prevention Unit
(FPU) conducted a validation study of all private Chinese
passport holders who were issued B1/B2 visas in CY2008. Based
on a review and analysis of 800 randomly-selected visa
issuances, the illegal overstay rate was found to be 2.0
percent. Nearly half of the applicants who illegally overstayed
their visas were parents going to visit children living in the
United States. Most of the ot... 阅读全帖 |
|
|
t*******r 发帖数: 22634 | 9 或者这么说,以前那破 286,啥事都在 CPU 里面全干了。。。后来人们
发现这么搞速度上不去,于是搞了最先进的 Core2Duo Quad Core,里面
四个 core 并行,四条超级标量流水钱,N 个内置 FPU 浮点协处理单元,
外加 L1 / L2 / L3 高速缓存,还带 SIMD 向量计算指令。。。结果
有人跑过来,只看见 FPU,说你特么这 FPU 浮点协处理单元怎么
这么弱,除了算浮点数其他啥都不会干。但人家有 CPU,还有四个,
没看见?。。。另一人跑过来说,只看见 SIMD 指令,说你特么SIMD
向量指令为啥要 8 个数一起算,这么死板。但人家不是没有普通
标量指令是不是?。。。还有一个人跑过来,只看见 L1 / L2 / L3
缓存,说你特么这先进芯片是不是弱智,就只能暂时保存一下数据。
我都不说啥了。。。
。 |
|
a***e 发帖数: 27968 | 10 64bit almost has nothing to do with the FPU.
32bit CPU could have the same DP FPU.
for RISC, you might see quite some benefit from 32 to 64 ISA
when using DP FPU though. |
|
t****2 发帖数: 138 | 11 早年的机器里是没有FPU的,浮点运算用CPU模拟的,太慢太慢了。后来有了单独的FPU
,再后来的486革命性的把FPU做到CPU里面去了,现在虽然速度上过的去了,但int还是
比double快的多。 |
|
d****i 发帖数: 4809 | 12 现在很多ARM处理器都已经有FPU了,1G的基本上肯定带FPU的。不带FPU的基本上都是用
于低成本,低功耗,低主频的处理器。 |
|
d****i 发帖数: 4809 | 13 现在很多ARM处理器都已经有FPU了,1G的基本上肯定带FPU的。不带FPU的基本上都是用
于低成本,低功耗,低主频的处理器。 |
|
l*******n 发帖数: 635 | 14 要流片至少2018年了。
这个只是IBM不想失去中国市场的对应之策吧。
参考 http://lt.cjdby.net/thread-1920317-1-1.html
IBM不卖的东西:
1. FPU不卖,美国政府不让卖。
2. 高速互联不卖,比如组成8路服务器 的技术,没有卖。
3. 美国的安全算法,不让卖。当然,中国也不要,要开发自己的国密算法。
浮点处理单元FPU不开源,这个得靠56所(江南所)。
高速互联这块,其实是国防科大的长处。天河2号上的高速互联,就是国防科大自己的
技术兼芯片。 |
|
t******l 发帖数: 10908 | 15 其实从这个角度说,现在某些教育学千老在认知研究方面,认为 working memory 比如
phonological loop / visuospatial sketchpad 等等等等,在人类大脑智力方面的重
要程度,比以前看起来更重要。
我觉得这个思路应该是对的,working memory 应该是法拉利而不是班尼路菜篮子的一
部分。
但我觉得千老的问题在于,把 working memory 仅仅看成 flash memory。。。但
working memory 放马工学上不是 CPU 也是 FPU 或者 GPU 。。。所以千老们的问题,
可能是指侧重速度容量这种 flash memory 的物理硬指标,而忽略了更重要的比如 超
级标量流水线 / 高级浮点向量指令集 这种 CPU / FPU / GPU 的结构复杂性和先进性
。。。而造成智商测试研究里的一种南辕北辙的喜感。
http://en.m.wikipedia.org/wiki/Working_memory |
|
a***e 发帖数: 27968 | 16 不需要SSE指令,就是裸的FPU
intel的3条ALU/FPU都是128位的
i7-980x是6核
人算得也不是fmad这种特殊指令,
fmad对操作数有要求,
和俩乘法不一样 |
|
a***e 发帖数: 27968 | 17 丫设计有趣算8核,但是每俩核公用些东西,包括解码和FPU
但是这个设计导致丫有个大号FPU可以搞什么256bit的玩玩
这一代支持FMA3, AVX1,浮点进步不小,某些特定场合赶上i53570k了 |
|
e*p 发帖数: 526 | 18 不是atom,是haswell赛扬. see flags: vmx
vendor_id : GenuineIntel
cpu family : 6
model : 69
model name : Intel(R) Celeron(R) 2955U @ 1.40GHz
stepping : 1
microcode : 0x15
cpu MHz : 1400.000
cache size : 2048 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 2
apicid : 0
initial apicid : 0
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat
pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb
r... 阅读全帖 |
|
v*******e 发帖数: 11604 | 19
processor : 3
vendor_id : GenuineIntel
cpu family : 6
model : 37
model name : Intel(R) Core(TM) i7 CPU M 620 @ 2.67GHz
stepping : 2
microcode : 0xe
cpu MHz : 1866.000
cache size : 4096 KB
physical id : 0
siblings : 4
core id : 2
cpu cores : 2
apicid : 5
initial apicid : 5
fpu : yes
fpu_exception : yes
cpuid level : 11
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov
pat p... 阅读全帖 |
|
S***w 发帖数: 1014 | 20 我看了下 /proc/cpuinfo
processor : 1
vendor_id : GenuineIntel
cpu family : 15
model : 4
model name : Intel(R) Xeon(TM) CPU 3.20GHz
stepping : 3
cpu MHz : 3200.215
cache size : 2048 KB
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca
cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx lm
constant_tsc pni... 阅读全帖 |
|
c*****t 发帖数: 1879 | 21 FPU version should be faster than that one if the system
has FPU. |
|
c*****t 发帖数: 1879 | 22 I did a performance test. One using table lookup (see that stanford
link) and one this FPU method from 1 to 0xfffffffe on my P4 2.8, the
table lookup method is roughly 16x faster.
I think that the key is the cache miss in the test is virtually 0
(except the very first call). However, for FPU method, such utilization
can never take place. If this function is called frequently, then
cache miss should be rare. If this function is called rarely, then
it doesn't matter.
Conclusion: table lookup m |
|
k*****l 发帖数: 177 | 23 processor : 0
vendor_id : GenuineIntel
cpu family : 15
model : 4
model name : Intel(R) Xeon(TM) CPU 3.60GHz
stepping : 10
cpu MHz : 3590.997
cache size : 2048 KB
physical id : 0
siblings : 1
core id : 0
cpu cores : 1
fpu : yes
fpu_exception : yes
cpuid level : 3
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca
cmov pat pse36 clflush dts |
|
z******i 发帖数: 59 | 24 It is a truncation. You can write a simple C code, and check its
assemly to figure out what it is doing. X86 has the fistpl (convert float to
integer) instruction to do that.
But be careful if performance is important in your code. Since the
conversion
is very slow (stall FPU due to fldcw - load FPU control word).
146 80483ee: d9 6d e4 fldcw -0x1c(%ebp)
147 80483f1: db 5d f4 fistpl -0xc(%ebp)
148 80483f4: d9 6d e6 fldcw -0x1a(%ebp)
int to |
|
r*****3 发帖数: 143 | 25 中文名: Intel® 64 and IA-32体系结构:软件开发人员手册
原名: Intel® 64 and IA-32 Architectures Software Developer's Manual
作者: Intel Corporation
资源格式: PDF
版本: 文字版
出版社: Intel Corporation
书号: 25462-042US
发行时间: 2012年03月
地区: 美国
语言: 英文
简介:
汇编语言和高级语言的最根本的区别在于:在汇编语言中,程序员必须掌握数据存储和
机器相关的大量细节。与高级语言相比,在声明和移动数据时,汇编器给了程序员极大
的自由。汇编器只进行很少的错误检查,但却提供了大量的操作符和寻址表达式,使程
序员几乎能够做任何事情。然而,这种自由是必须付出一定代价的。这种代价就是在开
始编写有意义的程序之前,开发人员必须掌握大量的细节知识。因而这也是《Intel&
reg; 64 and IA-32 Architectures Software Developer's Manuall》一书的功能所在。
目录:
Volum... 阅读全帖 |
|
h***o 发帖数: 539 | 26 hanzo@scimd: pts/0: 25 files 37Mb-> cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 9
model name : Intel(R) Pentium(R) M processor 1400MHz
stepping : 5
cpu MHz : 1395.881
cache size : 1024 KB
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 2
wp : yes
flags : fpu vme de pse tsc msr mce cx8 sep m |
|
h*******c 发帖数: 248 | 27 My Homeserver:
system type : lemote-fulong
processor : 0
cpu model : Godson2 V0.3 FPU V0.1
BogoMIPS : 532.48
wait instruction : no
microsecond timers : yes
tlb_entries : 64
extra interrupt vector : no
hardware watchpoint : no
ASEs implemented :
VCED exceptions : not available
VCEI exceptions : not available |
|
h*******3 发帖数: 1141 | 28 没错。小平搞这个还是满有花花肠子,还有总设计师,又在kao上加了一层,把自己又
拔高了,和其他core 比,卓尔不群。
这不,又被指挥了中原野战军主力,又更上一层楼。
邓轮子就是厉害,大家鄙视286的FPU,立马就给加了个287的协处理,还写了一堆浮点
运算的垃圾code做测试证明.哈哈哈! |
|
f***y 发帖数: 4447 | 29 http://laoyaoba.com/ss6/html/07/n-615007.html
华米AMAZFIT运动手表除了拥有上述特性外,还搭载了中国处理器公司自主设计的芯片
——君正M200,虽然在小米之前,已经有不少公司采用了君正的芯片用于智能穿戴产品
,但大多是小打小闹。
8月30日,小米生态链企业华米科技在北京召开了秋季新品发布会,推出了华米AMAZFIT
运动手表。这款定位于专业运动手表的产品,内置4GB闪存,有别于目前市场上的智能
手表,不论是内置GPS、蓝牙听歌还是超长续航,所有的功能参数和工业设计都是为了
更好地为运动服务,799元的售价仅为其它相似功能运动手表的1/4。
虽然在小米手表之前,国内商家推出了不少可穿戴产品,但其中最关键的芯片和软件大
多是国外产品。例如,华为Watch用的就是高通的ARM芯片方案和谷歌的安卓系统,在核
心技术方面乏善可陈。华米AMAZFIT运动手表除了拥有上述特性外,还搭载了中国处理
器公司自主设计的芯片——君正M200,虽然在小米之前,已经有不少公司采用了君正的
芯片用于智能穿戴产品,但大多是小打小闹。而本次君正芯片被小米采用,是君正M... 阅读全帖 |
|
t******l 发帖数: 10908 | 30 这个还是我们中小学数学教育的问题。。。这个具体问题是在数集的 closure 的中小
学概念。
或者就拿前几天的斐波那契数列鉴别数学系妈妈桑小姐作为例子。。。斐波那契是一个
纯整数的数列。但如果你想要加速计算,而不幸你正巧看到了 Binet Formula:
F(n) = (((1+sqrt(5))/2)^n - ((1-sqrt(5))/2)^n) / sqrt(5)
http://artofproblemsolving.com/wiki/index.php?title=Binet%27s_Formula
如果你直接根据这个公式死算精确值的话,你就会发现一定要用 distributive
property, 具体在这里是 binomial theorem,对比如 (1+sqrt(5))^n 进行多项式展开
,结果在 Runtime Big O 上得不偿失。
但如果 sqrt(5) 能写成循环小数,也就是分数的话。。。那你就可以先通分,然后都
变成整数求幂,使用整数协处理器做精确运算,直接得出结果。。。但你如果不知道这
是不可能的,于是就浪费了一辈子在这个不可能的算法上,师从赵丽华的《... 阅读全帖 |
|
发帖数: 1 | 31 统治航母甲板的虫族,F/A-18“大黄蜂”和“超级大黄蜂”战斗机近况
波音F/A-18战斗机通常被戏称“虫子”和“超级虫”,目前这两种战斗机已经统治
了美国海军航母的甲板,成为美国海军航空兵的战术打击主力。
截至目前,美国海军已拥有30个“超级大黄蜂”一线舰载战斗机中队,其中19个装
备单座F/A-18E,10个装备双座F/A-18F,还有一个中队混合装备这两种战斗机。此外美
国海军还拥有4个装备F/A-18C单座“老式”或“经典大黄蜂”的一线舰载中队,美国海
军陆战队则拥有11个装备各型“经典大黄蜂”的一线中队。
垄断航母甲板的虫族
自1978年以来,麦道和波音已经向美国海军和陆战队交付了1049架“大黄蜂”和
570架“超级大黄蜂”,其中F/A-18A 371架、F/A-18B 39架、F/A-18C 476架、F/A-18D
163架、F/A-18E 297架、F/A-18F 273架。此外在试飞研发中还投入了11架F/A-18A、2
架F/A-18B(最初编号是F-18A和TF-18A)、5架F/A-18E、2架F/A-18F原型机。
当年麦道公司向国会介绍“超级大黄蜂”时,说... 阅读全帖 |
|
发帖数: 1 | 32 老将啊1234567890
麻痹单片机芯片一毛钱一个
搞个带fpu的单片机
: 科学计算器才50块人刀一个,你说谁会投资做芯片?
|
|
|
a***e 发帖数: 27968 | 34 8 FPU流水也很夸张啊
俺拿i7-2500跑一下linpack,86Gflops
每核22GFLOPS,这个可是3.2GHZ |
|
y*d 发帖数: 2226 | 35 一、申威CPU Architecture分析
现在的新闻没有公布细节,但可以毛算一下这个CPU是啥样子的:
峰值速度1070万亿次,8704片cpu,16core
平均每core大约77亿FLOPS
目前cpu频率大约在1G 2G 3G这种水平,考虑到神威的低功耗(后面详细讲)
主频应小于2G
按2G算就是每指令周期做39次单精浮点计算
我估计最有可能的是,主频1.2G,每个周期64个浮点运算 (算下来大约是76.8亿FLOPS)
和天河一号用的nVidia Tesla M2050 GPU对比一下
2050有16个SM,每个SM每周期也是可以做64个浮点运算,主频1.15G
申威CPU 16个Core,每core 64个浮点运算,主频1.2G
可以看出在计算单元配置和主频选择上,申威和Fermi Tesla基本一样
但是GPU有一个取巧的地方是GPU有一个Fused MUL ADD运算。这样一个运算顶两个,所
以实际只有32个计算单元,却号称64个浮点运算。而实际上,很少有哪个程序可以全是
用这个特殊运算的。所以GPU的实测速度会低很多。使用GPU的中国的天河1,倭国的つ
ばめ(燕)都... 阅读全帖 |
|
y*d 发帖数: 2226 | 36 都是一年前的旧闻了
龙芯3C原来设想的还是很牛的:16核每核OOO 4发射2个256位FMA FPU, 300多GFlops,
28nm工艺。原计划今年内能流片,明年量产。比同期IBM,Oracle/Sun,Fujtsu的处理器都要快
(Intel 也许会通过MIC放个卫星)
但是据最近流传的消息,合作厂商出了重大问题(不是指台集电)
龙芯3C估计要严重delay了 |
|
发帖数: 1 | 37 波音F/A-18战斗机通常被戏称“虫子”和“超级虫”,目前这两种战斗机已经统治
了美国海军航母的甲板,成为美国海军航空兵的战术打击主力。
截至目前,美国海军已拥有30个“超级大黄蜂”一线舰载战斗机中队,其中19个装
备单座F/A-18E,10个装备双座F/A-18F,还有一个中队混合装备这两种战斗机。此外美
国海军还拥有4个装备F/A-18C单座“老式”或“经典大黄蜂”的一线舰载中队,美国海
军陆战队则拥有11个装备各型“经典大黄蜂”的一线中队。
垄断航母甲板的虫族
自1978年以来,麦道和波音已经向美国海军和陆战队交付了1049架“大黄蜂”和
570架“超级大黄蜂”,其中F/A-18A 371架、F/A-18B 39架、F/A-18C 476架、F/A-18D
163架、F/A-18E 297架、F/A-18F 273架。此外在试飞研发中还投入了11架F/A-18A、2
架F/A-18B(最初编号是F-18A和TF-18A)、5架F/A-18E、2架F/A-18F原型机。
当年麦道公司向国会介绍“超级大黄蜂”时,说这种飞机仍然会保留F-18的编号,而且
能与“经典大黄蜂”共用许多组件... 阅读全帖 |
|
d**********x 发帖数: 4083 | 38 有兴趣就看下glibc的e_powf.c吧。。
反正我以前也许是看懂过,但是很快就忘了。。就是一坨数字倒来倒去的
另外一般机器的fpu里面应该有这玩意,所以没有必要。。 |
|
t*******r 发帖数: 22634 | 39 楼上滴,中了古代数学的毒啦。。。
讨论近代数学的,为啥没讨论泰勒展开的?窃以为不管是有理数和
无理数之间的桥梁,还是非线性方程解决器,泰勒展开的概念貌似
都是万金油的说。。。
俺一直以为四则运算是符号运算思想的雏形,一直可以延伸到计算
机的 LR 文法 / ALU/FPU 的设计再往后跑。。。
俺一直以为几何学是拓扑空间思想的雏形,一直可以延伸到现代图
论。。。
俺一直以为从分数到实数是现代数学分析的雏形,一直可以延伸到
泰勒展开、傅立叶变换、牛顿法非线性方程解决器、有限元方法、
概率论。。。
看来俺错了。。。 |
|
t*******r 发帖数: 22634 | 40 想了想,觉得应该加上 memory-based task。。。通俗的说,就是爱当 硬盘/flash-
memory/RAM/LookUpTable,而不爱当 CPU/ALU/FPU 的那类。。。 |
|
t*******r 发帖数: 22634 | 41 公司里,一般 theoretical scienter 总是建议高大上的模型,然后 computational
scienter 立马敲桌子曰你丫有估算需要跑多少 FPU 指令没?Engineer 跳进来说你两
别吵了,我们一堆烂 code,要改你们自己改,改完以后记得贿赂 testing 部门,我不
管你们。
system |
|
J***A 发帖数: 1511 | 42 呵呵 , 虽然不同的公司下属部门和名称略有不同, 不过十分属实:)
公司里,一般 theoretical scienter 总是建议高大上的模型,然后 computational
scienter 立马敲桌子曰你丫有估算需要跑多少 FPU 指令........ |
|
t*******r 发帖数: 22634 | 43 实在的说,物理有 “理论物理“ vs “实验物理” vs “应用物理”。而比如在 应用
物理层面,你首先得提防对面 computational scienter 冷不防一块板砖飞过来,捡起
来一看,上面一行大字曰:“特么你丫有没有毛估目测一下需要多少条 FPU 指令没?”
所以,将就点算啦,不被 computational scienter 的板砖砸中,狠重要!
当然,对于中小学教育而言,还是先把基础打正比较重要。不能用 “实验物理基本靠
瞅,应用物理基本靠凑” 而先把娃给搞糊涂没商量。// run 了,勿追杀。 |
|
s*****s 发帖数: 94 | 44 刚给EASY SERV打电话问了,FPU#是63Y****,新的,
终于有点安心了
your |
|
a*******g 发帖数: 3500 | 45 无语了, 一个gpu有多少core?
die size 最大的是memory, 可memory 并不值钱。 因为memory上没有任何ip价值。
什么cpu也好,gpu也好,wafer占的成本不大。 你看那么多fabless 活得都好好的,因
为人家赚得是wafer成本之外的知识附加值。再往上就是赚生态的钱,类似arm授权费,
类似于intel对于x86的近乎垄断。
cpu 集成 gpu 是架构上的重大进步,类似于之前cpu集成memory controller 减少了访
问延迟。 cpu 集成gpu,不仅可以减少cpu gpu间访问延迟,也能提升数据带宽,并且
做到cpu gpu统一寻址,这对于程序员是很友好的。 要知道最早时候 fpu 也是作为cpu
外的单独协处理器而存在的,后来不也都逐渐整合进去了吗 |
|
P****a 发帖数: 1348 | 46 涨姿势
十个字十个字十个字
: 无语了, 一个gpu有多少core?
: die size 最大的是memory, 可memory 并不值钱。 因为memory上没有任何ip价
值。
: 什么cpu也好,gpu也好,wafer占的成本不大。 你看那么多fabless 活得都好好
的,因
: 为人家赚得是wafer成本之外的知识附加值。再往上就是赚生态的钱,类似arm授
权费,
: 类似于intel对于x86的近乎垄断。
: cpu 集成 gpu 是架构上的重大进步,类似于之前cpu集成memory controller 减
少了访
: 问延迟。 cpu 集成gpu,不仅可以减少cpu gpu间访问延迟,也能提升数据带宽
,并且
: 做到cpu gpu统一寻址,这对于程序员是很友好的。 要知道最早时候 fpu 也是
作为cpu
: 外的单独协处理器而存在的,后来不也都逐渐整合进去了吗
|
|
h*d 发帖数: 19309 | 47 我大学才用上IBM 486 DX40,单独买的FPU那种,不过我工作了才玩上PS |
|
|
R***a 发帖数: 41892 | 49 DX是intel的编号又不是ibm的编号。
intel编号dx就是有FPU |
|
t*******r 发帖数: 22634 | 50 具体在音乐领域我不知道,不过在我们领域也发生我类似的问题。
我随便猜猜啊。
这个芯片速度不仅仅是指主频,更重要的是运算能力。运算能力能不能够求解
的差别,比主频差别大多了。不同代的处理器,在主频也许差上个两三倍吧。
但是代差远远不再这里。常常对于新的计算要求,新代处理器的能力可能是旧
代的十倍或百倍之多。
我们回过头来看看 AWM 波表合成需要啥处理能力。
(1) 如果波表没有压缩过:
那么线性定点数(整数)标量加法器就足够了。如果芯片有一定的硬件向量处
理能力,是个 plus 但不是 must。
(2)如果波表用类似 mp3 技术压缩过:
那么需要实时解压,这样的话,芯片最好有一定 FFT/DCT 的硬件处理能力
(同时也就是有一定程度的硬件向量处理能力),否则时间延迟可能太大吃
不消。但总而言之还是定点数线性运算为主。
(3)如果使用物理建模:
物理模型无疑是一个不折不扣逃不掉的非线性问题,所以简单的硬件 FFT/DCT
是远远不够的。要进行实时非线性运算,一定要用足够强大的硬件 MPU
(Math Process Unit,其前身是 FPU - Floating Process |
|