b*********n 发帖数: 2284 | 1 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
要求不高,主要是日常处理,最多做一些测试,matlab之类的.
求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要. |
S******n 发帖数: 5022 | 2 用GPU计算,应该选AMD的卡吧。
GTX 7系列或者6系列 都是游戏卡,计算能力不行的,特别是双精度计算都不行。
民用计算还是AMD的7990和7970强。
CPU
4
【在 b*********n 的大作中提到】 : 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU : 要求不高,主要是日常处理,最多做一些测试,matlab之类的. : 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4 : 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.
|
S******n 发帖数: 5022 | 3 说得好像AMD不整合GPU一样。
AMD CPU内集成的GPU比intel更强。
CPU
4
【在 b*********n 的大作中提到】 : 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU : 要求不高,主要是日常处理,最多做一些测试,matlab之类的. : 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4 : 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.
|
a******1 发帖数: 2340 | 4 FX没有的
【在 S******n 的大作中提到】 : 说得好像AMD不整合GPU一样。 : AMD CPU内集成的GPU比intel更强。 : : CPU : 4
|
a******1 发帖数: 2340 | 5 GTX TITAN 还是目前的GPGPU民用之王,那个Double Precision Throuput (1/3) 基本
上是专业卡的水平
http://stackoverflow.com/questions/16027391/nvidia-gpus-for-res
【在 S******n 的大作中提到】 : 用GPU计算,应该选AMD的卡吧。 : GTX 7系列或者6系列 都是游戏卡,计算能力不行的,特别是双精度计算都不行。 : 民用计算还是AMD的7990和7970强。 : : CPU : 4
|
E***e 发帖数: 3430 | 6 如果只用单精度
gtx靠谱嘛?
【在 S******n 的大作中提到】 : 用GPU计算,应该选AMD的卡吧。 : GTX 7系列或者6系列 都是游戏卡,计算能力不行的,特别是双精度计算都不行。 : 民用计算还是AMD的7990和7970强。 : : CPU : 4
|
i******t 发帖数: 22541 | |
o**n 发帖数: 2130 | 8 buy.com 的hp420 最近减价,771.99, e5-1650,光这个cpu就600刀左右了 |
b*********n 发帖数: 2284 | 9 cpu拼不过gpu.
计算肯定是gpu了,上千个cuda核。现在需要一块性价比好的cpu,4核最好,处理日常
工作。
【在 o**n 的大作中提到】 : buy.com 的hp420 最近减价,771.99, e5-1650,光这个cpu就600刀左右了
|
f*******r 发帖数: 605 | 10 用e3 1230
【在 b*********n 的大作中提到】 : cpu拼不过gpu. : 计算肯定是gpu了,上千个cuda核。现在需要一块性价比好的cpu,4核最好,处理日常 : 工作。
|
|
|
r***i 发帖数: 913 | |
b*********n 发帖数: 2284 | 12 擦,server cpu可不便宜啊!而且这玩意儿能用non ecc内存吗?
【在 f*******r 的大作中提到】 : 用e3 1230
|
S******n 发帖数: 5022 | 13 双精度计算能力:
GTX titan: 1.30 TFLOPs 价格$999
GTX 780: 0.19 TFLOPs 价格$499
AMD 7970: 1.04 TFLOPs 价格$299
AMD 7990: 2.04 TFLOPs 价格$799
自己看性价比吧,7990其实是两块7970.
性能对比:
http://www.tomshardware.com/reviews/radeon-hd-7990-review-bench
要论民用之王,还是AMD 7990吧。难道 2.04 < 1.30 ?
外加上楼主也没有提Titan,Titan是很强,但是比7990还是差一点点,价格贵一点点。
如果是我,买两块 AMD 7970 交火,用600多刀的价格达到约 2 TFLOPs的双精度浮点,
约8 TFLOPs的单精度浮点。
【在 a******1 的大作中提到】 : GTX TITAN 还是目前的GPGPU民用之王,那个Double Precision Throuput (1/3) 基本 : 上是专业卡的水平 : http://stackoverflow.com/questions/16027391/nvidia-gpus-for-res
|
S******n 发帖数: 5022 | 14 那还是打游戏吧。游戏渲染就只用单精度。
【在 E***e 的大作中提到】 : 如果只用单精度 : gtx靠谱嘛?
|
r***i 发帖数: 913 | 15 E3就是i7的价,实质也差不多,应该可以用non ECC
【在 b*********n 的大作中提到】 : 擦,server cpu可不便宜啊!而且这玩意儿能用non ecc内存吗?
|
x********o 发帖数: 2092 | 16 GTX的比AMD的好,主要是cuda提供了很多方便,像BLAS一类的用现成的就行了。AMD系
列的没有cuda这样的。 |
S******n 发帖数: 5022 | 17 有钱就买Telsa 或 Titan。
没钱就只能AMD OpenCL了,这两年OpenCL应用也不少了。从两年前的几款应用到现在的
好几千款应用了~~~
现在intel,apple都提供了对OpenCL的支持吧,特别是apple,不遗余力的。
apple的Mac pro大圆桶就是异构计算的典型配置,可以参考一下。
http://store.apple.com/us/buy-mac/mac-pro
OpenCL是提供了API接口,可以在C++里调用这些SDK。
不过CUDA更底层一些,软件和驱动成熟一些,毕竟软件上耕耘的时间更长,编程灵活一
些。
用CUDA搞计算,PGI Visual Fortran 少不了,google一下盗版就有下载的。
自己决定买什么吧,其实条条大路通罗马。
真的通用计算,还是intel的系统软件上更容易一些。
美国正在造的超算,将是纯intel 12核CPU + intel SSD; (编程容易,纯粹的x86-
64编程环境。)
中国的天河二号,intel 12核CPU + intel phi计算加速卡; (编程也容易,phi计算
卡也是x86系统。)
天河一号A,intel 8核CPU + NV Tesla计算加速卡; (需要CUDA编程了)
天河一号,intel 4核CPU + AMD显卡加速计算;(需要调用OpenCL接口编程)
从“天河一号”到“天河一号A”到“天河二号”,软件的门槛是越来越低了,毕竟纯
intel系统上的编程更通用,intel+CUDA编程次之,intel+OpenCL再次之。
对个人计算来说,超算太遥远,但是超算的单个计算节点我们个人配计算用的机器是可
以参考的。
在建的美国超算,每个计算节点: 2个Intel Xeon 12 cores CPU,128GB RAM,800GB
SSD;
“天河二号”,每个计算节点: 2个Intel Xeon 12 cores CPU,64GB RAM,外加3个
Intel Xeon phi计算卡;
“天河一号A”,每个计算节点: 2个Intel Xeon 8 cores CPU,32GB RAM,外加1个NV
Tesla计算卡;
“天河一号”,每个计算节点: 1个Intel Xeon 4 cores CPU,16GB RAM,外加1个AMD
显卡加速;
美国橡树岭“泰坦”,每个计算节点: 1个AMD Opteron 16 cores CPU,32GB RAM,外
加1个NV Tesla计算卡;
再加上apple的MAC pro,每个桶:1个Intel Xeon CPU,16GB RAM,外加2个AMD显卡加
速;
所以,个人配计算用的机器,
如果超级有米的话, 2个Intel Xeon CPU,128GB RAM,外加2个Intel Xeon phi或者NV
Tesla计算卡;
米次之,可以考虑没有ECC内存校验的版本,那就是普通的intel i7 CPU + 32GB/64GB +
一块或2块NV GTX Titan计算加速卡。
米还是不足,那就只能上AMD/intel CPU+AMD显卡加速了。
【在 x********o 的大作中提到】 : GTX的比AMD的好,主要是cuda提供了很多方便,像BLAS一类的用现成的就行了。AMD系 : 列的没有cuda这样的。
|
f*******r 发帖数: 605 | 18 比同频i7便宜多了。当然能用非ecc的。
【在 b*********n 的大作中提到】 : 擦,server cpu可不便宜啊!而且这玩意儿能用non ecc内存吗?
|
S******n 发帖数: 5022 | 19 Intel Xeon加non-ECC内存,就没有ECC功能了。不用ECC功能,不如上普通haswell i7.
(要考虑到主板价格。)
我的建议是,如果上Xeon,就上全套ECC的东西,ECC内存,ECC专业显卡,就像apple
Mac Pro大圆桶那样。
不上ECC,就都不上ECC,普通家用的很了好了,haswell i7 + non-ECC DDR3 RAM +
GTX titan。
配什么样的机器基本上是由多少米决定的。
【在 f*******r 的大作中提到】 : 比同频i7便宜多了。当然能用非ecc的。
|
E***e 发帖数: 3430 | 20 请问能配合AMD+OpenCL使用的
类似CUDA Math的library有什么比较好的?
谢谢!
【在 S******n 的大作中提到】 : 有钱就买Telsa 或 Titan。 : 没钱就只能AMD OpenCL了,这两年OpenCL应用也不少了。从两年前的几款应用到现在的 : 好几千款应用了~~~ : 现在intel,apple都提供了对OpenCL的支持吧,特别是apple,不遗余力的。 : apple的Mac pro大圆桶就是异构计算的典型配置,可以参考一下。 : http://store.apple.com/us/buy-mac/mac-pro : OpenCL是提供了API接口,可以在C++里调用这些SDK。 : 不过CUDA更底层一些,软件和驱动成熟一些,毕竟软件上耕耘的时间更长,编程灵活一 : 些。 : 用CUDA搞计算,PGI Visual Fortran 少不了,google一下盗版就有下载的。
|
|
|
E***e 发帖数: 3430 | 21 大概七八年前,连计算流体都是单精度
因为内存不够
现在的应用我完全不介意由于硬件限制回到单精度上
【在 S******n 的大作中提到】 : 那还是打游戏吧。游戏渲染就只用单精度。
|
S******n 发帖数: 5022 | 22 用单精度的话,上两块GTX 780吧。现在降价了,性价比不错。
GTX 7系列,双精度是单精度的 1/24 (理论值是1/3,阉割了)
其实如果不上titan,GTX 580的双精度在NV民用卡中是最强的。只是现在我不知道哪里
有廉价GTX 580卖。
NV 费米 双精度理论上是单精度的 1/2;
NV 开普勒 双精度理论上是单精度的 1/3;
NV 麦克斯韦 双精度理论上是单精度的 1/4;(麦克斯韦要集成ARM处理器,ARM参与调
度)
AMD R9 290X/290也阉割了双精度了,只有单精度的1/8 (理论值应该是1/2,阉割了)。
倒是7990、7970的双精度是完全的,是单精度的1/4(理论值也是1/4)。
用游戏卡搞计算,单精度AMD和NV其实都差不多。
双精度目前是NV阵营 Titan > 580 > 780; AMD阵营 7970 > 290X
【在 E***e 的大作中提到】 : 大概七八年前,连计算流体都是单精度 : 因为内存不够 : 现在的应用我完全不介意由于硬件限制回到单精度上
|
S******n 发帖数: 5022 | 23 OpenCL从几款应用到现在几千款应用,也是最近两年的事情。
七八年前很遥远了~~~七八年前CUDA如日中天,OpenCL是狗屎。
【在 E***e 的大作中提到】 : 大概七八年前,连计算流体都是单精度 : 因为内存不够 : 现在的应用我完全不介意由于硬件限制回到单精度上
|
E***e 发帖数: 3430 | 24 哪里能看到几千款应用的好评度神码的?
对C++不算很熟,最好能有documentation比较好的library。。。
【在 S******n 的大作中提到】 : OpenCL从几款应用到现在几千款应用,也是最近两年的事情。 : 七八年前很遥远了~~~七八年前CUDA如日中天,OpenCL是狗屎。
|
l*****o 发帖数: 9235 | 25 如果要搞一个个人计算的台式机做科学计算,需要双精度,既有满矩阵,又有稀疏矩阵
。是自己配好,还是买戴尔的 T5600 比较好?
自己配的话,cooling system 和 主板 怎么选比较好? 买的话,能拿到更好的折扣吗
? |
x********o 发帖数: 2092 | 26 条条大路是通罗马,问题是对大部分人来说这玩意就是一个工具,花太多时间精力去调
试优化代码不值得,还不如有现成的支持快。
【在 S******n 的大作中提到】 : 有钱就买Telsa 或 Titan。 : 没钱就只能AMD OpenCL了,这两年OpenCL应用也不少了。从两年前的几款应用到现在的 : 好几千款应用了~~~ : 现在intel,apple都提供了对OpenCL的支持吧,特别是apple,不遗余力的。 : apple的Mac pro大圆桶就是异构计算的典型配置,可以参考一下。 : http://store.apple.com/us/buy-mac/mac-pro : OpenCL是提供了API接口,可以在C++里调用这些SDK。 : 不过CUDA更底层一些,软件和驱动成熟一些,毕竟软件上耕耘的时间更长,编程灵活一 : 些。 : 用CUDA搞计算,PGI Visual Fortran 少不了,google一下盗版就有下载的。
|
E***e 发帖数: 3430 | |
S******n 发帖数: 5022 | 28 http://configure.us.dell.com/dellstore/config.aspx?oc=swct563&m
自己配类似性能的机器,显卡也不便宜吧。
你可以尝试用newegg的价格配台类似的配置,看谁便宜。(CPU选xeon,内存选ECC的服
务器内存)
【在 l*****o 的大作中提到】 : 如果要搞一个个人计算的台式机做科学计算,需要双精度,既有满矩阵,又有稀疏矩阵 : 。是自己配好,还是买戴尔的 T5600 比较好? : 自己配的话,cooling system 和 主板 怎么选比较好? 买的话,能拿到更好的折扣吗 : ?
|
l*****o 发帖数: 9235 | 29 主板和制冷呢?
【在 S******n 的大作中提到】 : http://configure.us.dell.com/dellstore/config.aspx?oc=swct563&m : 自己配类似性能的机器,显卡也不便宜吧。 : 你可以尝试用newegg的价格配台类似的配置,看谁便宜。(CPU选xeon,内存选ECC的服 : 务器内存)
|
S******n 发帖数: 5022 | |
|
|
l*****o 发帖数: 9235 | |
E***e 发帖数: 3430 | 32 貌似市面上所有的都可以,问题就是性能怎样
游戏卡单精度计算都还好,双精度就比cpu没什么优势了
真想玩双精度,要买专业计算用的Tesla神码的,单双性能比3:1
刚才牛人推荐GTX Titan也基本有3:1的水平,但是titan的flops比tesla还是差不少
【在 l*****o 的大作中提到】 : NVIDIA 哪些卡可以用 CUDA 做并行计算啊? 这些卡对其他部分有什么特殊要求吗?
|
z******i 发帖数: 1292 | 33 GTX titan其实就是没有ECC内存校验的Tesla K20x卡,基本的flops是一样的,都是单
精度3.9 Tflops,双精度1.3 Tflops。
没有内存校验,这么多核,只要有一个算错了,计算结果就错了。
为了防止这点,就需要采用比较好的厚的全塔机箱。
【在 E***e 的大作中提到】 : 貌似市面上所有的都可以,问题就是性能怎样 : 游戏卡单精度计算都还好,双精度就比cpu没什么优势了 : 真想玩双精度,要买专业计算用的Tesla神码的,单双性能比3:1 : 刚才牛人推荐GTX Titan也基本有3:1的水平,但是titan的flops比tesla还是差不少
|
E***e 发帖数: 3430 | 34 小白求问机箱和内存错误之间什么关系?
【在 z******i 的大作中提到】 : GTX titan其实就是没有ECC内存校验的Tesla K20x卡,基本的flops是一样的,都是单 : 精度3.9 Tflops,双精度1.3 Tflops。 : 没有内存校验,这么多核,只要有一个算错了,计算结果就错了。 : 为了防止这点,就需要采用比较好的厚的全塔机箱。
|
l*****o 发帖数: 9235 | 35 TITAN 一千块还可以接受,特斯拉 3500 块太贵了。
谁能解释一下这个差别
【在 E***e 的大作中提到】 : 貌似市面上所有的都可以,问题就是性能怎样 : 游戏卡单精度计算都还好,双精度就比cpu没什么优势了 : 真想玩双精度,要买专业计算用的Tesla神码的,单双性能比3:1 : 刚才牛人推荐GTX Titan也基本有3:1的水平,但是titan的flops比tesla还是差不少
|
l*****o 发帖数: 9235 | 36 同问
【在 E***e 的大作中提到】 : 小白求问机箱和内存错误之间什么关系?
|
z******i 发帖数: 1292 | 37 其实AMD显卡的双精度更好,问题在于功耗不好,散热不好,所以集群时很少采用AMD的
卡。(集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。)
跟AMD R9 290X对应的专业显卡,单精度 5.6 Tflops,双精度2.8 Tflops, 价格$4000
以上吧。(290X自己是单精度5.6 Tflops,双精度700 Gflops。)
跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。 (两者
性能都是单精度 4.0 Tflops,双精度1.0 Tflops)前者价格300美元,后者价格3500美
元。差别主要是ECC校验和驱动程序。
http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
GTX Titan跟Tesla K20X的关系也是这样的,GTX Titan卖$999,Tesla K20X卖$3499。 |
E***e 发帖数: 3430 | 38 主要差别就在内存校验吧
我觉得个人 prototyping 目的的话titan足够了
商业production还是要搞tesla
【在 l*****o 的大作中提到】 : TITAN 一千块还可以接受,特斯拉 3500 块太贵了。 : 谁能解释一下这个差别
|
l*****o 发帖数: 9235 | 39 可惜我不会 OpenCL
4000
【在 z******i 的大作中提到】 : 其实AMD显卡的双精度更好,问题在于功耗不好,散热不好,所以集群时很少采用AMD的 : 卡。(集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。) : 跟AMD R9 290X对应的专业显卡,单精度 5.6 Tflops,双精度2.8 Tflops, 价格$4000 : 以上吧。(290X自己是单精度5.6 Tflops,双精度700 Gflops。) : 跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。 (两者 : 性能都是单精度 4.0 Tflops,双精度1.0 Tflops)前者价格300美元,后者价格3500美 : 元。差别主要是ECC校验和驱动程序。 : http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO : GTX Titan跟Tesla K20X的关系也是这样的,GTX Titan卖$999,Tesla K20X卖$3499。
|
z******i 发帖数: 1292 | 40 机箱足够厚可以减轻宇宙射线带来的内存数值翻转,同时有更好的电磁屏蔽。
【在 E***e 的大作中提到】 : 小白求问机箱和内存错误之间什么关系?
|
|
|
E***e 发帖数: 3430 | 41 宇宙射线膜拜了
【在 z******i 的大作中提到】 : 机箱足够厚可以减轻宇宙射线带来的内存数值翻转,同时有更好的电磁屏蔽。
|
E***e 发帖数: 3430 | 42 什么开发目的?
C++配上一两个library不够用?
【在 l*****o 的大作中提到】 : 可惜我不会 OpenCL : : 4000
|
z******i 发帖数: 1292 | 43 openCL 2008年才开始的。
http://zh.wikipedia.org/wiki/OpenCL
【在 l*****o 的大作中提到】 : 可惜我不会 OpenCL : : 4000
|
E***e 发帖数: 3430 | 44 请问GT780单精度浮点能有5046GFLOPS这个不是超过TESLA K20了?
不考虑ECC的话。。。
【在 z******i 的大作中提到】 : openCL 2008年才开始的。 : http://zh.wikipedia.org/wiki/OpenCL
|
z******i 发帖数: 1292 | 45 呵呵,这个是避免不了的。所以只能靠冗余和ECC校验纠正。
服务器上可靠性很重要的,万一出错后果很严重。
个人用一两块GTX titan配厚一点的机箱,发生错误的几率不比带ECC校验的超级计算机
更大。
当然,如果搞上几千块几万块GTX titan,那宇宙射线导致翻转的几率就不能忽视了。
【在 E***e 的大作中提到】 : 宇宙射线膜拜了
|
z******i 发帖数: 1292 | 46 是的。
【在 E***e 的大作中提到】 : 请问GT780单精度浮点能有5046GFLOPS这个不是超过TESLA K20了? : 不考虑ECC的话。。。
|
E***e 发帖数: 3430 | 47 那就回头整个这货prototyping玩
反正单精度对我足够了
【在 z******i 的大作中提到】 : 是的。
|
z******i 发帖数: 1292 | 48 别忘记了到时整个PGI Visual Fortran
我机器的E盘倒是有,网上应该有不少下载的。
E:PGI
│
├─PGI.Visual.Fortran.2008.v11.9
│ │ crack.7z
│ │ pgivf-vs2008-119.exe
│ │ pgivfx64-vs2008-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│ pgi-vs-patch.7z
│
├─PGI.Visual.Fortran.2010.v11.9
│ │ crack.7z
│ │ pgivf-vs2010-119.exe
│ │ pgivfx64-vs2010-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│
├─PGI.Visual.Fortran.2010.v11.9.with.VS2010.Shell
│ │ crack.7z
│ │ pgivf-vs2010all-119.exe
│ │ pgivfx64-vs2010all-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│ pgi-vs-patch.7z
│
├─PGI.Visual.Fortran.v13.9
│ pvf32-139.exe
│ pvf64-139.exe
│
├─PGI.Visual.Fortran.v13.9.Win2k3
│ pvf32-xp-139.exe
│ pvf64-xp-139.exe
│
├─PGI.Visual.Fortran.v13.9.with.VS.Shell
│ pvf32-shell-139.exe
│ pvf64-shell-139.exe
│
├─PGI.Workstation.Complete.v11.9
│ │ crack.7z
│ │ pgiws-119.exe
│ │ pgiwsx64-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-ws32-patch.7z
│ pgi-ws64-patch.7z
│
├─PGI.Workstation.Complete.v13.9
│ pgiws32-139.exe
│ pgiws64-139.exe
│
├─PGI.Workstation.Complete.v13.9.Linux
│ pgilinux-2013-139.tar.gz
│
├─PGI.Workstation.Complete.v13.9.OSX
│ PGI-Workstation-139.dmg
│
└─PGI.Workstation.Complete.v13.9.Win2k3
pgiws32-xp-139.exe
pgiws64-xp-139.exe
【在 E***e 的大作中提到】 : 那就回头整个这货prototyping玩 : 反正单精度对我足够了
|
l*****o 发帖数: 9235 | 49 看了一下,好像 Intel Xeon PHI 基本可以代替 NVIDIA TESLA 啊,价格便宜不少吧。
有谁了解吗? |
S******n 发帖数: 5022 | 50 Xeon PHI这个东西源于失败了的intel独立显卡项目Larrabee。
当年,intel想在一张卡上集成上百个intel x86 CPU,想做通用独立显卡,跟老黄的费
米显卡竞争,因为没法控制发热量,Larrabee项目失败了。(老黄那时天天笑intel
Laugh——a——bee~~~)
2009年5月
http://www.pcpop.com/doc/0/398/398280.shtml
2010年5月
http://www.enet.com.cn/article/2010/0526/A20100526659291.shtml
但是intel毕竟投了很多钱,完全放弃又舍不得,最后抬头换面做计算加速卡,这就是
Intel Xeon PHI。
现在Intel Xeon PHI就是一张卡集成60+的586 1GHz CPU, 8GB RAM, 主要做并行计算加
速,双精度能到 1.x Tfls。
【在 l*****o 的大作中提到】 : 看了一下,好像 Intel Xeon PHI 基本可以代替 NVIDIA TESLA 啊,价格便宜不少吧。 : 有谁了解吗?
|
|
|
E***e 发帖数: 3430 | 51 别笑话我土,一直没搞明白
cuda math不是cuda c上的么?
为什么fortran会跳出来?
【在 z******i 的大作中提到】 : 别忘记了到时整个PGI Visual Fortran : : 我机器的E盘倒是有,网上应该有不少下载的。 : E:PGI : │ : ├─PGI.Visual.Fortran.2008.v11.9 : │ │ crack.7z : │ │ pgivf-vs2008-119.exe : │ │ pgivfx64-vs2008-119.exe : │ │
|
S******n 发帖数: 5022 | 52 Visual Fortran和Visual C++是同一界面,数值计算还是使用Fortran的多。
编译使用起来应该是一样的。
【在 E***e 的大作中提到】 : 别笑话我土,一直没搞明白 : cuda math不是cuda c上的么? : 为什么fortran会跳出来?
|
E***e 发帖数: 3430 | 53 那cuda c + cuda BLAS + cuda MATH有什么劣势?
仅仅是速度么?
现在行业应用fortran已经比较困难了
就算我愿意,老板客户也不愿意
招不到搞这货的人,OO也不方便
【在 S******n 的大作中提到】 : Visual Fortran和Visual C++是同一界面,数值计算还是使用Fortran的多。 : 编译使用起来应该是一样的。
|
S******n 发帖数: 5022 | 54 没关系啊,反正有Visual Fortran的地方多半同时存在Visual C++,
用C++编程就是了。
【在 E***e 的大作中提到】 : 那cuda c + cuda BLAS + cuda MATH有什么劣势? : 仅仅是速度么? : 现在行业应用fortran已经比较困难了 : 就算我愿意,老板客户也不愿意 : 招不到搞这货的人,OO也不方便
|
E***e 发帖数: 3430 | 55 就是说在PGI Visual Fortran里写C++代码,然后调用cuda BLAS和MATH?
【在 S******n 的大作中提到】 : 没关系啊,反正有Visual Fortran的地方多半同时存在Visual C++, : 用C++编程就是了。
|
l*****o 发帖数: 9235 | 56 关键是能替代 NVIDIA 的特斯拉吗?网上好像没有结论
【在 S******n 的大作中提到】 : Xeon PHI这个东西源于失败了的intel独立显卡项目Larrabee。 : 当年,intel想在一张卡上集成上百个intel x86 CPU,想做通用独立显卡,跟老黄的费 : 米显卡竞争,因为没法控制发热量,Larrabee项目失败了。(老黄那时天天笑intel : Laugh——a——bee~~~) : 2009年5月 : http://www.pcpop.com/doc/0/398/398280.shtml : 2010年5月 : http://www.enet.com.cn/article/2010/0526/A20100526659291.shtml : 但是intel毕竟投了很多钱,完全放弃又舍不得,最后抬头换面做计算加速卡,这就是 : Intel Xeon PHI。
|
E***e 发帖数: 3430 | 57 我觉得还是算了吧
搞个GTX 780 TI比这靠谱,才700块。。。
【在 l*****o 的大作中提到】 : 关键是能替代 NVIDIA 的特斯拉吗?网上好像没有结论
|
S******n 发帖数: 5022 | 58 我的理解是,必须有微软的Visual studio才能装上visual Fortran,装完了Fortran就
成了Visual studio的一部分。
至于visual studio用什么语言,怎么调用CUDA加速,没必要操心太多吧。CUDA肯定是
对C++和Fortran同时起作用的。
【在 E***e 的大作中提到】 : 就是说在PGI Visual Fortran里写C++代码,然后调用cuda BLAS和MATH?
|
E***e 发帖数: 3430 | 59 长知识了
回头试试看
多谢了
【在 S******n 的大作中提到】 : 我的理解是,必须有微软的Visual studio才能装上visual Fortran,装完了Fortran就 : 成了Visual studio的一部分。 : 至于visual studio用什么语言,怎么调用CUDA加速,没必要操心太多吧。CUDA肯定是 : 对C++和Fortran同时起作用的。
|
S******n 发帖数: 5022 | 60 显然是啊,否则"天河二号"不用NVIDIA 的特斯拉而用intel的phi?
"天河一号A"和橡树岭的"泰坦"都是用NV telsa加速的。
用intel的phi降低了编程成本同时提高了通用性吧,因为phi说白了就是一堆现代工艺
的586。
你看,telsa都没有显示器接口。
http://www.newegg.com/Product/Product.aspx?Item=N82E16814132008
【在 l*****o 的大作中提到】 : 关键是能替代 NVIDIA 的特斯拉吗?网上好像没有结论
|
|
|
l*****o 发帖数: 9235 | 61 我的需要双精度浮点运算,这个能行吗,我前面看的最少也需要 Quadro 4000 才行。
【在 E***e 的大作中提到】 : 我觉得还是算了吧 : 搞个GTX 780 TI比这靠谱,才700块。。。
|
l*****o 发帖数: 9235 | 62 我仔细看了下,好像据说对于本身就非常平行的程序,比如蒙特卡洛,ray tracing 之
类的,特斯拉还是好不少。
但是对于不是本身就很平行的东西,比如稀疏矩阵乘法之类的,phi 比特斯拉好不少。
【在 S******n 的大作中提到】 : 显然是啊,否则"天河二号"不用NVIDIA 的特斯拉而用intel的phi? : "天河一号A"和橡树岭的"泰坦"都是用NV telsa加速的。 : 用intel的phi降低了编程成本同时提高了通用性吧,因为phi说白了就是一堆现代工艺 : 的586。 : 你看,telsa都没有显示器接口。 : http://www.newegg.com/Product/Product.aspx?Item=N82E16814132008
|
S******n 发帖数: 5022 | 63 自己配吧,Haswell i7-4770K, 32GB DDR3, 外加一块GTX Titan显卡加速或者两块。
【在 l*****o 的大作中提到】 : 我的需要双精度浮点运算,这个能行吗,我前面看的最少也需要 Quadro 4000 才行。
|
S******n 发帖数: 5022 | 64 那是,要是当年搞好了蒙特卡洛,ray tracing, Phi就是独立显卡larraabee了。
特斯拉去掉ECC加个显示接口,就是正规的显卡——gtx titan了。
毕竟一个是失败的显卡,一个是成功的显卡加强。
蒙特卡洛,AMD显卡更强
【在 l*****o 的大作中提到】 : 我仔细看了下,好像据说对于本身就非常平行的程序,比如蒙特卡洛,ray tracing 之 : 类的,特斯拉还是好不少。 : 但是对于不是本身就很平行的东西,比如稀疏矩阵乘法之类的,phi 比特斯拉好不少。
|
E***e 发帖数: 3430 | 65 双精度不怎么行
用titan好了
【在 l*****o 的大作中提到】 : 我的需要双精度浮点运算,这个能行吗,我前面看的最少也需要 Quadro 4000 才行。
|
E***e 发帖数: 3430 | 66 确实很想上AMD
可是AMD上到底用什么MATH和MATRIX的library?
看了半天也还是不明白
【在 S******n 的大作中提到】 : 那是,要是当年搞好了蒙特卡洛,ray tracing, Phi就是独立显卡larraabee了。 : 特斯拉去掉ECC加个显示接口,就是正规的显卡——gtx titan了。 : 毕竟一个是失败的显卡,一个是成功的显卡加强。 : 蒙特卡洛,AMD显卡更强
|
S******n 发帖数: 5022 | 67 GTX 780Ti 双精度是不怎么行,但是还是比intel的四核CPU快的多啊~~呵呵
【在 E***e 的大作中提到】 : 双精度不怎么行 : 用titan好了
|
l*****o 发帖数: 9235 | 68 我的应用中一大部分就是稀疏矩阵乘法,另外一大部分就是满矩阵乘法。像蒙特卡罗这
种天生平行的算法很少,所以我不太能确定。。。
【在 S******n 的大作中提到】 : 那是,要是当年搞好了蒙特卡洛,ray tracing, Phi就是独立显卡larraabee了。 : 特斯拉去掉ECC加个显示接口,就是正规的显卡——gtx titan了。 : 毕竟一个是失败的显卡,一个是成功的显卡加强。 : 蒙特卡洛,AMD显卡更强
|
E***e 发帖数: 3430 | 69 我这种天天就在搞暴力MC重复计算的实在是太幸福了 lol
【在 l*****o 的大作中提到】 : 我的应用中一大部分就是稀疏矩阵乘法,另外一大部分就是满矩阵乘法。像蒙特卡罗这 : 种天生平行的算法很少,所以我不太能确定。。。
|
S******n 发帖数: 5022 | 70 找个AMD的显卡驱动看里面的OpenCL SDK?
感觉AMD软件上很偷懒,舍不得投入。
CUDA里面的数学库很庞大的。
【在 E***e 的大作中提到】 : 确实很想上AMD : 可是AMD上到底用什么MATH和MATRIX的library? : 看了半天也还是不明白
|
|
|
E***e 发帖数: 3430 | 71 就找到了BLAS的,还是今年刚发布的
找了半天连个函数列表都没有
按理说数学函数的sdk应该很好找
可是居然就没搜到个靠谱的
反正跟cuda一比,心凉了半截。。。
【在 S******n 的大作中提到】 : 找个AMD的显卡驱动看里面的OpenCL SDK? : 感觉AMD软件上很偷懒,舍不得投入。 : CUDA里面的数学库很庞大的。
|
S******n 发帖数: 5022 | 72 别提了,据说AMD卡双精度只有IEEE里面最基本的计算,双精度函数部分,没有写,号
称自定义能力强。
也就是说,函数功能超级不全,不提供现成的。当然,自己是可以写,可是谁有闲心重
新把这些函数写一遍啊。
也就是说,只要是加减乘除,AMD双精度OK,涉及函数,傻眼。NV就省心多了,很多函
数都定义好了。
【在 E***e 的大作中提到】 : 就找到了BLAS的,还是今年刚发布的 : 找了半天连个函数列表都没有 : 按理说数学函数的sdk应该很好找 : 可是居然就没搜到个靠谱的 : 反正跟cuda一比,心凉了半截。。。
|
E***e 发帖数: 3430 | 73 那我还是老老实实在CUDA的世界里晃悠一阵吧
很多函数就算自己写,也没法把性能最优化啊,那是要很多功夫的
唉
【在 S******n 的大作中提到】 : 别提了,据说AMD卡双精度只有IEEE里面最基本的计算,双精度函数部分,没有写,号 : 称自定义能力强。 : 也就是说,函数功能超级不全,不提供现成的。当然,自己是可以写,可是谁有闲心重 : 新把这些函数写一遍啊。 : 也就是说,只要是加减乘除,AMD双精度OK,涉及函数,傻眼。NV就省心多了,很多函 : 数都定义好了。
|
S******n 发帖数: 5022 | |
w****g 发帖数: 727 | 75 我配过cuda的, 看你用多少了,用的不是很多的话 如果租amazon的一千块能用成百上
前小时了
CPU
4
【在 b*********n 的大作中提到】 : 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU : 要求不高,主要是日常处理,最多做一些测试,matlab之类的. : 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4 : 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.
|
E***e 发帖数: 3430 | 76 这种也就是玩玩
真要上战场拿着这么一把枪我还是要抖的
【在 S******n 的大作中提到】 : open CL toolbox for matlab下载地址: : https://code.google.com/p/opencl-toolbox/
|
z******i 发帖数: 1292 | 77 一千块就自己买个titan了~~~
【在 w****g 的大作中提到】 : 我配过cuda的, 看你用多少了,用的不是很多的话 如果租amazon的一千块能用成百上 : 前小时了 : : CPU : 4
|
l*****o 发帖数: 9235 | 78 不知道 NVIDIA 以前的 TESLA c2050 c1060 之类,是不是应该够用了。 |
i******t 发帖数: 22541 | 79 好看上面的帖子 我想说 老金 小姐 能帮我推荐个配置吗!多谢了!
我的要求 价格700左右 最好gtx的卡 不知道i5够不够用?
请推荐啊 小金 好牛x |
i******t 发帖数: 22541 | 80 我觉得还是用cuda吧 当然我也是新手 我觉得他是现在比较方便的 学习和使用
既然学习工作 就不要太在机器上给自己找不痛快了 |
|
|
S******n 发帖数: 5022 | 81 显卡选GTX 760吧这个$250,然后450配台机器。
其实等dell oulet有deal时450能抢到台式机i7的配置。
自己配要等deal吧。
【在 i******t 的大作中提到】 : 好看上面的帖子 我想说 老金 小姐 能帮我推荐个配置吗!多谢了! : 我的要求 价格700左右 最好gtx的卡 不知道i5够不够用? : 请推荐啊 小金 好牛x
|
i******t 发帖数: 22541 | 82 450的 dell i7机器那主板能放 760吗?
ps 450 貌似太夸张了 我觉得550 还算是靠谱的 450 基本上抢不到。。。
我也觉得760 现在看还不错 性价比比较高
580也好 但是貌似现在市场基本上没有啦。。
【在 S******n 的大作中提到】 : 显卡选GTX 760吧这个$250,然后450配台机器。 : 其实等dell oulet有deal时450能抢到台式机i7的配置。 : 自己配要等deal吧。
|
c****t 发帖数: 5452 | 83 ecc普通没用啊,服务器主板各种稳定性,配件性能都好,不光是ecc
i7.
【在 S******n 的大作中提到】 : Intel Xeon加non-ECC内存,就没有ECC功能了。不用ECC功能,不如上普通haswell i7. : (要考虑到主板价格。) : 我的建议是,如果上Xeon,就上全套ECC的东西,ECC内存,ECC专业显卡,就像apple : Mac Pro大圆桶那样。 : 不上ECC,就都不上ECC,普通家用的很了好了,haswell i7 + non-ECC DDR3 RAM + : GTX titan。 : 配什么样的机器基本上是由多少米决定的。
|
S******n 发帖数: 5022 | 84 所以说上haswell i7-4770K么,很多服务器6核CPU性能都打不过i7-4770K。
【在 c****t 的大作中提到】 : ecc普通没用啊,服务器主板各种稳定性,配件性能都好,不光是ecc : : i7.
|
t**t 发帖数: 27760 | 85 正常功率的6核Xeon,还是不惧4770K的。
【在 S******n 的大作中提到】 : 所以说上haswell i7-4770K么,很多服务器6核CPU性能都打不过i7-4770K。
|
S******n 发帖数: 5022 | 86 日常应用就是连4960X都不如4770K快,这是有评测的,intel自己承认的。
【在 t**t 的大作中提到】 : 正常功率的6核Xeon,还是不惧4770K的。
|
t**t 发帖数: 27760 | 87 当然了。SuperPI之类的单线程比的是频率。
【在 S******n 的大作中提到】 : 日常应用就是连4960X都不如4770K快,这是有评测的,intel自己承认的。
|
S******n 发帖数: 5022 | |
S******n 发帖数: 5022 | 89 AMD异构计算的SDK千呼万唤始出来~~~~~~~~
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
即将发布的Kaveri APU会把异构计算推向一个全新的高度,而要想充分发挥硬件优势,
开发环境必须跟随到位。今天的APU13开发者峰会上,AMD就宣布了全新的一体化SDK开
发包,以及改进的CodeXL工具。
AMD APP SDK v2.9:
有史以来最为用户友好的异构计算SDK,增加了多项简单易用、高效开发的新特性,比
如基于Web的简单浏览器,可轻松查找工程示例;增加支持CMake,一个流行的跨平台安
装(编译)工具;新增Visual Studio插件,改进OpenCL源编辑;一些新的示例,展示如
何以最小代价优化OpenCV、Bolt等开源库从而获得加速性能。
操作系统支持Windows 7/8/8.1、Linux 32/64位,后者包括openSUSE 11.x, Ubuntu 10
.x, Red Hat Enterprise Linux 6.x,驱动需要催化剂13.11 Beta。
官方下载:
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
Media SDK v1.0:
这是该开发包第一次公开发布,用于AMD产品多媒体特性的开发,比如GPU加速的视频预
处理、后期处理库,低延迟视频编码库。
操作系统支持Windows 7/8/8.1 32/64位,驱动需要催化剂13.9。
官方下载:
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
SDK还在多个开源库内增加了多项异构加速优化,包括OpenCV增加了大量OpenCL加速功
能,clMath拥有了BLAS、FFT库,并支持Fortran、C、C++,数据并行算法GPU加速的C++
模板库Bolt跨平台了,并有很多性能改进和新特性。
CodeXL v1.3:
现在支持Java了!还集成了静态内核分析功能,支持远程调试、配置,并支持GCN架构
GPU、APU。
操作系统支持Windows 7/8/8.1 32/64位、Ubuntu 12.04+ 64位、Red Hat Enterprise
Linux 6.x 64位,开发环境需要Visual Studio 2010/2012,驱动需要催化剂13.9。
官方下载:
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
AMD表示,将最终会让开发者非常方便地访问其产品的所有可编程模块,而且要跨平台
、跨系统、跨厂商、跨语言,这些努力只是第一步,而且还会继续贡献给开源社区。 |
S******n 发帖数: 5022 | 90 AMD SDK 终于有了,不是那把小枪了,呵呵~~~
【在 E***e 的大作中提到】 : 这种也就是玩玩 : 真要上战场拿着这么一把枪我还是要抖的
|
|
|
E***e 发帖数: 3430 | 91 可是cuda math在amd上到底对应哪个?
clmath文档看了半天也没几个函数啊?
【在 S******n 的大作中提到】 : AMD SDK 终于有了,不是那把小枪了,呵呵~~~
|
a*s 发帖数: 425 | 92 http://www.eecs.berkeley.edu/~sangjin/2013/02/12/CPU-GPU-compar
看看这篇文章吧,还有里面的一篇paper
gpu没有你想的那么神
就算cuda 上千核,执行效率应该还是cpu高
而且,只是特定的应用,
code都优化的话,cpu和gpu比,没有差的那么离谱
【在 b*********n 的大作中提到】 : cpu拼不过gpu. : 计算肯定是gpu了,上千个cuda核。现在需要一块性价比好的cpu,4核最好,处理日常 : 工作。
|
E***e 发帖数: 3430 | 93 CPU和GPU都是各有优劣
偏向哪一方的论调都有失偏颇
http://www.walkingrandomly.com/?p=3736
【在 a*s 的大作中提到】 : http://www.eecs.berkeley.edu/~sangjin/2013/02/12/CPU-GPU-compar : 看看这篇文章吧,还有里面的一篇paper : gpu没有你想的那么神 : 就算cuda 上千核,执行效率应该还是cpu高 : 而且,只是特定的应用, : code都优化的话,cpu和gpu比,没有差的那么离谱
|
a*s 发帖数: 425 | 94 呵呵,我没有说cpu好,
我只是提一个醒,
gpu有点hyper
个人感觉
【在 E***e 的大作中提到】 : CPU和GPU都是各有优劣 : 偏向哪一方的论调都有失偏颇 : http://www.walkingrandomly.com/?p=3736
|
E***e 发帖数: 3430 | 95 hyper不hyper,全看应用
有些应用就是独立线程的简单计算暴力重复
拼时间不拼技术
GPU用上就很合适
【在 a*s 的大作中提到】 : 呵呵,我没有说cpu好, : 我只是提一个醒, : gpu有点hyper : 个人感觉
|