求个建议装机计算用 - Hardware版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Hardware版 - 求个建议装机计算用

相关主题
● 大家说说 cuda 和 opencl 吧	● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
● 自己配机器之我见	● 双精度计算的话280X和7970是不是差不多？
● 求教科学计算的软硬配置	● 矿机问题
● 请问有没有Nvidia GPU在CUDA上计算的benchmark	● 大家帮看看这台做GPU并行计算的机器
● 求问一下GTX 580的双精度GFLOPS有多少？	● 家里的6年前装的台式机启动不了了，请推荐主机。
● Tesla C2050 还是3个GTX 480？	● AMD的APU上跑ArrayFire的exception
● 4k 有游戏是不是没有什么意义？	● 想买台台式机跑科学计算。请大虾推荐。
● 有没有办法破解GTX 580的双精度	● 二手GTX580拿到以后有没有办法测试一下？

相关话题的讨论汇总
话题: amd话题: cpu话题: crack话题: intel话题: gtx

进入Hardware版参与讨论

(共1页)

b*********n
发帖数: 2284

打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
要求不高,主要是日常处理,最多做一些测试,matlab之类的.
求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.

S******n
发帖数: 5022

用GPU计算，应该选AMD的卡吧。
GTX 7系列或者6系列都是游戏卡，计算能力不行的，特别是双精度计算都不行。
民用计算还是AMD的7990和7970强。

CPU
4

【在 b*********n 的大作中提到】

: 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
: 要求不高,主要是日常处理,最多做一些测试,matlab之类的.
: 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
: 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.

S******n
发帖数: 5022

说得好像AMD不整合GPU一样。
AMD CPU内集成的GPU比intel更强。

CPU
4

【在 b*********n 的大作中提到】

a******1
发帖数: 2340

FX没有的

【在 S******n 的大作中提到】

: 说得好像AMD不整合GPU一样。
: AMD CPU内集成的GPU比intel更强。
:
: CPU
: 4

a******1
发帖数: 2340

GTX TITAN 还是目前的GPGPU民用之王，那个Double Precision Throuput (1/3) 基本
上是专业卡的水平
http://stackoverflow.com/questions/16027391/nvidia-gpus-for-res

【在 S******n 的大作中提到】

: 用GPU计算，应该选AMD的卡吧。
: GTX 7系列或者6系列都是游戏卡，计算能力不行的，特别是双精度计算都不行。
: 民用计算还是AMD的7990和7970强。
:
: CPU
: 4

E***e
发帖数: 3430

如果只用单精度
gtx靠谱嘛？

【在 S******n 的大作中提到】

i******t
发帖数: 22541

我也想配个做计算的电脑同求！

o**n
发帖数: 2130

buy.com 的hp420 最近减价，771.99， e5-1650，光这个cpu就600刀左右了

b*********n
发帖数: 2284

cpu拼不过gpu.
计算肯定是gpu了，上千个cuda核。现在需要一块性价比好的cpu，4核最好，处理日常
工作。

【在 o**n 的大作中提到】

: buy.com 的hp420 最近减价，771.99， e5-1650，光这个cpu就600刀左右了

f*******r
发帖数: 605

用e3 1230

【在 b*********n 的大作中提到】

: cpu拼不过gpu.
: 计算肯定是gpu了，上千个cuda核。现在需要一块性价比好的cpu，4核最好，处理日常
: 工作。

相关主题
● Tesla C2050 还是3个GTX 480？	● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
● 4k 有游戏是不是没有什么意义？	● 双精度计算的话280X和7970是不是差不多？
● 有没有办法破解GTX 580的双精度	● 矿机问题
进入Hardware版参与讨论

r***i
发帖数: 913

http://offer.ebay.com/ws/eBayISAPI.dll?ViewBidsLogin&_trksid=p2047675.l2564&rt=nc&item=360719928072
还有过699，哈哈

【在 o**n 的大作中提到】

: buy.com 的hp420 最近减价，771.99， e5-1650，光这个cpu就600刀左右了

b*********n
发帖数: 2284

擦，server cpu可不便宜啊！而且这玩意儿能用non ecc内存吗？

【在 f*******r 的大作中提到】

: 用e3 1230

S******n
发帖数: 5022

双精度计算能力：
GTX titan： 1.30 TFLOPs 价格$999
GTX 780： 0.19 TFLOPs 价格$499
AMD 7970： 1.04 TFLOPs 价格$299
AMD 7990： 2.04 TFLOPs 价格$799
自己看性价比吧，7990其实是两块7970.
性能对比：
http://www.tomshardware.com/reviews/radeon-hd-7990-review-bench
要论民用之王，还是AMD 7990吧。难道 2.04 < 1.30 ?
外加上楼主也没有提Titan，Titan是很强，但是比7990还是差一点点，价格贵一点点。
如果是我，买两块 AMD 7970 交火，用600多刀的价格达到约 2 TFLOPs的双精度浮点，
约8 TFLOPs的单精度浮点。

【在 a******1 的大作中提到】

: GTX TITAN 还是目前的GPGPU民用之王，那个Double Precision Throuput (1/3) 基本
: 上是专业卡的水平
: http://stackoverflow.com/questions/16027391/nvidia-gpus-for-res

S******n
发帖数: 5022

那还是打游戏吧。游戏渲染就只用单精度。

【在 E***e 的大作中提到】

: 如果只用单精度
: gtx靠谱嘛？

r***i
发帖数: 913

E3就是i7的价，实质也差不多，应该可以用non ECC

【在 b*********n 的大作中提到】

: 擦，server cpu可不便宜啊！而且这玩意儿能用non ecc内存吗？

x********o
发帖数: 2092

GTX的比AMD的好，主要是cuda提供了很多方便，像BLAS一类的用现成的就行了。AMD系
列的没有cuda这样的。

S******n
发帖数: 5022

有钱就买Telsa 或 Titan。
没钱就只能AMD OpenCL了，这两年OpenCL应用也不少了。从两年前的几款应用到现在的
好几千款应用了~~~
现在intel,apple都提供了对OpenCL的支持吧，特别是apple,不遗余力的。
apple的Mac pro大圆桶就是异构计算的典型配置，可以参考一下。
http://store.apple.com/us/buy-mac/mac-pro
OpenCL是提供了API接口，可以在C++里调用这些SDK。
不过CUDA更底层一些，软件和驱动成熟一些，毕竟软件上耕耘的时间更长，编程灵活一
些。
用CUDA搞计算，PGI Visual Fortran 少不了，google一下盗版就有下载的。
自己决定买什么吧，其实条条大路通罗马。
真的通用计算，还是intel的系统软件上更容易一些。
美国正在造的超算，将是纯intel 12核CPU + intel SSD；（编程容易，纯粹的x86-
64编程环境。）
中国的天河二号，intel 12核CPU + intel phi计算加速卡；（编程也容易，phi计算
卡也是x86系统。）
天河一号A，intel 8核CPU + NV Tesla计算加速卡；（需要CUDA编程了）
天河一号，intel 4核CPU + AMD显卡加速计算；（需要调用OpenCL接口编程）
从“天河一号”到“天河一号A”到“天河二号”，软件的门槛是越来越低了，毕竟纯
intel系统上的编程更通用，intel+CUDA编程次之，intel+OpenCL再次之。
对个人计算来说，超算太遥远，但是超算的单个计算节点我们个人配计算用的机器是可
以参考的。
在建的美国超算，每个计算节点： 2个Intel Xeon 12 cores CPU，128GB RAM，800GB
SSD;
“天河二号”，每个计算节点： 2个Intel Xeon 12 cores CPU，64GB RAM，外加3个
Intel Xeon phi计算卡；
“天河一号A”，每个计算节点： 2个Intel Xeon 8 cores CPU，32GB RAM，外加1个NV
Tesla计算卡；
“天河一号”，每个计算节点： 1个Intel Xeon 4 cores CPU，16GB RAM，外加1个AMD
显卡加速；
美国橡树岭“泰坦”，每个计算节点： 1个AMD Opteron 16 cores CPU，32GB RAM，外
加1个NV Tesla计算卡；
再加上apple的MAC pro，每个桶：1个Intel Xeon CPU，16GB RAM，外加2个AMD显卡加
速；
所以，个人配计算用的机器，
如果超级有米的话， 2个Intel Xeon CPU，128GB RAM，外加2个Intel Xeon phi或者NV
Tesla计算卡；
米次之，可以考虑没有ECC内存校验的版本,那就是普通的intel i7 CPU + 32GB/64GB +
一块或2块NV GTX Titan计算加速卡。
米还是不足，那就只能上AMD/intel CPU+AMD显卡加速了。

【在 x********o 的大作中提到】

: GTX的比AMD的好，主要是cuda提供了很多方便，像BLAS一类的用现成的就行了。AMD系
: 列的没有cuda这样的。

f*******r
发帖数: 605

比同频i7便宜多了。当然能用非ecc的。

【在 b*********n 的大作中提到】

: 擦，server cpu可不便宜啊！而且这玩意儿能用non ecc内存吗？

S******n
发帖数: 5022

Intel Xeon加non-ECC内存，就没有ECC功能了。不用ECC功能，不如上普通haswell i7.
（要考虑到主板价格。）
我的建议是，如果上Xeon，就上全套ECC的东西，ECC内存，ECC专业显卡，就像apple
Mac Pro大圆桶那样。
不上ECC，就都不上ECC，普通家用的很了好了，haswell i7 + non-ECC DDR3 RAM +
GTX titan。
配什么样的机器基本上是由多少米决定的。

【在 f*******r 的大作中提到】

: 比同频i7便宜多了。当然能用非ecc的。

E***e
发帖数: 3430

请问能配合AMD+OpenCL使用的
类似CUDA Math的library有什么比较好的？
谢谢！

【在 S******n 的大作中提到】

: 有钱就买Telsa 或 Titan。
: 没钱就只能AMD OpenCL了，这两年OpenCL应用也不少了。从两年前的几款应用到现在的
: 好几千款应用了~~~
: 现在intel,apple都提供了对OpenCL的支持吧，特别是apple,不遗余力的。
: apple的Mac pro大圆桶就是异构计算的典型配置，可以参考一下。
: http://store.apple.com/us/buy-mac/mac-pro
: OpenCL是提供了API接口，可以在C++里调用这些SDK。
: 不过CUDA更底层一些，软件和驱动成熟一些，毕竟软件上耕耘的时间更长，编程灵活一
: 些。
: 用CUDA搞计算，PGI Visual Fortran 少不了，google一下盗版就有下载的。

相关主题
● 大家帮看看这台做GPU并行计算的机器	● 想买台台式机跑科学计算。请大虾推荐。
● 家里的6年前装的台式机启动不了了，请推荐主机。	● 二手GTX580拿到以后有没有办法测试一下？
● AMD的APU上跑ArrayFire的exception	● NV记 Titan Z 显卡真疯狂啊
进入Hardware版参与讨论

E***e
发帖数: 3430

大概七八年前，连计算流体都是单精度
因为内存不够
现在的应用我完全不介意由于硬件限制回到单精度上

【在 S******n 的大作中提到】

: 那还是打游戏吧。游戏渲染就只用单精度。

S******n
发帖数: 5022

用单精度的话，上两块GTX 780吧。现在降价了，性价比不错。
GTX 7系列，双精度是单精度的 1/24 （理论值是1/3,阉割了）
其实如果不上titan，GTX 580的双精度在NV民用卡中是最强的。只是现在我不知道哪里
有廉价GTX 580卖。
NV 费米双精度理论上是单精度的 1/2；
NV 开普勒双精度理论上是单精度的 1/3；
NV 麦克斯韦双精度理论上是单精度的 1/4；（麦克斯韦要集成ARM处理器，ARM参与调
度）
AMD R9 290X/290也阉割了双精度了，只有单精度的1/8 (理论值应该是1/2，阉割了)。
倒是7990、7970的双精度是完全的，是单精度的1/4(理论值也是1/4)。
用游戏卡搞计算，单精度AMD和NV其实都差不多。
双精度目前是NV阵营 Titan > 580 > 780; AMD阵营 7970 > 290X

【在 E***e 的大作中提到】

: 大概七八年前，连计算流体都是单精度
: 因为内存不够
: 现在的应用我完全不介意由于硬件限制回到单精度上

S******n
发帖数: 5022

OpenCL从几款应用到现在几千款应用，也是最近两年的事情。
七八年前很遥远了~~~七八年前CUDA如日中天，OpenCL是狗屎。

【在 E***e 的大作中提到】

: 大概七八年前，连计算流体都是单精度
: 因为内存不够
: 现在的应用我完全不介意由于硬件限制回到单精度上

E***e
发帖数: 3430

哪里能看到几千款应用的好评度神码的？
对C++不算很熟，最好能有documentation比较好的library。。。

【在 S******n 的大作中提到】

: OpenCL从几款应用到现在几千款应用，也是最近两年的事情。
: 七八年前很遥远了~~~七八年前CUDA如日中天，OpenCL是狗屎。

l*****o
发帖数: 9235

如果要搞一个个人计算的台式机做科学计算，需要双精度，既有满矩阵，又有稀疏矩阵
。是自己配好，还是买戴尔的 T5600 比较好？
自己配的话，cooling system 和主板怎么选比较好？买的话，能拿到更好的折扣吗
？

x********o
发帖数: 2092

条条大路是通罗马，问题是对大部分人来说这玩意就是一个工具，花太多时间精力去调
试优化代码不值得，还不如有现成的支持快。

【在 S******n 的大作中提到】

E***e
发帖数: 3430

貌似AMD已经把BLAS释放了：
http://developer.amd.com/community/blog/2013/08/13/amd-releases
现在就需要个数学函数的library了

S******n
发帖数: 5022

http://configure.us.dell.com/dellstore/config.aspx?oc=swct563&m
自己配类似性能的机器，显卡也不便宜吧。
你可以尝试用newegg的价格配台类似的配置，看谁便宜。（CPU选xeon，内存选ECC的服
务器内存）

【在 l*****o 的大作中提到】

: 如果要搞一个个人计算的台式机做科学计算，需要双精度，既有满矩阵，又有稀疏矩阵
: 。是自己配好，还是买戴尔的 T5600 比较好？
: 自己配的话，cooling system 和主板怎么选比较好？买的话，能拿到更好的折扣吗
: ？

l*****o
发帖数: 9235

主板和制冷呢？

【在 S******n 的大作中提到】

: http://configure.us.dell.com/dellstore/config.aspx?oc=swct563&m
: 自己配类似性能的机器，显卡也不便宜吧。
: 你可以尝试用newegg的价格配台类似的配置，看谁便宜。（CPU选xeon，内存选ECC的服
: 务器内存）

S******n
发帖数: 5022

主板得选服务器或者工作站主板，2011的。
服务器主板
http://www.newegg.com/Product/ProductList.aspx?Submit=ENE&N=100
工作站主板
http://www.newegg.com/Product/Product.aspx?Item=N82E16813131817
制冷选液冷吧。

【在 l*****o 的大作中提到】

: 主板和制冷呢？

相关主题
● 750 ti是不是性价比最高的CUDA卡？	● 自己配机器之我见
● AMD vega 什么时候出？	● 求教科学计算的软硬配置
● 大家说说 cuda 和 opencl 吧	● 请问有没有Nvidia GPU在CUDA上计算的benchmark
进入Hardware版参与讨论

l*****o
发帖数: 9235

NVIDIA 哪些卡可以用 CUDA 做并行计算啊？这些卡对其他部分有什么特殊要求吗？

【在 S******n 的大作中提到】

: 主板得选服务器或者工作站主板，2011的。
: 服务器主板
: http://www.newegg.com/Product/ProductList.aspx?Submit=ENE&N=100
: 工作站主板
: http://www.newegg.com/Product/Product.aspx?Item=N82E16813131817
: 制冷选液冷吧。

E***e
发帖数: 3430

貌似市面上所有的都可以，问题就是性能怎样
游戏卡单精度计算都还好，双精度就比cpu没什么优势了
真想玩双精度，要买专业计算用的Tesla神码的，单双性能比3:1
刚才牛人推荐GTX Titan也基本有3:1的水平，但是titan的flops比tesla还是差不少

【在 l*****o 的大作中提到】

: NVIDIA 哪些卡可以用 CUDA 做并行计算啊？这些卡对其他部分有什么特殊要求吗？

z******i
发帖数: 1292

GTX titan其实就是没有ECC内存校验的Tesla K20x卡，基本的flops是一样的，都是单
精度3.9 Tflops，双精度1.3 Tflops。
没有内存校验，这么多核，只要有一个算错了，计算结果就错了。
为了防止这点，就需要采用比较好的厚的全塔机箱。

【在 E***e 的大作中提到】

: 貌似市面上所有的都可以，问题就是性能怎样
: 游戏卡单精度计算都还好，双精度就比cpu没什么优势了
: 真想玩双精度，要买专业计算用的Tesla神码的，单双性能比3:1
: 刚才牛人推荐GTX Titan也基本有3:1的水平，但是titan的flops比tesla还是差不少

E***e
发帖数: 3430

小白求问机箱和内存错误之间什么关系？

【在 z******i 的大作中提到】

: GTX titan其实就是没有ECC内存校验的Tesla K20x卡，基本的flops是一样的，都是单
: 精度3.9 Tflops，双精度1.3 Tflops。
: 没有内存校验，这么多核，只要有一个算错了，计算结果就错了。
: 为了防止这点，就需要采用比较好的厚的全塔机箱。

l*****o
发帖数: 9235

TITAN 一千块还可以接受，特斯拉 3500 块太贵了。
谁能解释一下这个差别

【在 E***e 的大作中提到】

l*****o
发帖数: 9235

同问

【在 E***e 的大作中提到】

: 小白求问机箱和内存错误之间什么关系？

z******i
发帖数: 1292

其实AMD显卡的双精度更好，问题在于功耗不好，散热不好，所以集群时很少采用AMD的
卡。（集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。）
跟AMD R9 290X对应的专业显卡，单精度 5.6 Tflops，双精度2.8 Tflops, 价格$4000
以上吧。（290X自己是单精度5.6 Tflops，双精度700 Gflops。）
跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。（两者
性能都是单精度 4.0 Tflops，双精度1.0 Tflops）前者价格300美元，后者价格3500美
元。差别主要是ECC校验和驱动程序。
http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
GTX Titan跟Tesla K20X的关系也是这样的，GTX Titan卖$999，Tesla K20X卖$3499。

E***e
发帖数: 3430

主要差别就在内存校验吧
我觉得个人 prototyping 目的的话titan足够了
商业production还是要搞tesla

【在 l*****o 的大作中提到】

: TITAN 一千块还可以接受，特斯拉 3500 块太贵了。
: 谁能解释一下这个差别

l*****o
发帖数: 9235

可惜我不会 OpenCL

4000

【在 z******i 的大作中提到】

: 其实AMD显卡的双精度更好，问题在于功耗不好，散热不好，所以集群时很少采用AMD的
: 卡。（集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。）
: 跟AMD R9 290X对应的专业显卡，单精度 5.6 Tflops，双精度2.8 Tflops, 价格$4000
: 以上吧。（290X自己是单精度5.6 Tflops，双精度700 Gflops。）
: 跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。（两者
: 性能都是单精度 4.0 Tflops，双精度1.0 Tflops）前者价格300美元，后者价格3500美
: 元。差别主要是ECC校验和驱动程序。
: http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
: GTX Titan跟Tesla K20X的关系也是这样的，GTX Titan卖$999，Tesla K20X卖$3499。

z******i
发帖数: 1292

机箱足够厚可以减轻宇宙射线带来的内存数值翻转，同时有更好的电磁屏蔽。

【在 E***e 的大作中提到】

: 小白求问机箱和内存错误之间什么关系？

相关主题
● 请问有没有Nvidia GPU在CUDA上计算的benchmark	● 4k 有游戏是不是没有什么意义？
● 求问一下GTX 580的双精度GFLOPS有多少？	● 有没有办法破解GTX 580的双精度
● Tesla C2050 还是3个GTX 480？	● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
进入Hardware版参与讨论

E***e
发帖数: 3430

宇宙射线膜拜了

【在 z******i 的大作中提到】

: 机箱足够厚可以减轻宇宙射线带来的内存数值翻转，同时有更好的电磁屏蔽。

E***e
发帖数: 3430

什么开发目的？
C++配上一两个library不够用？

【在 l*****o 的大作中提到】

: 可惜我不会 OpenCL
:
: 4000

z******i
发帖数: 1292

openCL 2008年才开始的。
http://zh.wikipedia.org/wiki/OpenCL

【在 l*****o 的大作中提到】

: 可惜我不会 OpenCL
:
: 4000

E***e
发帖数: 3430

请问GT780单精度浮点能有5046GFLOPS这个不是超过TESLA K20了？
不考虑ECC的话。。。

【在 z******i 的大作中提到】

: openCL 2008年才开始的。
: http://zh.wikipedia.org/wiki/OpenCL

z******i
发帖数: 1292

呵呵，这个是避免不了的。所以只能靠冗余和ECC校验纠正。
服务器上可靠性很重要的，万一出错后果很严重。
个人用一两块GTX titan配厚一点的机箱，发生错误的几率不比带ECC校验的超级计算机
更大。
当然，如果搞上几千块几万块GTX titan，那宇宙射线导致翻转的几率就不能忽视了。

【在 E***e 的大作中提到】

: 宇宙射线膜拜了

z******i
发帖数: 1292

是的。

【在 E***e 的大作中提到】

: 请问GT780单精度浮点能有5046GFLOPS这个不是超过TESLA K20了？
: 不考虑ECC的话。。。

E***e
发帖数: 3430

那就回头整个这货prototyping玩
反正单精度对我足够了

【在 z******i 的大作中提到】

: 是的。

z******i
发帖数: 1292

别忘记了到时整个PGI Visual Fortran

我机器的E盘倒是有，网上应该有不少下载的。
E:PGI
│
├─PGI.Visual.Fortran.2008.v11.9
│ │ crack.7z
│ │ pgivf-vs2008-119.exe
│ │ pgivfx64-vs2008-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│ pgi-vs-patch.7z
│
├─PGI.Visual.Fortran.2010.v11.9
│ │ crack.7z
│ │ pgivf-vs2010-119.exe
│ │ pgivfx64-vs2010-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│
├─PGI.Visual.Fortran.2010.v11.9.with.VS2010.Shell
│ │ crack.7z
│ │ pgivf-vs2010all-119.exe
│ │ pgivfx64-vs2010all-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│ pgi-vs-patch.7z
│
├─PGI.Visual.Fortran.v13.9
│ pvf32-139.exe
│ pvf64-139.exe
│
├─PGI.Visual.Fortran.v13.9.Win2k3
│ pvf32-xp-139.exe
│ pvf64-xp-139.exe
│
├─PGI.Visual.Fortran.v13.9.with.VS.Shell
│ pvf32-shell-139.exe
│ pvf64-shell-139.exe
│
├─PGI.Workstation.Complete.v11.9
│ │ crack.7z
│ │ pgiws-119.exe
│ │ pgiwsx64-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-ws32-patch.7z
│ pgi-ws64-patch.7z
│
├─PGI.Workstation.Complete.v13.9
│ pgiws32-139.exe
│ pgiws64-139.exe
│
├─PGI.Workstation.Complete.v13.9.Linux
│ pgilinux-2013-139.tar.gz
│
├─PGI.Workstation.Complete.v13.9.OSX
│ PGI-Workstation-139.dmg
│
└─PGI.Workstation.Complete.v13.9.Win2k3
pgiws32-xp-139.exe
pgiws64-xp-139.exe

【在 E***e 的大作中提到】

: 那就回头整个这货prototyping玩
: 反正单精度对我足够了

l*****o
发帖数: 9235

看了一下，好像 Intel Xeon PHI 基本可以代替 NVIDIA TESLA 啊，价格便宜不少吧。
有谁了解吗？

S******n
发帖数: 5022

Xeon PHI这个东西源于失败了的intel独立显卡项目Larrabee。
当年，intel想在一张卡上集成上百个intel x86 CPU，想做通用独立显卡，跟老黄的费
米显卡竞争，因为没法控制发热量，Larrabee项目失败了。（老黄那时天天笑intel
Laugh——a——bee~~~）
2009年5月
http://www.pcpop.com/doc/0/398/398280.shtml
2010年5月
http://www.enet.com.cn/article/2010/0526/A20100526659291.shtml
但是intel毕竟投了很多钱，完全放弃又舍不得，最后抬头换面做计算加速卡，这就是
Intel Xeon PHI。
现在Intel Xeon PHI就是一张卡集成60+的586 1GHz CPU, 8GB RAM, 主要做并行计算加
速，双精度能到 1.x Tfls。

【在 l*****o 的大作中提到】

: 看了一下，好像 Intel Xeon PHI 基本可以代替 NVIDIA TESLA 啊，价格便宜不少吧。
: 有谁了解吗？

相关主题
● 双精度计算的话280X和7970是不是差不多？	● 家里的6年前装的台式机启动不了了，请推荐主机。
● 矿机问题	● AMD的APU上跑ArrayFire的exception
● 大家帮看看这台做GPU并行计算的机器	● 想买台台式机跑科学计算。请大虾推荐。
进入Hardware版参与讨论

E***e
发帖数: 3430

别笑话我土，一直没搞明白
cuda math不是cuda c上的么？
为什么fortran会跳出来？

【在 z******i 的大作中提到】

: 别忘记了到时整个PGI Visual Fortran
:
: 我机器的E盘倒是有，网上应该有不少下载的。
: E:PGI
: │
: ├─PGI.Visual.Fortran.2008.v11.9
: │ │ crack.7z
: │ │ pgivf-vs2008-119.exe
: │ │ pgivfx64-vs2008-119.exe
: │ │

S******n
发帖数: 5022

Visual Fortran和Visual C++是同一界面，数值计算还是使用Fortran的多。
编译使用起来应该是一样的。

【在 E***e 的大作中提到】

: 别笑话我土，一直没搞明白
: cuda math不是cuda c上的么？
: 为什么fortran会跳出来？

E***e
发帖数: 3430

那cuda c + cuda BLAS + cuda MATH有什么劣势？
仅仅是速度么？
现在行业应用fortran已经比较困难了
就算我愿意，老板客户也不愿意
招不到搞这货的人，OO也不方便

【在 S******n 的大作中提到】

: Visual Fortran和Visual C++是同一界面，数值计算还是使用Fortran的多。
: 编译使用起来应该是一样的。

S******n
发帖数: 5022

没关系啊，反正有Visual Fortran的地方多半同时存在Visual C++，
用C++编程就是了。

【在 E***e 的大作中提到】

: 那cuda c + cuda BLAS + cuda MATH有什么劣势？
: 仅仅是速度么？
: 现在行业应用fortran已经比较困难了
: 就算我愿意，老板客户也不愿意
: 招不到搞这货的人，OO也不方便

E***e
发帖数: 3430

就是说在PGI Visual Fortran里写C++代码，然后调用cuda BLAS和MATH？

【在 S******n 的大作中提到】

: 没关系啊，反正有Visual Fortran的地方多半同时存在Visual C++，
: 用C++编程就是了。

l*****o
发帖数: 9235

关键是能替代 NVIDIA 的特斯拉吗？网上好像没有结论

【在 S******n 的大作中提到】

: Xeon PHI这个东西源于失败了的intel独立显卡项目Larrabee。
: 当年，intel想在一张卡上集成上百个intel x86 CPU，想做通用独立显卡，跟老黄的费
: 米显卡竞争，因为没法控制发热量，Larrabee项目失败了。（老黄那时天天笑intel
: Laugh——a——bee~~~）
: 2009年5月
: http://www.pcpop.com/doc/0/398/398280.shtml
: 2010年5月
: http://www.enet.com.cn/article/2010/0526/A20100526659291.shtml
: 但是intel毕竟投了很多钱，完全放弃又舍不得，最后抬头换面做计算加速卡，这就是
: Intel Xeon PHI。

E***e
发帖数: 3430

我觉得还是算了吧
搞个GTX 780 TI比这靠谱，才700块。。。

【在 l*****o 的大作中提到】

: 关键是能替代 NVIDIA 的特斯拉吗？网上好像没有结论

S******n
发帖数: 5022

我的理解是，必须有微软的Visual studio才能装上visual Fortran，装完了Fortran就
成了Visual studio的一部分。
至于visual studio用什么语言，怎么调用CUDA加速，没必要操心太多吧。CUDA肯定是
对C++和Fortran同时起作用的。

【在 E***e 的大作中提到】

: 就是说在PGI Visual Fortran里写C++代码，然后调用cuda BLAS和MATH？

E***e
发帖数: 3430

长知识了
回头试试看
多谢了

【在 S******n 的大作中提到】

: 我的理解是，必须有微软的Visual studio才能装上visual Fortran，装完了Fortran就
: 成了Visual studio的一部分。
: 至于visual studio用什么语言，怎么调用CUDA加速，没必要操心太多吧。CUDA肯定是
: 对C++和Fortran同时起作用的。

S******n
发帖数: 5022

显然是啊，否则"天河二号"不用NVIDIA 的特斯拉而用intel的phi？
"天河一号A"和橡树岭的"泰坦"都是用NV telsa加速的。
用intel的phi降低了编程成本同时提高了通用性吧，因为phi说白了就是一堆现代工艺
的586。
你看，telsa都没有显示器接口。
http://www.newegg.com/Product/Product.aspx?Item=N82E16814132008

【在 l*****o 的大作中提到】

: 关键是能替代 NVIDIA 的特斯拉吗？网上好像没有结论

相关主题
● 二手GTX580拿到以后有没有办法测试一下？	● AMD vega 什么时候出？
● NV记 Titan Z 显卡真疯狂啊	● 大家说说 cuda 和 opencl 吧
● 750 ti是不是性价比最高的CUDA卡？	● 自己配机器之我见
进入Hardware版参与讨论

l*****o
发帖数: 9235

我的需要双精度浮点运算，这个能行吗，我前面看的最少也需要 Quadro 4000 才行。

【在 E***e 的大作中提到】

: 我觉得还是算了吧
: 搞个GTX 780 TI比这靠谱，才700块。。。

l*****o
发帖数: 9235

我仔细看了下，好像据说对于本身就非常平行的程序，比如蒙特卡洛，ray tracing 之
类的，特斯拉还是好不少。
但是对于不是本身就很平行的东西，比如稀疏矩阵乘法之类的，phi 比特斯拉好不少。

【在 S******n 的大作中提到】

: 显然是啊，否则"天河二号"不用NVIDIA 的特斯拉而用intel的phi？
: "天河一号A"和橡树岭的"泰坦"都是用NV telsa加速的。
: 用intel的phi降低了编程成本同时提高了通用性吧，因为phi说白了就是一堆现代工艺
: 的586。
: 你看，telsa都没有显示器接口。
: http://www.newegg.com/Product/Product.aspx?Item=N82E16814132008

S******n
发帖数: 5022

自己配吧，Haswell i7-4770K, 32GB DDR3, 外加一块GTX Titan显卡加速或者两块。

【在 l*****o 的大作中提到】

: 我的需要双精度浮点运算，这个能行吗，我前面看的最少也需要 Quadro 4000 才行。

S******n
发帖数: 5022

那是，要是当年搞好了蒙特卡洛，ray tracing， Phi就是独立显卡larraabee了。
特斯拉去掉ECC加个显示接口，就是正规的显卡——gtx titan了。
毕竟一个是失败的显卡，一个是成功的显卡加强。
蒙特卡洛，AMD显卡更强

【在 l*****o 的大作中提到】

: 我仔细看了下，好像据说对于本身就非常平行的程序，比如蒙特卡洛，ray tracing 之
: 类的，特斯拉还是好不少。
: 但是对于不是本身就很平行的东西，比如稀疏矩阵乘法之类的，phi 比特斯拉好不少。

E***e
发帖数: 3430

双精度不怎么行
用titan好了

【在 l*****o 的大作中提到】

: 我的需要双精度浮点运算，这个能行吗，我前面看的最少也需要 Quadro 4000 才行。

E***e
发帖数: 3430

确实很想上AMD
可是AMD上到底用什么MATH和MATRIX的library？
看了半天也还是不明白

【在 S******n 的大作中提到】

: 那是，要是当年搞好了蒙特卡洛，ray tracing， Phi就是独立显卡larraabee了。
: 特斯拉去掉ECC加个显示接口，就是正规的显卡——gtx titan了。
: 毕竟一个是失败的显卡，一个是成功的显卡加强。
: 蒙特卡洛，AMD显卡更强

S******n
发帖数: 5022

GTX 780Ti 双精度是不怎么行，但是还是比intel的四核CPU快的多啊~~呵呵

【在 E***e 的大作中提到】

: 双精度不怎么行
: 用titan好了

l*****o
发帖数: 9235

我的应用中一大部分就是稀疏矩阵乘法，另外一大部分就是满矩阵乘法。像蒙特卡罗这
种天生平行的算法很少，所以我不太能确定。。。

【在 S******n 的大作中提到】

E***e
发帖数: 3430

我这种天天就在搞暴力MC重复计算的实在是太幸福了 lol

【在 l*****o 的大作中提到】

: 我的应用中一大部分就是稀疏矩阵乘法，另外一大部分就是满矩阵乘法。像蒙特卡罗这
: 种天生平行的算法很少，所以我不太能确定。。。

S******n
发帖数: 5022

找个AMD的显卡驱动看里面的OpenCL SDK?
感觉AMD软件上很偷懒，舍不得投入。
CUDA里面的数学库很庞大的。

【在 E***e 的大作中提到】

: 确实很想上AMD
: 可是AMD上到底用什么MATH和MATRIX的library？
: 看了半天也还是不明白

相关主题
● 自己配机器之我见	● 求问一下GTX 580的双精度GFLOPS有多少？
● 求教科学计算的软硬配置	● Tesla C2050 还是3个GTX 480？
● 请问有没有Nvidia GPU在CUDA上计算的benchmark	● 4k 有游戏是不是没有什么意义？
进入Hardware版参与讨论

E***e
发帖数: 3430

就找到了BLAS的，还是今年刚发布的
找了半天连个函数列表都没有
按理说数学函数的sdk应该很好找
可是居然就没搜到个靠谱的
反正跟cuda一比，心凉了半截。。。

【在 S******n 的大作中提到】

: 找个AMD的显卡驱动看里面的OpenCL SDK?
: 感觉AMD软件上很偷懒，舍不得投入。
: CUDA里面的数学库很庞大的。

S******n
发帖数: 5022

别提了，据说AMD卡双精度只有IEEE里面最基本的计算，双精度函数部分，没有写，号
称自定义能力强。
也就是说，函数功能超级不全，不提供现成的。当然，自己是可以写，可是谁有闲心重
新把这些函数写一遍啊。
也就是说，只要是加减乘除，AMD双精度OK，涉及函数，傻眼。NV就省心多了，很多函
数都定义好了。

【在 E***e 的大作中提到】

: 就找到了BLAS的，还是今年刚发布的
: 找了半天连个函数列表都没有
: 按理说数学函数的sdk应该很好找
: 可是居然就没搜到个靠谱的
: 反正跟cuda一比，心凉了半截。。。

E***e
发帖数: 3430

那我还是老老实实在CUDA的世界里晃悠一阵吧
很多函数就算自己写，也没法把性能最优化啊，那是要很多功夫的
唉

【在 S******n 的大作中提到】

: 别提了，据说AMD卡双精度只有IEEE里面最基本的计算，双精度函数部分，没有写，号
: 称自定义能力强。
: 也就是说，函数功能超级不全，不提供现成的。当然，自己是可以写，可是谁有闲心重
: 新把这些函数写一遍啊。
: 也就是说，只要是加减乘除，AMD双精度OK，涉及函数，傻眼。NV就省心多了，很多函
: 数都定义好了。

S******n
发帖数: 5022

open CL toolbox for matlab下载地址：
https://code.google.com/p/opencl-toolbox/

w****g
发帖数: 727

我配过cuda的，看你用多少了，用的不是很多的话如果租amazon的一千块能用成百上
前小时了

CPU
4

【在 b*********n 的大作中提到】

E***e
发帖数: 3430

这种也就是玩玩
真要上战场拿着这么一把枪我还是要抖的

【在 S******n 的大作中提到】

: open CL toolbox for matlab下载地址：
: https://code.google.com/p/opencl-toolbox/

z******i
发帖数: 1292

一千块就自己买个titan了~~~

【在 w****g 的大作中提到】

: 我配过cuda的，看你用多少了，用的不是很多的话如果租amazon的一千块能用成百上
: 前小时了
:
: CPU
: 4

l*****o
发帖数: 9235

不知道 NVIDIA 以前的 TESLA c2050 c1060 之类，是不是应该够用了。

i******t
发帖数: 22541

好看上面的帖子我想说老金小姐能帮我推荐个配置吗！多谢了！
我的要求价格700左右最好gtx的卡不知道i5够不够用？
请推荐啊小金好牛x

i******t
发帖数: 22541

我觉得还是用cuda吧当然我也是新手我觉得他是现在比较方便的学习和使用
既然学习工作就不要太在机器上给自己找不痛快了

相关主题
● 有没有办法破解GTX 580的双精度	● 矿机问题
● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?	● 大家帮看看这台做GPU并行计算的机器
● 双精度计算的话280X和7970是不是差不多？	● 家里的6年前装的台式机启动不了了，请推荐主机。
进入Hardware版参与讨论

S******n
发帖数: 5022

显卡选GTX 760吧这个$250，然后450配台机器。
其实等dell oulet有deal时450能抢到台式机i7的配置。
自己配要等deal吧。

【在 i******t 的大作中提到】

: 好看上面的帖子我想说老金小姐能帮我推荐个配置吗！多谢了！
: 我的要求价格700左右最好gtx的卡不知道i5够不够用？
: 请推荐啊小金好牛x

i******t
发帖数: 22541

450的 dell i7机器那主板能放 760吗？
ps 450 貌似太夸张了我觉得550 还算是靠谱的 450 基本上抢不到。。。
我也觉得760 现在看还不错性价比比较高
580也好但是貌似现在市场基本上没有啦。。

【在 S******n 的大作中提到】

: 显卡选GTX 760吧这个$250，然后450配台机器。
: 其实等dell oulet有deal时450能抢到台式机i7的配置。
: 自己配要等deal吧。

c****t
发帖数: 5452

ecc普通没用啊，服务器主板各种稳定性，配件性能都好，不光是ecc

i7.

【在 S******n 的大作中提到】

: Intel Xeon加non-ECC内存，就没有ECC功能了。不用ECC功能，不如上普通haswell i7.
: （要考虑到主板价格。）
: 我的建议是，如果上Xeon，就上全套ECC的东西，ECC内存，ECC专业显卡，就像apple
: Mac Pro大圆桶那样。
: 不上ECC，就都不上ECC，普通家用的很了好了，haswell i7 + non-ECC DDR3 RAM +
: GTX titan。
: 配什么样的机器基本上是由多少米决定的。

S******n
发帖数: 5022

所以说上haswell i7-4770K么，很多服务器6核CPU性能都打不过i7-4770K。

【在 c****t 的大作中提到】

: ecc普通没用啊，服务器主板各种稳定性，配件性能都好，不光是ecc
:
: i7.

t**t
发帖数: 27760

正常功率的6核Xeon，还是不惧4770K的。

【在 S******n 的大作中提到】

: 所以说上haswell i7-4770K么，很多服务器6核CPU性能都打不过i7-4770K。

S******n
发帖数: 5022

日常应用就是连4960X都不如4770K快，这是有评测的，intel自己承认的。

【在 t**t 的大作中提到】

: 正常功率的6核Xeon，还是不惧4770K的。

t**t
发帖数: 27760

当然了。SuperPI之类的单线程比的是频率。

【在 S******n 的大作中提到】

: 日常应用就是连4960X都不如4770K快，这是有评测的，intel自己承认的。

S******n
发帖数: 5022

88楼，凑个吉利~~~

S******n
发帖数: 5022

AMD异构计算的SDK千呼万唤始出来~~~~~~~~
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
即将发布的Kaveri APU会把异构计算推向一个全新的高度，而要想充分发挥硬件优势，
开发环境必须跟随到位。今天的APU13开发者峰会上，AMD就宣布了全新的一体化SDK开
发包，以及改进的CodeXL工具。
AMD APP SDK v2.9：
有史以来最为用户友好的异构计算SDK，增加了多项简单易用、高效开发的新特性，比
如基于Web的简单浏览器，可轻松查找工程示例；增加支持CMake，一个流行的跨平台安
装(编译)工具；新增Visual Studio插件，改进OpenCL源编辑；一些新的示例，展示如
何以最小代价优化OpenCV、Bolt等开源库从而获得加速性能。
操作系统支持Windows 7/8/8.1、Linux 32/64位，后者包括openSUSE 11.x, Ubuntu 10
.x, Red Hat Enterprise Linux 6.x，驱动需要催化剂13.11 Beta。
官方下载：
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
Media SDK v1.0：
这是该开发包第一次公开发布，用于AMD产品多媒体特性的开发，比如GPU加速的视频预
处理、后期处理库，低延迟视频编码库。
操作系统支持Windows 7/8/8.1 32/64位，驱动需要催化剂13.9。
官方下载：
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
SDK还在多个开源库内增加了多项异构加速优化，包括OpenCV增加了大量OpenCL加速功
能，clMath拥有了BLAS、FFT库，并支持Fortran、C、C++，数据并行算法GPU加速的C++
模板库Bolt跨平台了，并有很多性能改进和新特性。
CodeXL v1.3：
现在支持Java了！还集成了静态内核分析功能，支持远程调试、配置，并支持GCN架构
GPU、APU。
操作系统支持Windows 7/8/8.1 32/64位、Ubuntu 12.04+ 64位、Red Hat Enterprise
Linux 6.x 64位，开发环境需要Visual Studio 2010/2012，驱动需要催化剂13.9。
官方下载：
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
AMD表示，将最终会让开发者非常方便地访问其产品的所有可编程模块，而且要跨平台
、跨系统、跨厂商、跨语言，这些努力只是第一步，而且还会继续贡献给开源社区。

S******n
发帖数: 5022

AMD SDK 终于有了，不是那把小枪了，呵呵~~~

【在 E***e 的大作中提到】

: 这种也就是玩玩
: 真要上战场拿着这么一把枪我还是要抖的

相关主题
● AMD的APU上跑ArrayFire的exception	● NV记 Titan Z 显卡真疯狂啊
● 想买台台式机跑科学计算。请大虾推荐。	● 750 ti是不是性价比最高的CUDA卡？
● 二手GTX580拿到以后有没有办法测试一下？	● AMD vega 什么时候出？
进入Hardware版参与讨论

E***e
发帖数: 3430

可是cuda math在amd上到底对应哪个？
clmath文档看了半天也没几个函数啊？

【在 S******n 的大作中提到】

: AMD SDK 终于有了，不是那把小枪了，呵呵~~~

a*s
发帖数: 425

http://www.eecs.berkeley.edu/~sangjin/2013/02/12/CPU-GPU-compar
看看这篇文章吧，还有里面的一篇paper
gpu没有你想的那么神
就算cuda 上千核，执行效率应该还是cpu高
而且，只是特定的应用，
code都优化的话，cpu和gpu比，没有差的那么离谱

【在 b*********n 的大作中提到】

: cpu拼不过gpu.
: 计算肯定是gpu了，上千个cuda核。现在需要一块性价比好的cpu，4核最好，处理日常
: 工作。

E***e
发帖数: 3430

CPU和GPU都是各有优劣
偏向哪一方的论调都有失偏颇
http://www.walkingrandomly.com/?p=3736

【在 a*s 的大作中提到】

: http://www.eecs.berkeley.edu/~sangjin/2013/02/12/CPU-GPU-compar
: 看看这篇文章吧，还有里面的一篇paper
: gpu没有你想的那么神
: 就算cuda 上千核，执行效率应该还是cpu高
: 而且，只是特定的应用，
: code都优化的话，cpu和gpu比，没有差的那么离谱

a*s
发帖数: 425

呵呵，我没有说cpu好，
我只是提一个醒，
gpu有点hyper
个人感觉

【在 E***e 的大作中提到】

: CPU和GPU都是各有优劣
: 偏向哪一方的论调都有失偏颇
: http://www.walkingrandomly.com/?p=3736

E***e
发帖数: 3430

hyper不hyper，全看应用
有些应用就是独立线程的简单计算暴力重复
拼时间不拼技术
GPU用上就很合适

【在 a*s 的大作中提到】

: 呵呵，我没有说cpu好，
: 我只是提一个醒，
: gpu有点hyper
: 个人感觉

(共1页)

进入Hardware版参与讨论

相关主题
● 二手GTX580拿到以后有没有办法测试一下？	● 求问一下GTX 580的双精度GFLOPS有多少？
● NV记 Titan Z 显卡真疯狂啊	● Tesla C2050 还是3个GTX 480？
● 750 ti是不是性价比最高的CUDA卡？	● 4k 有游戏是不是没有什么意义？
● AMD vega 什么时候出？	● 有没有办法破解GTX 580的双精度
● 大家说说 cuda 和 opencl 吧	● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
● 自己配机器之我见	● 双精度计算的话280X和7970是不是差不多？
● 求教科学计算的软硬配置	● 矿机问题
● 请问有没有Nvidia GPU在CUDA上计算的benchmark	● 大家帮看看这台做GPU并行计算的机器

相关话题的讨论汇总
话题: amd话题: cpu话题: crack话题: intel话题: gtx

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天