A***C 发帖数: 143 | 1 摘要:语言之争是无谓之争,最重要的是设计+lib。
(相应某些网友的呼唤,当帖子长度太长的时候写个摘要)
作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身,
我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库,
汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统
是上PhD的时候跟一些水平极烂的教授补上的。
先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿
真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队
做中型系统(100k行左右)的开发,后来做这个团队的lead。
做PhD的时候开始用Matlab,java,python,perl,R,javascript
和php。每接触一个语言,我都维护自己的一套lib,像数据读取,
visualization,socket,数值计算等,所有lib的格式和名称向
Matlab靠拢对齐,后来连继续使用C/C++的时候也如此。
后来你会发现,其实每套语言真的很像,至少在我自己的project里如此。
我的project模块基本上都能分得很清楚:UI/Data Interface,核
心数据处理(有内存和计算速度要求),外围逻辑。由于我维护了自己一
套Data Interface和核心数据计算的lib,连名称都几乎一样,我的每个
project的不同语言版本几乎没什么区别。
回到语言之争,对我来说是无谓之争。或者争论的核心问题会有所不同。
1 各种语言孰优孰劣?
就像把那些明星一次排开,问谁比较漂亮?每个明星都有自己的粉丝,有人
fan多个明星,每个明星的粉丝数量不一,萝卜白菜而已,对我来说不是
核心问题。
2 哪个语言快?
我会用另外一种方式问:对于同一个问题,把优化做到极致,哪个语言最快?
这是一个核心问题。由于我自己的project的特点,就是有内存和计算速度
要求的核心数据处理模块个数有限,而且前人有大量的实现,例如奇异值分解
或者矩阵乘法运算。我觉得目前大家关于这个issue的讨论没到骨子上。真
正有意义的讨论是找出若干个好的简单的模块,征集各方粉丝优化,定期做
运算速度比赛。这种比赛结果比宗教式的讨论有意义多了。
就奇异值分解,我做过大量实验。语言主要分两派:python和Matlab。
python安装Nympy,Scipy。结果发现如果针对CPU做编译优化,
Python with Numpy, Scipy比Matlab快,快大概3倍左右。而没有做过优化
和Matlab差不多。
而矩阵乘法Matlab全面胜出,胜出的比例似乎矩阵的形状和大小。
据我了解,Nympy关于这些数值计算部分所调用的库其实是用Fortran写的。
所以如果要做到极致,让我重新实现那些别人写过的核心模块,我会选择
Fortran,或者汇编,如果有必要。上层逻辑随便,差别不大的。
3 哪个语言的代码编写和管理成本低?
对我来说,各个语言都差不多,因为这些问题的答案取决于每个人的思维习惯和
project的设计本身。一个好的语言配上一个不好的设计,可能比一个不好的语言
配上一个恰当的设计来得还要差。
4 哪个语言的lib最好?
对于我来说,lib是最重要的核心问题。说实话,如果你对某个语言很喜欢但有羡慕
另外一个语言的某些feature,干脆改写一下你喜欢的那个语言的编译器就可以了。
剩下的问题就是lib。说实话,如果没有stl,我是不会使用c++的。我的所有project
都可以用C来写。甚至有些时候为了避免C++,自己实现stl里的某些功能。
哪个语言的Lib最好?只能说各有千秋,所以我坚持用自己的方式维护各个语言的lib。
说到这里,可能很多科班出身的CSer会对我嗤之以鼻:没有面向对象,做个屁?我
的经验是一个好的非面向对象比一个好的面向对象设计更容易一点编写,管理成本
一样。
CSer是面向对象为宗教,神圣不可侵犯。有个叫Yin Wang的怪人可能大家都有些印象,
他有提起这个CSer的面向对象情结,在他早期的言论中也颇为鄙视,不过后来好像
改口了。
5 你总有一个最喜欢的语言吧?
这问题的答案对我来说是会变的,一开始是C,后来是matlab,现在是python。
C像初恋情人,爱得莫名其妙,挥之不去。能想象,如果入门语言是java,我一定
也视java为我最初的最爱。Matlab是因为她的简洁和丰富的lib。python,
热恋中,优雅?简洁?开源?lib?其实没什么特别理由,喜欢就喜欢。 |
d****i 发帖数: 4809 | 2 支持,其实语言没有什么好争的,每种语言都有他的适用擅长的地方,像C/C++在操作
系统,底层硬件固件,算法,网络,数据库的地位,Java, JavaScript在Web,企业应
用软件的地位(或者微软的.Net,C#,VB等),其他语言也有各自的应用domain,SAS,R
在统计,Matlab在科学工程的数值计算等等。什么时候用什么语言,取决于什么应用。
【在 A***C 的大作中提到】 : 摘要:语言之争是无谓之争,最重要的是设计+lib。 : (相应某些网友的呼唤,当帖子长度太长的时候写个摘要) : 作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身, : 我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库, : 汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统 : 是上PhD的时候跟一些水平极烂的教授补上的。 : 先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿 : 真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队 : 做中型系统(100k行左右)的开发,后来做这个团队的lead。 : 做PhD的时候开始用Matlab,java,python,perl,R,javascript
|
t****a 发帖数: 1212 | 3 好帖子,非常详实。
赞同一些观点,也不赞同一些观点。
- 如果不同语言都写的差不多的话,那恐怕是有些问题吧——你是不是在用C的思
路在写所有的语言啊?那可能就丢掉了那门语言的特点了。事实上,如果某个人声称他
擅长某一门语言,那么面试的时候我就会去问那门语言所特有的有趣的属性。
- lib决定语言?好兵救不了烂将,烂泥扶不上墙。就说40年前的COBOL吧。今天还有多
少人用?
【在 A***C 的大作中提到】 : 摘要:语言之争是无谓之争,最重要的是设计+lib。 : (相应某些网友的呼唤,当帖子长度太长的时候写个摘要) : 作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身, : 我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库, : 汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统 : 是上PhD的时候跟一些水平极烂的教授补上的。 : 先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿 : 真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队 : 做中型系统(100k行左右)的开发,后来做这个团队的lead。 : 做PhD的时候开始用Matlab,java,python,perl,R,javascript
|
c*********e 发帖数: 16335 | 4 phd 论文是啥方面的?
【在 A***C 的大作中提到】 : 摘要:语言之争是无谓之争,最重要的是设计+lib。 : (相应某些网友的呼唤,当帖子长度太长的时候写个摘要) : 作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身, : 我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库, : 汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统 : 是上PhD的时候跟一些水平极烂的教授补上的。 : 先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿 : 真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队 : 做中型系统(100k行左右)的开发,后来做这个团队的lead。 : 做PhD的时候开始用Matlab,java,python,perl,R,javascript
|
T******7 发帖数: 1419 | |
N*n 发帖数: 456 | 6
【在 A***C 的大作中提到】 : 摘要:语言之争是无谓之争,最重要的是设计+lib。 : (相应某些网友的呼唤,当帖子长度太长的时候写个摘要) : 作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身, : 我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库, : 汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统 : 是上PhD的时候跟一些水平极烂的教授补上的。 : 先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿 : 真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队 : 做中型系统(100k行左右)的开发,后来做这个团队的lead。 : 做PhD的时候开始用Matlab,java,python,perl,R,javascript
|
h**********c 发帖数: 4120 | 7 这种讨论真的没有太大意义,因为楼主的确需要补课,
程序快慢最基本的决定因素是cpu architecture.
做几个练习就知道了,从软件层面分析快和慢不是不可能或者很高难,而是太麻烦。
说到最后,deliver your product in time. |
c*********e 发帖数: 16335 | 8 lz说了,不是科班出身。
【在 h**********c 的大作中提到】 : 这种讨论真的没有太大意义,因为楼主的确需要补课, : 程序快慢最基本的决定因素是cpu architecture. : 做几个练习就知道了,从软件层面分析快和慢不是不可能或者很高难,而是太麻烦。 : 说到最后,deliver your product in time.
|
d***a 发帖数: 13752 | 9 程序快慢最基本的决定因素,是算法。
【在 h**********c 的大作中提到】 : 这种讨论真的没有太大意义,因为楼主的确需要补课, : 程序快慢最基本的决定因素是cpu architecture. : 做几个练习就知道了,从软件层面分析快和慢不是不可能或者很高难,而是太麻烦。 : 说到最后,deliver your product in time.
|
g****u 发帖数: 252 | 10 matlab是一种语言, 这有什么问题吗?
【在 T******7 的大作中提到】 : 把matlab 称为语言的。。我就无力吐槽了
|
A***C 发帖数: 143 | 11 我第一次到我PhD老板的办公室时,我老板寒暄后的第一句话是:
Tell me something that I don't know.
Wow,好大的口气!于是我就讲了一些我硕士做过的题目,然后抽
出当时我证的一个定理(其实就是照抄别人的,但因为用在自己
的工作中,重新写成另外一种形式,重新证明一下而已),因为
老板对这个方向不熟悉,还觉得这个定理nontrivial,我以为是
踢馆成功了。
后来才发现,我的数学远不如老板,当年在班门弄斧。后来得出一个
结论:一个没有见识的人是不会意识到自己没有见识的。
当你说“说到最后,deliver your product in time”,隐隐约约
觉得你的见识有限(当然,也有可能是我的见识远不如你,如我上述)
如果你是老板,或者投资人,当然是make more money啦,怎么可能
是deliver product in time呢?
在我认知范围里,至少存在两种project,一种是用户对性能不敏感的
如facebook,yahoo,google,Microsoft,以及绝大多数IT公司。
另外一种是用户对性能非常敏感的,如GPU制造商,对冲基金公司等。
前者,为了make more money,deliver product in time也许
足够了,但后者,你要deliver足够好的product。
我拿到过一个对冲基金公司的offer,面试的时候他们就透露
他们现在用的是CUDA on GPU来加速算法。就我所知,还有用FGPA的,
如果他们足够有钱,我猜他们还愿意花钱请人自己开发专用CPU。
有些project对性能有极致要求,deliver product in time不是
唯一目的。
另外,因为我们很难有钱去修改cpu或者主板,除非某些能简单
并行化,用FPGA之类的可编程硬件就能搞定的,其他都是基于不修改
cpu的情况下讨论的。
我以前做过一个简单的CPU,有加减法和条件跳转指令集,也写过简单编译器,
以一个门外汉的分析,我觉得程序的快慢取决于程序结构+编译器+硬件(包括
CPU,主板线路等)
一个懂得编译器和CPU结构的程序才是好程序,例如
http://stackoverflow.com/questions/11227809/why-is-processing-a
【在 h**********c 的大作中提到】 : 这种讨论真的没有太大意义,因为楼主的确需要补课, : 程序快慢最基本的决定因素是cpu architecture. : 做几个练习就知道了,从软件层面分析快和慢不是不可能或者很高难,而是太麻烦。 : 说到最后,deliver your product in time.
|