p****q 发帖数: 149 | 1 有没有什么面试书籍推荐?面试经验分享?
是否也需要做leetcode之类的题目?写bug free的code?
我打算闭关准备2两个月 然后开始投简历
如果有好心人可以内推 请联系我 我背景还成
多谢多谢 |
D*********Y 发帖数: 3382 | 2 请问data analyst 和data scientist什么区别
【在 p****q 的大作中提到】 : 有没有什么面试书籍推荐?面试经验分享? : 是否也需要做leetcode之类的题目?写bug free的code? : 我打算闭关准备2两个月 然后开始投简历 : 如果有好心人可以内推 请联系我 我背景还成 : 多谢多谢
|
p****q 发帖数: 149 | 3 个人理解
data analyst是一个挺大的名称 各种data分析相关的工作都可以叫data analyst 甚至
data scientist也可称为data analyst 一般来讲 做的工作比较墨守成规 读个统计
master便可胜任
data scientist是个新兴的名称 有个scientist压着 听起来比analyst高级的多 做的
事情也复杂些 而且需要一个人有创新能力设计能力 从建立模型开始 到产品能最终被
大家所应用结束 一般需要phd的学历
【在 D*********Y 的大作中提到】 : 请问data analyst 和data scientist什么区别
|
w****g 发帖数: 22 | 4 elements of statistiacl learning & leetcode
【在 p****q 的大作中提到】 : 有没有什么面试书籍推荐?面试经验分享? : 是否也需要做leetcode之类的题目?写bug free的code? : 我打算闭关准备2两个月 然后开始投简历 : 如果有好心人可以内推 请联系我 我背景还成 : 多谢多谢
|
c***z 发帖数: 6348 | |
d******k 发帖数: 141 | 6 我也对data scientist感兴趣,共勉! |
c***z 发帖数: 6348 | |
y***t 发帖数: 644 | 8 现在coursera上有个课程,入门级, 很不错. |
l******t 发帖数: 96 | 9 除了Google只需要R之外,其他公司多少会问coding问题,所以熟悉leetcode题目不是
坏事。
machine learning,data mining这些都要熟悉,偏统计的书有ESL,偏CS的可以看
Andrew Ng的notes
【在 p****q 的大作中提到】 : 有没有什么面试书籍推荐?面试经验分享? : 是否也需要做leetcode之类的题目?写bug free的code? : 我打算闭关准备2两个月 然后开始投简历 : 如果有好心人可以内推 请联系我 我背景还成 : 多谢多谢
|
l******t 发帖数: 96 | 10 我觉得上面题目还算正常范围
问的问题多半和背景相关。统计背景的多一些统计的问题,CS的话多一些machine
learning
【在 c***z 的大作中提到】 : 看看这个,注意这也应该是两种类型的DS : http://www.glassdoor.com/GD/Interview/LinkedIn-Interview-Questi
|
|
|
f********a 发帖数: 165 | 11 叫什么?
【在 y***t 的大作中提到】 : 现在coursera上有个课程,入门级, 很不错.
|
P******r 发帖数: 85 | 12 Introduction to Data Science
【在 f********a 的大作中提到】 : 叫什么?
|
t***j 发帖数: 2620 | 13 哦
[发表自未名空间手机版 - m.mitbbs.com]
【在 P******r 的大作中提到】 : Introduction to Data Science
|
D*********Y 发帖数: 3382 | 14 请问data mining是什么意思?是不是就是处理数据找到相关关系?
【在 l******t 的大作中提到】 : 除了Google只需要R之外,其他公司多少会问coding问题,所以熟悉leetcode题目不是 : 坏事。 : machine learning,data mining这些都要熟悉,偏统计的书有ESL,偏CS的可以看 : Andrew Ng的notes
|
p*******h 发帖数: 147 | 15 Key to Data Analytic related jobs is more about presentation of evidence
based insights to complex business problems and structured recommendation
with scientific projections, in English... In this sense, read decision
making related books will help. For interview, you are competing with (1)
low level Americans but they speak native language in business; or (2)
similar level Chinese/Indian STEM graduates; and your interviewer is usually
Americans, how do they select candidates? |
t****a 发帖数: 1212 | 16 正在两种之间摇摆。不太想去写java和做operation,有点觉得繁琐;又不希望因为不
写production code从而沦落为二等公民。
请求高人指点!
【在 c***z 的大作中提到】 : 个人感觉,有两种DS,一种接近SDE,一种接近Stat, : 第一种例如 https://twitter.com/jobs/positions?jvi=opBqXfw7,Job : 第二种例如 https://twitter.com/jobs/positions?jvi=oSAqXfwz,Job : 正在努力成为第二种。根据观察,基本上需要的是机器学习和大数据的经验。如有谬误 : ,敬请指出。 : 和各位共勉!
|
p****q 发帖数: 149 | 17 我也是更接近第二种
【在 c***z 的大作中提到】 : 个人感觉,有两种DS,一种接近SDE,一种接近Stat, : 第一种例如 https://twitter.com/jobs/positions?jvi=opBqXfw7,Job : 第二种例如 https://twitter.com/jobs/positions?jvi=oSAqXfwz,Job : 正在努力成为第二种。根据观察,基本上需要的是机器学习和大数据的经验。如有谬误 : ,敬请指出。 : 和各位共勉!
|
p****q 发帖数: 149 | 18 多谢 这些面试题看来多数是根据面试者的背景来的
【在 c***z 的大作中提到】 : 看看这个,注意这也应该是两种类型的DS : http://www.glassdoor.com/GD/Interview/LinkedIn-Interview-Questi
|
p****q 发帖数: 149 | 19 谢了
【在 l******t 的大作中提到】 : 除了Google只需要R之外,其他公司多少会问coding问题,所以熟悉leetcode题目不是 : 坏事。 : machine learning,data mining这些都要熟悉,偏统计的书有ESL,偏CS的可以看 : Andrew Ng的notes
|
l******t 发帖数: 96 | 20 二等公民有二等公民的好处:压力小,skill set更新换代慢...
【在 t****a 的大作中提到】 : 正在两种之间摇摆。不太想去写java和做operation,有点觉得繁琐;又不希望因为不 : 写production code从而沦落为二等公民。 : 请求高人指点!
|
|
|
s*******t 发帖数: 224 | 21 I'm a to-be
多交流
【在 p****q 的大作中提到】 : 有没有什么面试书籍推荐?面试经验分享? : 是否也需要做leetcode之类的题目?写bug free的code? : 我打算闭关准备2两个月 然后开始投简历 : 如果有好心人可以内推 请联系我 我背景还成 : 多谢多谢
|
x*****0 发帖数: 452 | 22 我也想朝这个方向发展。大家要不要建个群,一起交流交流啊。 |
s*****3 发帖数: 1673 | |
s***5 发帖数: 2136 | 24 最重要的是modeling mindset,coding只是实现idea的工具,不懂data mining和
machine learning,只能叫analyst,也就是打杂。
【在 p****q 的大作中提到】 : 个人理解 : data analyst是一个挺大的名称 各种data分析相关的工作都可以叫data analyst 甚至 : data scientist也可称为data analyst 一般来讲 做的工作比较墨守成规 读个统计 : master便可胜任 : data scientist是个新兴的名称 有个scientist压着 听起来比analyst高级的多 做的 : 事情也复杂些 而且需要一个人有创新能力设计能力 从建立模型开始 到产品能最终被 : 大家所应用结束 一般需要phd的学历
|
s*********s 发帖数: 318 | 25 是这部吗?
http://www.stanford.edu/~hastie/local.ftp/Springer/OLD//ESLII_p
【在 w****g 的大作中提到】 : elements of statistiacl learning & leetcode
|
h********3 发帖数: 2075 | 26 对于第二个来说,如果你没有几篇kdd,icdm,cikm,icml,nips这些paper,还是算了吧。
光看看书,准备一下面试,意义不大。
【在 p****q 的大作中提到】 : 个人理解 : data analyst是一个挺大的名称 各种data分析相关的工作都可以叫data analyst 甚至 : data scientist也可称为data analyst 一般来讲 做的工作比较墨守成规 读个统计 : master便可胜任 : data scientist是个新兴的名称 有个scientist压着 听起来比analyst高级的多 做的 : 事情也复杂些 而且需要一个人有创新能力设计能力 从建立模型开始 到产品能最终被 : 大家所应用结束 一般需要phd的学历
|
s***5 发帖数: 2136 | |
s***5 发帖数: 2136 | 28 第二种可以靠自学成功的吗?别瞎想了
【在 c***z 的大作中提到】 : 个人感觉,有两种DS,一种接近SDE,一种接近Stat, : 第一种例如 https://twitter.com/jobs/positions?jvi=opBqXfw7,Job : 第二种例如 https://twitter.com/jobs/positions?jvi=oSAqXfwz,Job : 正在努力成为第二种。根据观察,基本上需要的是机器学习和大数据的经验。如有谬误 : ,敬请指出。 : 和各位共勉!
|
h********3 发帖数: 2075 | 29 data scientist是可以自学成功,只不过需要几年时间再加2,3个internship而已。当
然,如果发不了data mining/machine learning的top conference paper的话,即便自
学成功了,别人也不认可。
【在 s***5 的大作中提到】 : 第二种可以靠自学成功的吗?别瞎想了
|
s***5 发帖数: 2136 | 30 没有系统训练检验,做出来的model能可靠吗,能interpret吗。没可能速成的
【在 h********3 的大作中提到】 : data scientist是可以自学成功,只不过需要几年时间再加2,3个internship而已。当 : 然,如果发不了data mining/machine learning的top conference paper的话,即便自 : 学成功了,别人也不认可。
|
|
|
c***z 发帖数: 6348 | 31 我就是这样转的,但是不是一步到位。
先是学了点统计的课,然后找了个传统的统计工作,然后转使用machine learning的工
作,现在转使用big data的工作。
【在 s*****3 的大作中提到】 : 学数学的,会点R,SAS可以朝这方面转么?
|
c***z 发帖数: 6348 | 32 都得自学吧,现在哪里有data science学位拿?
【在 s***5 的大作中提到】 : 第二种可以靠自学成功的吗?别瞎想了
|
l******t 发帖数: 96 | 33 我觉得还好吧
对于new grad来说,有没有文章只是面试的敲门砖,拿到面试之后就要看个人水平了
【在 h********3 的大作中提到】 : 对于第二个来说,如果你没有几篇kdd,icdm,cikm,icml,nips这些paper,还是算了吧。 : 光看看书,准备一下面试,意义不大。
|
l******t 发帖数: 96 | 34 这些我觉得不是什么大事
只要能够理解model的assumption,优势和局限性在哪里,如果assumption不符合会怎
样,就可以了
当然,这些自学起来是没有系统上课容易
【在 s***5 的大作中提到】 : 没有系统训练检验,做出来的model能可靠吗,能interpret吗。没可能速成的
|
l******t 发帖数: 96 | 35 这本书数学基础要求略高吧,如果了解线性代数和SVD的话读起来应该不会太吃力
【在 s***5 的大作中提到】 : 这本书难度太大,还是先看看老韩的书吧
|
l******t 发帖数: 96 | |
c***z 发帖数: 6348 | 37 嗯,还有线上的,西北大学
有知道的说说好不好? |
n*********u 发帖数: 33 | |
n*********u 发帖数: 33 | 39 我觉得现在这个职位越来越多,也不是每个职位都要求那么高吧.不是非要去FLGA这些公
司才行. |
h********3 发帖数: 2075 | 40 data science就是data mining/machine learning,database和data management的结
合。
【在 c***z 的大作中提到】 : 都得自学吧,现在哪里有data science学位拿?
|
|
|
t****a 发帖数: 1212 | 41 真的吗?coding只是实现idea的工具?
我怎么感觉谁控制产品控制production code才比较有发言权呢。不控制产品的话,不
管有什么mindset,也只好去打杂。
而且,ML的机会不是天天有的做啊。一个项目里和ML相关的只有很少一部分。
也许你那工作内容比较丰富,做ML的人比较有用武之地吧。
【在 s***5 的大作中提到】 : 最重要的是modeling mindset,coding只是实现idea的工具,不懂data mining和 : machine learning,只能叫analyst,也就是打杂。
|
j*****n 发帖数: 1545 | 42 好吧,其实 data scientist 不是只简单 run 一把 R 就可以了,当然各个公司不一
样。 我的工作就很杂很杂,需要什么就干什么,大部分都是码工的工作 |
j*****n 发帖数: 1545 | 43 我们组 其他 data scientist 又和我不一样,他们就很偏数学,不是简单一点统计知
识. 都需要很深的machine learning,没几年 ph.d 的系统 ML 训练,不是看看书就
能知道的。 很多人来面试 号称 自己懂 matrix factorization, 但也仅仅是书本 和
wiki 上的那一点知识,一问实际的问题,系统实现,具体的coding 都不知道。 也不
会招进来的。
各个公司不一样,data scientist 是1个很新的 title, 每个 data scientist 的
职责,技能要求都不一样。 |
p****q 发帖数: 149 | 44 这么说 不是搞ML的phd就不要考虑了?
【在 j*****n 的大作中提到】 : 我们组 其他 data scientist 又和我不一样,他们就很偏数学,不是简单一点统计知 : 识. 都需要很深的machine learning,没几年 ph.d 的系统 ML 训练,不是看看书就 : 能知道的。 很多人来面试 号称 自己懂 matrix factorization, 但也仅仅是书本 和 : wiki 上的那一点知识,一问实际的问题,系统实现,具体的coding 都不知道。 也不 : 会招进来的。 : 各个公司不一样,data scientist 是1个很新的 title, 每个 data scientist 的 : 职责,技能要求都不一样。
|
p****q 发帖数: 149 | 45 There will be a shortage of talent necessary for organizations to take
advantage of big data. By 2018, the United States alone could face a
shortage of 140,000 to 190,000 people with deep analytical skills as well as
1.5 million managers and analysts with the know-how to use the analysis of
big data to make effective decisions.
---- McKinsey Global Institute
要求这么高的话 这么多的缺口谁来填啊? |
d********h 发帖数: 2048 | 46 你还真相信这种报道啊。不是还有报道生物是最好的职业之一吗。
as
of
【在 p****q 的大作中提到】 : There will be a shortage of talent necessary for organizations to take : advantage of big data. By 2018, the United States alone could face a : shortage of 140,000 to 190,000 people with deep analytical skills as well as : 1.5 million managers and analysts with the know-how to use the analysis of : big data to make effective decisions. : ---- McKinsey Global Institute : 要求这么高的话 这么多的缺口谁来填啊?
|
r*****d 发帖数: 346 | 47 我相信。
【在 d********h 的大作中提到】 : 你还真相信这种报道啊。不是还有报道生物是最好的职业之一吗。 : : as : of
|
r*****d 发帖数: 346 | 48 I am a to-be. 个人愚见是:如果不是在学术圈或者工业界的学术圈,论文是不需要的
。 |
l*******m 发帖数: 1096 | 49 data scientists主要有如下几点责任:
1. data processing: clean, query, simple stats analysis
2. significant feature analysis
3. data visulization
4. predictive modeling
工作性质上,有三类:
research: 一般要求科班CS ML方向出身,根正苗红最好, 一般是bayesians
design production algorithms: 要求coding水平和SWE差不多,这类最多。
偏统计,主要是搞统计人玩的, 大都是frequentists |
h********3 发帖数: 2075 | 50 搞ml的phd只是必要条件,不是充分条件。不是每个ml的phd都有实际的机会接触大数据
,而且也能在kdd,icml,nips这些conf上发挥一作paper.现在每个学校搞ml的phd都一大
把,别人招人当然要精益求精了。
【在 p****q 的大作中提到】 : 这么说 不是搞ML的phd就不要考虑了?
|
|
|
h********3 发帖数: 2075 | 51 之前大师说过,在工业界的应用应该是,99%的时间花在第1,2,3步,第4步只
花1%。如果最后一步用直接现有成熟的模型都不work的话,多半是你之前数据没清理好
,或者是你的模型架设就不成立。
【在 l*******m 的大作中提到】 : data scientists主要有如下几点责任: : 1. data processing: clean, query, simple stats analysis : 2. significant feature analysis : 3. data visulization : 4. predictive modeling : 工作性质上,有三类: : research: 一般要求科班CS ML方向出身,根正苗红最好, 一般是bayesians : design production algorithms: 要求coding水平和SWE差不多,这类最多。 : 偏统计,主要是搞统计人玩的, 大都是frequentists
|
p****q 发帖数: 149 | 52 我相信数据 相信有理有据的报道 生物是最好的职业之一那个我从未相信过
【在 d********h 的大作中提到】 : 你还真相信这种报道啊。不是还有报道生物是最好的职业之一吗。 : : as : of
|
v*****k 发帖数: 7798 | 53 没错。所以这个工作很多时候会很无聊。
【在 h********3 的大作中提到】 : 之前大师说过,在工业界的应用应该是,99%的时间花在第1,2,3步,第4步只 : 花1%。如果最后一步用直接现有成熟的模型都不work的话,多半是你之前数据没清理好 : ,或者是你的模型架设就不成立。
|
h***t 发帖数: 2540 | 54 kdd 不是ML的top conference,偏DM,如果算ML track的文章,只能算一流和二流之间
,而且这个会不匿名,就是HJW等几个人的后花园,说实话,大部分KDD paper just so
so
【在 h********3 的大作中提到】 : 搞ml的phd只是必要条件,不是充分条件。不是每个ml的phd都有实际的机会接触大数据 : ,而且也能在kdd,icml,nips这些conf上发挥一作paper.现在每个学校搞ml的phd都一大 : 把,别人招人当然要精益求精了。
|
h********3 发帖数: 2075 | 55 嗯,不过也不能这样偏激地贬低一个领域。kdd至少现在还是application driven的,
还算是追求有点用的研究。要是以传统cs的观点去看ML的几个top conference,那的评
价估计比so so还难听。
so
【在 h***t 的大作中提到】 : kdd 不是ML的top conference,偏DM,如果算ML track的文章,只能算一流和二流之间 : ,而且这个会不匿名,就是HJW等几个人的后花园,说实话,大部分KDD paper just so : so
|
s*****r 发帖数: 43070 | 56 data analyst MBA 比较多,负责商业报表,给客户分析报告中inconsistent的部分。
data scientist基本都是PHD的菜,而且好处是老中在这个领域dominate,是主流。需
要良好的教育,工作内容有点闷,不需要太多交流,可能适合老中干。
【在 p****q 的大作中提到】 : 个人理解 : data analyst是一个挺大的名称 各种data分析相关的工作都可以叫data analyst 甚至 : data scientist也可称为data analyst 一般来讲 做的工作比较墨守成规 读个统计 : master便可胜任 : data scientist是个新兴的名称 有个scientist压着 听起来比analyst高级的多 做的 : 事情也复杂些 而且需要一个人有创新能力设计能力 从建立模型开始 到产品能最终被 : 大家所应用结束 一般需要phd的学历
|
s*****r 发帖数: 43070 | 57 前三都是不是,1是BI team的,从大数据里面列出报告,big data的主流技术。2更像
是data analyst干的,提供商业化数据给其他部门和客户。3就是MVC,码农的活。
scientist主要是做modeling。
【在 l*******m 的大作中提到】 : data scientists主要有如下几点责任: : 1. data processing: clean, query, simple stats analysis : 2. significant feature analysis : 3. data visulization : 4. predictive modeling : 工作性质上,有三类: : research: 一般要求科班CS ML方向出身,根正苗红最好, 一般是bayesians : design production algorithms: 要求coding水平和SWE差不多,这类最多。 : 偏统计,主要是搞统计人玩的, 大都是frequentists
|