由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 浅谈生物信息的职业发展规划
相关主题
请推荐Bioinformatics入门读物请问Genome Biology的投稿有啥要注意的
求定位说说自己的研究:Gene module在生物医学癌症分类(clustering)的应用
请推荐接受短篇幅小文章的bioinformatics, computational biology的杂志继续求生物信息审稿机会
此人为何能在NIBS做资深研究员?新版impact factor发布
请教一下各位评价一下几个杂志水平还有投稿难易程度请教deep learning在biomarker鉴定中的应用?
老板对博厚的expectation生物PhD,做博后还是念CS master,求建议。
发文章的烦恼,请求大家指点求建议:文章共同一作的先后顺序,两博后相持不下
bioinfo Phd 申请(PI请进)关于美国的生统博后!
相关话题的讨论汇总
话题: microsoft话题: enabled话题: 生物话题: boolean话题: c++
进入Biology版参与讨论
1 (共1页)
c****r
发帖数: 576
1
这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
我觉得职业发展应该是广、深必备。
广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
广而不深的后果是没有确定的研究方向,总是给别人作工具;
深而不广的后果是在当今数据爆炸的时代发展机会少。
难点有以下几点,难度依次增加:
1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
场合更高效一些。
2. 学习各种生物知识:一方面是书本知识,其主要功夫是在业余时间的利用上;另一
方面是实践知识,来自于生物实验室,交流为主。
3. 同时还得学习相关数学知识:这绝对是个难点,会编程不等于懂数学。
4. 某一个方面深入。这里说的方向必须是生物研究的方向,而不是生物信息的方向。
我觉得以上几点都达到的话,从读博士起大概需要5-10年时间。
生物信息全才=生物+统计+建模+数据库+软件。
(建模指动力学上的,不是指统计建模)
d*****r
发帖数: 2583
2
you need be able first test your models in small scale,
access database, and mine on internet or manipulate text,
and finally if everything looks good, turn your small model
into industrial program.
so you need at least one in each of the 4 following section:
1. large scale programming, building industrial level models:
C++ or Java, etc
2. quick testing of small models:
Matlab or Mathematica, or R, etc
3. database accessing:
SQL etc
4. Text mining/manipulation language:
Perl or Python, etc

抛砖引玉~~

【在 c****r 的大作中提到】
: 这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
: 我觉得职业发展应该是广、深必备。
: 广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
: 深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
: 广而不深的后果是没有确定的研究方向,总是给别人作工具;
: 深而不广的后果是在当今数据爆炸的时代发展机会少。
: 难点有以下几点,难度依次增加:
: 1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
: 么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
: 场合更高效一些。

b*****e
发帖数: 288
3
浅谈几点我个人的经验。
1. 编程,文本处理
这个是入门的基础,我认为这个最倒是好办。
在有人带的情况下,如果自己对电脑比较感兴趣,那么linux+Perl有2~3个月就入门了。
之后再学其他语言要看课题需求、编程习惯和对学科的理解。比如JAVA,C++等。
这样做各种比对、文本处理应该没问题。
再熟悉了各大生物学主流数据库,那么就可以先摸爬滚打了。
只是进阶比较难。一方面靠积累,另一方面看悟性了。
2. 统计学、数学方面,
我还是主张先学统计,再结合这学语言。
我当年是先学了5年的统计,之后再学的R,这样之后做起来的时候完全是在解决统计学
语言的技术问题,而不需要再去想统计学本身的问题。
这样半年下来,R学了个皮毛,凑合发点文章够用了。
但还是那句话,进阶太难,太漫长。
3. 数据库,网页
这个相对来说还是性价比比较高的。学起来快,出东西也快,不太费脑子,运气等其他
不可预知因素小。
缺点就是做生物的不能只靠这个吃饭,这不是做生物信息的核心竞争力。(当然如果你
们实验室有能力能搞出并维持那些大型综合性数据库,算我没说)
这方面可以搞点东西凑合毕业,但也别做得过多。不然就成了码工,失去自己的核心竞
争力了。
4. Omics
包括基因组学、转录组学等等分支。
需要做各类芯片分析,序列分析,功能注释,按各种条件分类等等。
另外要时刻关注当今一些新技术,让课题的瓶颈在技术方面,而不是在你的分析和速度
方面。
5. 生物学着力点
对于做bioinformatics的,我认为最难最难的,就是从几个G的data里面,整理出来个各方面面都说得过去的、又容易验证的story来。
完全考验人的思维和科研背景,靠积累。
以上几点,在有人带的情况下,2~3年就能入门,再来1~2年凑合着做点东西运气不差
应该够毕业了。
头脑灵活又运气好的,可能4年之内就能弄出点东西出来。
进阶比较难,看个人了。
这个行业虽然杂,但也不是那么难入门,不需要耗那么长时间。
我个人建议先从某些简单的分析入手,之后再学别的。
少林72绝技,你只要会那么一两手大家都欢迎的主流技术,够你闯江湖的就够了。
关键是需要一个比较成型的实验室,或者有熟手带你。如果自己摸索就会很迷茫。
至于经验、视野、科研思维这类真正重要,却靠积累的事情,毕业之后慢慢来吧。
w******y
发帖数: 8040
4
clear cut and well said

择那
一些

【在 d*****r 的大作中提到】
: you need be able first test your models in small scale,
: access database, and mine on internet or manipulate text,
: and finally if everything looks good, turn your small model
: into industrial program.
: so you need at least one in each of the 4 following section:
: 1. large scale programming, building industrial level models:
: C++ or Java, etc
: 2. quick testing of small models:
: Matlab or Mathematica, or R, etc
: 3. database accessing:

p***a
发帖数: 6202
5
very good, thanks for sharing.

了。

【在 b*****e 的大作中提到】
: 浅谈几点我个人的经验。
: 1. 编程,文本处理
: 这个是入门的基础,我认为这个最倒是好办。
: 在有人带的情况下,如果自己对电脑比较感兴趣,那么linux+Perl有2~3个月就入门了。
: 之后再学其他语言要看课题需求、编程习惯和对学科的理解。比如JAVA,C++等。
: 这样做各种比对、文本处理应该没问题。
: 再熟悉了各大生物学主流数据库,那么就可以先摸爬滚打了。
: 只是进阶比较难。一方面靠积累,另一方面看悟性了。
: 2. 统计学、数学方面,
: 我还是主张先学统计,再结合这学语言。

d*****r
发帖数: 2583
6
Thanks, it was actually not by myself originally...
I first heard about this two years ago when the Head/Founder of
Statistical Arbitrage dept of Citadel gave a lecture at my school.
He said all these 4 parts are on the workflow of daily job for a
quantitative finance professional. I think it's the same for every
quantitative XXX professional, including biology.
To find a job is just that easy, just to polish your skillset...
it can be applied to any area, biology, engineering, finance, etc.
I hope I can remember more from his 2 hour lecture, all his words
were so insightful. But I was just too dumb then..

【在 w******y 的大作中提到】
: clear cut and well said
:
: 择那
: 一些

n******7
发帖数: 12463
7
说的很好。bioinfo的主要技能就是CPR
c/c++ 做一些计算量大的工作
r/matlab 做建模分析
perl/python 做文本处理,输入输出
SQL website的一些技能,更偏应用层面,跟research关系不大。除非你有很多原始
data,你要是老灌database的水,会被
人鄙视的。

【在 d*****r 的大作中提到】
: you need be able first test your models in small scale,
: access database, and mine on internet or manipulate text,
: and finally if everything looks good, turn your small model
: into industrial program.
: so you need at least one in each of the 4 following section:
: 1. large scale programming, building industrial level models:
: C++ or Java, etc
: 2. quick testing of small models:
: Matlab or Mathematica, or R, etc
: 3. database accessing:

K****n
发帖数: 5970
8
Your summary really makes sense.I wish I attended this lecture. Sometimes it
's just this kind of small, precise instruction that will save you a lot of
work later on.Hopefully we will have less debates on "what's the best
language to learn if I want to do data mining".

【在 d*****r 的大作中提到】
: Thanks, it was actually not by myself originally...
: I first heard about this two years ago when the Head/Founder of
: Statistical Arbitrage dept of Citadel gave a lecture at my school.
: He said all these 4 parts are on the workflow of daily job for a
: quantitative finance professional. I think it's the same for every
: quantitative XXX professional, including biology.
: To find a job is just that easy, just to polish your skillset...
: it can be applied to any area, biology, engineering, finance, etc.
: I hope I can remember more from his 2 hour lecture, all his words
: were so insightful. But I was just too dumb then..

K****n
发帖数: 5970
9
I know several business intelligence oriented data analysts who focus on SQL
rather than c++. And I was amazed when they showed me how much SQL can do
in machine learning...

【在 n******7 的大作中提到】
: 说的很好。bioinfo的主要技能就是CPR
: c/c++ 做一些计算量大的工作
: r/matlab 做建模分析
: perl/python 做文本处理,输入输出
: SQL website的一些技能,更偏应用层面,跟research关系不大。除非你有很多原始
: data,你要是老灌database的水,会被
: 人鄙视的。

v******s
发帖数: 51
10
看看这个牛人的career path,从本科毕业到拿到正教授只用了7年左右
http://life.hust.edu.cn:8089/teacher.php?id=2060

抛砖引玉~~

【在 c****r 的大作中提到】
: 这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
: 我觉得职业发展应该是广、深必备。
: 广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
: 深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
: 广而不深的后果是没有确定的研究方向,总是给别人作工具;
: 深而不广的后果是在当今数据爆炸的时代发展机会少。
: 难点有以下几点,难度依次增加:
: 1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
: 么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
: 场合更高效一些。

相关主题
老板对博厚的expectation请问Genome Biology的投稿有啥要注意的
发文章的烦恼,请求大家指点说说自己的研究:Gene module在生物医学癌症分类(clustering)的应用
bioinfo Phd 申请(PI请进)继续求生物信息审稿机会
进入Biology版参与讨论
l******n
发帖数: 520
11
如果生物基础很强的话,linux+perl+mysql基本可以保证一年至少6篇paper(4分左右
),可以在一个中小学校当faculty了
n******7
发帖数: 12463
12
我猜就是这哥们儿
人挺好,前段时间还请教了几个问题

【在 v******s 的大作中提到】
: 看看这个牛人的career path,从本科毕业到拿到正教授只用了7年左右
: http://life.hust.edu.cn:8089/teacher.php?id=2060
:
: 抛砖引玉~~

o*****m
发帖数: 981
13
学习了
e*****t
发帖数: 642
14
He KeeVan
Show me how they apply SQL in machine learning. I am studying SQL right now.
very interested in it.

SQL

【在 K****n 的大作中提到】
: I know several business intelligence oriented data analysts who focus on SQL
: rather than c++. And I was amazed when they showed me how much SQL can do
: in machine learning...

k*******6
发帖数: 103
15
受益匪浅~
l******m
发帖数: 43
16
说的很好,exactly what I feel.

了。

【在 b*****e 的大作中提到】
: 浅谈几点我个人的经验。
: 1. 编程,文本处理
: 这个是入门的基础,我认为这个最倒是好办。
: 在有人带的情况下,如果自己对电脑比较感兴趣,那么linux+Perl有2~3个月就入门了。
: 之后再学其他语言要看课题需求、编程习惯和对学科的理解。比如JAVA,C++等。
: 这样做各种比对、文本处理应该没问题。
: 再熟悉了各大生物学主流数据库,那么就可以先摸爬滚打了。
: 只是进阶比较难。一方面靠积累,另一方面看悟性了。
: 2. 统计学、数学方面,
: 我还是主张先学统计,再结合这学语言。

a*********g
发帖数: 8087
17
我觉得还是有点 过分抬高科学/idea/story,轻视技术/工具的意思
研究生物问题是最终目的,但是不能看低开发工具的重要性
觉得很多生物背景的都有这毛病
大家就这么看不起码工阿,呵呵
就说这个所谓最简单的一点吧,“各种类型编程语言的熟练使用”,就这一样,你搞好
了,找个十万年薪的工作不成问题
n******7
发帖数: 12463
18
这个真不敢
倒是很多计算背景的,觉得生物问题很简单,看几篇paper就明白了。
不是抬杠

【在 a*********g 的大作中提到】
: 我觉得还是有点 过分抬高科学/idea/story,轻视技术/工具的意思
: 研究生物问题是最终目的,但是不能看低开发工具的重要性
: 觉得很多生物背景的都有这毛病
: 大家就这么看不起码工阿,呵呵
: 就说这个所谓最简单的一点吧,“各种类型编程语言的熟练使用”,就这一样,你搞好
: 了,找个十万年薪的工作不成问题

G***y
发帖数: 1082
19
I think there are several fields under this umbrella term.
Bioinformatics and Computational Biology are very different things. I agree
algorithm development is very important, although it is probably not "
bioinformatics" in strict sense.

【在 a*********g 的大作中提到】
: 我觉得还是有点 过分抬高科学/idea/story,轻视技术/工具的意思
: 研究生物问题是最终目的,但是不能看低开发工具的重要性
: 觉得很多生物背景的都有这毛病
: 大家就这么看不起码工阿,呵呵
: 就说这个所谓最简单的一点吧,“各种类型编程语言的熟练使用”,就这一样,你搞好
: 了,找个十万年薪的工作不成问题

p*****m
发帖数: 84
20
Can you make clear what the difference between Bioinformatics and
Computational Biology is? Does computational biology mean modeling such as
ODE?

agree

【在 G***y 的大作中提到】
: I think there are several fields under this umbrella term.
: Bioinformatics and Computational Biology are very different things. I agree
: algorithm development is very important, although it is probably not "
: bioinformatics" in strict sense.

相关主题
新版impact factor发布求建议:文章共同一作的先后顺序,两博后相持不下
请教deep learning在biomarker鉴定中的应用?关于美国的生统博后!
生物PhD,做博后还是念CS master,求建议。求审稿机会(基因组学,生物信息学)
进入Biology版参与讨论
n******7
发帖数: 12463
21
I the same question...
What's the difference between them???

such as

【在 p*****m 的大作中提到】
: Can you make clear what the difference between Bioinformatics and
: Computational Biology is? Does computational biology mean modeling such as
: ODE?
:
: agree

n******7
发帖数: 12463
22
I the same question...
What's the difference between them???

such as

【在 p*****m 的大作中提到】
: Can you make clear what the difference between Bioinformatics and
: Computational Biology is? Does computational biology mean modeling such as
: ODE?
:
: agree

h******3
发帖数: 190
23
i see. thanks for sharing.

【在 d*****r 的大作中提到】
: Thanks, it was actually not by myself originally...
: I first heard about this two years ago when the Head/Founder of
: Statistical Arbitrage dept of Citadel gave a lecture at my school.
: He said all these 4 parts are on the workflow of daily job for a
: quantitative finance professional. I think it's the same for every
: quantitative XXX professional, including biology.
: To find a job is just that easy, just to polish your skillset...
: it can be applied to any area, biology, engineering, finance, etc.
: I hope I can remember more from his 2 hour lecture, all his words
: were so insightful. But I was just too dumb then..

K****n
发帖数: 5970
24
I am not the best person to answer you, but can probably get back to you
with
one or two book names. Allow me one day.

now.

【在 e*****t 的大作中提到】
: He KeeVan
: Show me how they apply SQL in machine learning. I am studying SQL right now.
: very interested in it.
:
: SQL

y*******o
发帖数: 236
25
LZ你没讲到你标题职业规划啊,你讲的是做好生物信息应该要的skill sets吧。谈到职
业发展,我只知道做研究发paper一条路,不管是在academic或是在药厂。现在离很实
用的商业化还是很远啊,像那种测个序然后就能做个诊断什么的还是不靠谱,就算测序
价格降下来了也不知道能多少应用啊,要是能做到跟进医院查个血常规那样靠谱就大发
了。
哦想起听过好像做个测序然后知道自己有哪些mutation然后能得出对什么食物敏感不能
吃。

抛砖引玉~~

【在 c****r 的大作中提到】
: 这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
: 我觉得职业发展应该是广、深必备。
: 广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
: 深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
: 广而不深的后果是没有确定的研究方向,总是给别人作工具;
: 深而不广的后果是在当今数据爆炸的时代发展机会少。
: 难点有以下几点,难度依次增加:
: 1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
: 么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
: 场合更高效一些。

e***g
发帖数: 1696
26
负责任的说,年薪十万的码工做不到“各种类型编程语言的熟练使用”,顶多一两种。

【在 a*********g 的大作中提到】
: 我觉得还是有点 过分抬高科学/idea/story,轻视技术/工具的意思
: 研究生物问题是最终目的,但是不能看低开发工具的重要性
: 觉得很多生物背景的都有这毛病
: 大家就这么看不起码工阿,呵呵
: 就说这个所谓最简单的一点吧,“各种类型编程语言的熟练使用”,就这一样,你搞好
: 了,找个十万年薪的工作不成问题

b*****e
发帖数: 288
27
这个也没瞧不起码工吧,我本人也做过几个月的纯码工,对码工这个职位颇有感触。
现在没人在否认开发工具的重要性,大家讨论的是进一步的发展问题。
论薪水和论发展,有几点还是比较受认同的:
1. 做技术的(包括码工)比不过做管理的。
2. 下层职位比不过上层职位。
尽管就论“编程语言的熟练使用”这一点来说,做管理的可能远不如做技术的。
我本人master学统计学,Ph.D改bioinformatics,再后来做computional bio。在这个
块前后摸爬滚打了10年左右,突然发现自己虽然在技术方面也算是略有积累了,但在文
章这方面做得再努力,也就是个NAR、bioinformatics、Genome bio这类期刊上下。
这个时候技术做得再多,也就是个量的问题,职业发展方面很难有质的突破。
对于一个30多岁以搞科研为本职的人来说,还有什么比思绪枯竭,没有生长点,发展潜
力达到瓶颈更为可怕呢?
现在转到一个纯生物学的实验室,文章方面虽然还不好说,但至少思维开阔了不少。
我承认有人能靠几项独门的、计算方面的技术吃饭,但大多数人做不到那样。
因为行业里的人越来越多,你会的大家都会。
而且高通量技术在不断发展,技术更新太快。
5年前,也就是04~05年那个时候。做bioinformatics的会分析几种microarray data那
就算是高手了,而现在如果还只是做这个,那找个technican都不一定够格。
现在发展的关键,我个人认为是怎么样把计算方面技术找生物学切入点,融合进去,最
终在这个点上占上一角。
当然我也不否认有一些大牛,完全靠计算也能做得很棒。
现在真正做bioinformatics做得好的人中,十个有九个是在考虑计算和生物学的共同点。
他们整天在思考如何把两个领域融合起来,而不是在争论它们的分歧。
在这行里也混了几年了,这点发展的大趋势还是能看出来的。

【在 a*********g 的大作中提到】
: 我觉得还是有点 过分抬高科学/idea/story,轻视技术/工具的意思
: 研究生物问题是最终目的,但是不能看低开发工具的重要性
: 觉得很多生物背景的都有这毛病
: 大家就这么看不起码工阿,呵呵
: 就说这个所谓最简单的一点吧,“各种类型编程语言的熟练使用”,就这一样,你搞好
: 了,找个十万年薪的工作不成问题

d*****r
发帖数: 2583
28
同意最后一点,最近UCSF的Christopher Voigt有几篇nature不错。
可惜神经元模拟电路最近这些年没有什么进展。

【在 b*****e 的大作中提到】
: 这个也没瞧不起码工吧,我本人也做过几个月的纯码工,对码工这个职位颇有感触。
: 现在没人在否认开发工具的重要性,大家讨论的是进一步的发展问题。
: 论薪水和论发展,有几点还是比较受认同的:
: 1. 做技术的(包括码工)比不过做管理的。
: 2. 下层职位比不过上层职位。
: 尽管就论“编程语言的熟练使用”这一点来说,做管理的可能远不如做技术的。
: 我本人master学统计学,Ph.D改bioinformatics,再后来做computional bio。在这个
: 块前后摸爬滚打了10年左右,突然发现自己虽然在技术方面也算是略有积累了,但在文
: 章这方面做得再努力,也就是个NAR、bioinformatics、Genome bio这类期刊上下。
: 这个时候技术做得再多,也就是个量的问题,职业发展方面很难有质的突破。

v**********h
发帖数: 230
29
cool. 看了前面所言,收获颇多。现在我想问一下,对于BIOINFO的PHD来讲,顺便带一
个BIOSTAT的硕士,或者CS的硕士,哪个对将来的发展更好一些(如果我想去公司混的话
)?我的专业是纯生物背景。

【在 b*****e 的大作中提到】
: 这个也没瞧不起码工吧,我本人也做过几个月的纯码工,对码工这个职位颇有感触。
: 现在没人在否认开发工具的重要性,大家讨论的是进一步的发展问题。
: 论薪水和论发展,有几点还是比较受认同的:
: 1. 做技术的(包括码工)比不过做管理的。
: 2. 下层职位比不过上层职位。
: 尽管就论“编程语言的熟练使用”这一点来说,做管理的可能远不如做技术的。
: 我本人master学统计学,Ph.D改bioinformatics,再后来做computional bio。在这个
: 块前后摸爬滚打了10年左右,突然发现自己虽然在技术方面也算是略有积累了,但在文
: 章这方面做得再努力,也就是个NAR、bioinformatics、Genome bio这类期刊上下。
: 这个时候技术做得再多,也就是个量的问题,职业发展方面很难有质的突破。

s******s
发帖数: 13035
30
我不是biostat,也不是CS的,随便瞎扯两句。
biostat貌似都是一些trial的东西,除非你以后做药去药厂,完全脱离研究,
否则没啥用。CS还是很牛,不过貌似bioinfo很少用到这种程度的computing,
多数就是script了。觉得bioinfo的应该学点正统的统计。

【在 v**********h 的大作中提到】
: cool. 看了前面所言,收获颇多。现在我想问一下,对于BIOINFO的PHD来讲,顺便带一
: 个BIOSTAT的硕士,或者CS的硕士,哪个对将来的发展更好一些(如果我想去公司混的话
: )?我的专业是纯生物背景。

相关主题
转bioinfomatics可行?求定位
学术界博后8年还能去混工业界吗?请推荐接受短篇幅小文章的bioinformatics, computational biology的杂志
请推荐Bioinformatics入门读物此人为何能在NIBS做资深研究员?
进入Biology版参与讨论
d*******e
发帖数: 1649
31
you are totally wrong...

【在 s******s 的大作中提到】
: 我不是biostat,也不是CS的,随便瞎扯两句。
: biostat貌似都是一些trial的东西,除非你以后做药去药厂,完全脱离研究,
: 否则没啥用。CS还是很牛,不过貌似bioinfo很少用到这种程度的computing,
: 多数就是script了。觉得bioinfo的应该学点正统的统计。

c****r
发帖数: 576
32
楼上有几位说得很好。
说到生物信息与生物,我觉得理想的生物信息职业规划是:
本科:数学/物理/计算机 -- 打好理论基础的准备阶段
博士:在生物信息组工作 --从理论到应用的过渡阶段
之后:在生物实验室做生物信息--具体应用的实践阶段
博士期间选择一个好的组很关键。
其一,最好有做各种生物信息分支的人。这样视野宽广,能了解到什么方法工具处理什
么数据,对自己的知识结构是个很大的完善。
其二,在某些方面有优势。
其三,与实验组合作密切。
博士之后,应该逐渐自己独立出去,做发展长久的计划。这时生物信息的基本功差不多
了,就算没亲手做过也大概知道怎么回事,所以要具体实践。选定一类生物方向(宏观
上的“一类”,而不是“一个”),找对口的牛生物实验室或研究所/大学的系,不断
接触到各种数据,应用已有方法,开发新方法,加强生物认识,就这样做下去。
如果两者之间顺序相反,我觉得不是太妙。从生物实验室起步,一是转换太突然,二是
技能上得到的训练不够,三是对生物信息的视野窄。
以上所说的是“理想”情况,但实际中“不理想”的更多。我列举一下部分我曾经的同
事,他们的背景、技能和发文章情况,以让刚入门的人有所了解。
A: 本科硕士是Math/CS,博士前期有牛人带,搞了一篇建模的Mole.Sys.Bio.(IF:12)加几篇后
续小文章,牛人走后搞得越来越抽象,只有一篇J.Theor.Bio。主要用Matlab,偶尔用R
和C++。
B:本科硕士是Biotech,老板是大牛,博士前期做实验,后期到博后做统计,每年都有
IF6左右的生物文章两三篇,发过Nature子刊和PNAS。主要用R,会一点VB,不会其他编
程。
C:本科硕士是Bioengineering,博士阶段和之后一直做统计,方法型第一作者文章少
,但有一大堆和实验组合作的第n作者的文章。主要用R和C。
D:本科硕士是CS,硕士论文做数据库,博士阶段做生物网络,目前有理论型小文章一
篇及数据库文章一篇。主要用C++和Java。
E:本科硕士是CS,博士阶段做统计和算法,有Mole.Sys.Bio.(IF:12)和方法型小文章
各一篇。主要用R。
F:本科是Bioinfo。博士之前作过软件工程师,博士阶段做ChIP data的统计,有NAR和
BMC Bioinformatics。主要用C/C++和R,会C#,Java,Perl,Python,SQL。
G:本科硕士是化工。博士期间做统计、计算,也做网络,还建数据库,有NAR和BMC
Bioinfo若干篇。主要用Java。
H:本科硕士是CS。博士阶段主要做数据库和统计,有好几篇数据库文章和一些数据分
析文章,主要用C#和SQL。
I:本科是bio,硕士是bioinfo,博士做计算生物,博后做数据库和数据整合,博士时
有2篇5分左右的文章,博后两年半搞了十几篇文章。主要用C++。
J:本科到博士都学CS,博后做生物网络,发了一些抽象的图论文章。主要用C++和R。
K:本科硕士学bio,博士前期做实验,有6分的一作,之后建数据库和做统计,博士期
间11篇文章,大多是一作。
L:本科到博士都是bio,之后转bioinfo,目前做进化,每年也有两三篇4分左右的小文
章。
M:生物信息组的老板。本科硕士是biophysics,博士和博后做计算生物和统计,之后进公司作bioinfo的头,然后又回学术界。用C/C++/Java/SQL/Perl等。目前很成功,每年都有十几篇文章(以上的博士生并非都归该老板指导)。
N:一个实验组的老板。本科到博士做生物,博后做数据库和软件,发了一系列引用次数很高的工具,还在发实验文章,精通C。
由以上所见,发文章关键还是在于生物基础是否雄厚。生物出身的,加强自己的数学和编程修养,会很成功。数学/物理/CS出身的,补上生物知识的欠缺,也可以比较成功。
a*********g
发帖数: 8087
33
要是数理背景的发生物paper比生物背景的还猛,生物背景脸都没了
b****r
发帖数: 17995
34
临床医生的主要观察手段就是biostat了,建议你去new england J Med去看看有几篇不
用生统的
文章

【在 s******s 的大作中提到】
: 我不是biostat,也不是CS的,随便瞎扯两句。
: biostat貌似都是一些trial的东西,除非你以后做药去药厂,完全脱离研究,
: 否则没啥用。CS还是很牛,不过貌似bioinfo很少用到这种程度的computing,
: 多数就是script了。觉得bioinfo的应该学点正统的统计。

w******y
发帖数: 8040
35
bioinfo领域和纯生物的区别就在于基本不看发文的IF
而看工作本身的重要性
基本上所有的重要工具都是CS/Math/Stat/physics背景的人做的
很多发在IF很低的杂志上
生物背景的人一般搞搞小的database, web server, application,
or comparison studies
也能发发bioinforamtics, NAR等主流杂志, 但
对业内人士来说这是最底层的水平

【在 c****r 的大作中提到】
: 楼上有几位说得很好。
: 说到生物信息与生物,我觉得理想的生物信息职业规划是:
: 本科:数学/物理/计算机 -- 打好理论基础的准备阶段
: 博士:在生物信息组工作 --从理论到应用的过渡阶段
: 之后:在生物实验室做生物信息--具体应用的实践阶段
: 博士期间选择一个好的组很关键。
: 其一,最好有做各种生物信息分支的人。这样视野宽广,能了解到什么方法工具处理什
: 么数据,对自己的知识结构是个很大的完善。
: 其二,在某些方面有优势。
: 其三,与实验组合作密切。

K****n
发帖数: 5970
36
My colleague pointed me to msdn. You can search for SSAS tutorial
Several links that might give a quick look:
http://technet.microsoft.com/en-us/library/bb510516.aspx
http://technet.microsoft.com/en-us/library/ms131986.aspx
I promise you will see lots of familiar algorithms here :)
http://technet.microsoft.com/en-us/library/ms175443.aspx
Algorithms Category
Microsoft_Association_Rules\ Enabled
A Boolean property that indicates whether the Microsoft_Association_Rules
algorithm is enabled.
Microsoft_Clustering\ Enabled
A Boolean property that indicates whether the Microsoft_Clustering algorithm
is enabled.
Microsoft_Decision_Trees\ Enabled
A Boolean property that indicates whether the Microsoft_DecisionTrees
algorithm is enabled.
Microsoft_Naive_Bayes\ Enabled
A Boolean property that indicates whether the Microsoft_ Naive_Bayes
algorithm is enabled.
Microsoft_Neural_Network\ Enabled
A Boolean property that indicates whether the Microsoft_Neural_Network
algorithm is enabled.
Microsoft_Sequence_Clustering\ Enabled
A Boolean property that indicates whether the Microsoft_Sequence_Clustering
algorithm is enabled.
Microsoft_Time_Series\ Enabled
A Boolean property that indicates whether the Microsoft_Time_Series
algorithm is enabled.
Microsoft_Linear_Regression\ Enabled
A Boolean property that indicates whether the Microsoft_Linear_Regression
algorithm is enabled.
Microsoft_Logistic_Regression\ Enabled
A Boolean property that indicates whether the Microsoft_Logistic_Regression
algorithm is enabled.

now.

【在 e*****t 的大作中提到】
: He KeeVan
: Show me how they apply SQL in machine learning. I am studying SQL right now.
: very interested in it.
:
: SQL

K****n
发帖数: 5970
37
um... I am not sure how much this software is...

【在 K****n 的大作中提到】
: My colleague pointed me to msdn. You can search for SSAS tutorial
: Several links that might give a quick look:
: http://technet.microsoft.com/en-us/library/bb510516.aspx
: http://technet.microsoft.com/en-us/library/ms131986.aspx
: I promise you will see lots of familiar algorithms here :)
: http://technet.microsoft.com/en-us/library/ms175443.aspx
: Algorithms Category
: Microsoft_Association_Rules\ Enabled
: A Boolean property that indicates whether the Microsoft_Association_Rules
: algorithm is enabled.

v**********h
发帖数: 230
38
指教一下。

【在 d*******e 的大作中提到】
: you are totally wrong...
e***g
发帖数: 1696
39
CS领域最牛的杂志的IF<4, IF=1.x就是还可以的杂志, IF=2.X就是牛杂志了

理什

【在 w******y 的大作中提到】
: bioinfo领域和纯生物的区别就在于基本不看发文的IF
: 而看工作本身的重要性
: 基本上所有的重要工具都是CS/Math/Stat/physics背景的人做的
: 很多发在IF很低的杂志上
: 生物背景的人一般搞搞小的database, web server, application,
: or comparison studies
: 也能发发bioinforamtics, NAR等主流杂志, 但
: 对业内人士来说这是最底层的水平

u*********1
发帖数: 2518
40
Just curious, What's the difference between C++/Java and perl/python?
Seems people here think C++/Java is to deal with large scale data while perl
/python is for input/output.
I used to think they are all the same...thx

抛砖引玉~~

【在 c****r 的大作中提到】
: 这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
: 我觉得职业发展应该是广、深必备。
: 广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
: 深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
: 广而不深的后果是没有确定的研究方向,总是给别人作工具;
: 深而不广的后果是在当今数据爆炸的时代发展机会少。
: 难点有以下几点,难度依次增加:
: 1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
: 么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
: 场合更高效一些。

相关主题
此人为何能在NIBS做资深研究员?发文章的烦恼,请求大家指点
请教一下各位评价一下几个杂志水平还有投稿难易程度bioinfo Phd 申请(PI请进)
老板对博厚的expectation请问Genome Biology的投稿有啥要注意的
进入Biology版参与讨论
s******s
发帖数: 13035
41
C++/Java编复杂程序有优势,Perl/python处理data有优势,
如果做genomics,一般都是数据多但是程序简单。

perl

【在 u*********1 的大作中提到】
: Just curious, What's the difference between C++/Java and perl/python?
: Seems people here think C++/Java is to deal with large scale data while perl
: /python is for input/output.
: I used to think they are all the same...thx
:
: 抛砖引玉~~

1 (共1页)
进入Biology版参与讨论
相关主题
关于美国的生统博后!请教一下各位评价一下几个杂志水平还有投稿难易程度
求审稿机会(基因组学,生物信息学)老板对博厚的expectation
转bioinfomatics可行?发文章的烦恼,请求大家指点
学术界博后8年还能去混工业界吗?bioinfo Phd 申请(PI请进)
请推荐Bioinformatics入门读物请问Genome Biology的投稿有啥要注意的
求定位说说自己的研究:Gene module在生物医学癌症分类(clustering)的应用
请推荐接受短篇幅小文章的bioinformatics, computational biology的杂志继续求生物信息审稿机会
此人为何能在NIBS做资深研究员?新版impact factor发布
相关话题的讨论汇总
话题: microsoft话题: enabled话题: 生物话题: boolean话题: c++