E*****9 发帖数: 32 | 1 转系到CS,好多东西都不懂.
导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
万分感谢!!! | r***u 发帖数: 241 | 2 虽然没用过Python,但感觉python应该会不错,上手比较容易,库也很多
【在 E*****9 的大作中提到】 : 转系到CS,好多东西都不懂. : 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东 : 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比 : 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢? : google, baidu都用了,但搜到的都在杂了,有人可以指点一下. : 万分感谢!!!
| l********0 发帖数: 283 | 3 这种程序的主要功能点是:httpclient,String parse
在正则表达式方面强的语言适合做这个,比如Java,Perl,等
【在 E*****9 的大作中提到】 : 转系到CS,好多东西都不懂. : 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东 : 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比 : 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢? : google, baidu都用了,但搜到的都在杂了,有人可以指点一下. : 万分感谢!!!
| j****a 发帖数: 1277 | 4 从一些大的blog网站入手应该会容易一些把 站点结构都类似
【在 E*****9 的大作中提到】 : 转系到CS,好多东西都不懂. : 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东 : 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比 : 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢? : google, baidu都用了,但搜到的都在杂了,有人可以指点一下. : 万分感谢!!!
| E*****9 发帖数: 32 | 5 谢谢大家啊,可以再具体点么?
【在 E*****9 的大作中提到】 : 转系到CS,好多东西都不懂. : 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东 : 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比 : 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢? : google, baidu都用了,但搜到的都在杂了,有人可以指点一下. : 万分感谢!!!
| l********0 发帖数: 283 | 6 还要怎么具体?
【在 E*****9 的大作中提到】 : 谢谢大家啊,可以再具体点么?
| r*******n 发帖数: 3020 | 7 我用过Python抓过google排名前50的连接,每一个小时抓一次,
比较结果有什么变化。
用到urllib, 正则表达式
【在 E*****9 的大作中提到】 : 谢谢大家啊,可以再具体点么?
| E*****9 发帖数: 32 | 8 嗯,谢谢~我去努力研究~~
【在 E*****9 的大作中提到】 : 转系到CS,好多东西都不懂. : 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东 : 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比 : 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢? : google, baidu都用了,但搜到的都在杂了,有人可以指点一下. : 万分感谢!!!
|
|