t***s 发帖数: 48 | 1 【 以下文字转载自 CS 讨论区 】
发信人: truss (truss), 信区: CS
标 题: 【求教】Text Indexer for Large Volume of ASCII files【先谢】
发信站: BBS 未名空间站 (Wed Oct 17 14:02:57 2012, 美东)
我需要index大概四百万个ascii文件。哪位高人给推荐个好用的text indexer。多谢。
简单的说,就是个类似于text search engine里面indexer那一部分,但是提供比较方
便的command line access。最好在windows上。
具体点,就是能够index这四百万文件,把结果放在一个可以从command line方便读取
的repository里。可以是relational database或者其他proprietary的格式,只要能够
从command line或者perl之类的scripts读,结果能输出到ascii文件就可以。当然如果
可以从数据库里直接用SQL读更好。
安装越简单越好。最好都是command line。
我试过微软的search server和open source的lucene,都不太满意,主要是输出都是
web pages。像我的情况一个关键字上百页的输出。处理起来太麻烦。
再谢。 | t****0 发帖数: 13 | 2 Write a simple app using lucene.net, should be straightforward.If need help,
contact me. |
|