由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Software版 - 【求教】Text Indexer for Large Volume of ASCII files【先谢】 (转载)
相关主题
Help: Microsoft Word cannot print text but can print graphics100个包子求助,word文档corrupted,如何恢复?
[转载] 一点小经验EBCDIC 格式文件怎么转成ASCII格式?谢谢 (转载)
Re: matlab 怎样把text matrix 读进matrix?自己的事情自己做——不用第三方软件实现多系统共存
请教把access编码由unicode换成ascii的方法 (转载)多系统引导我最酷
刚买不久的机器,可以显示中文,但是收藏夹里有些中文网站名显示不了Re: where can I download system commander 2000?
What's the problem with 'ascii' codec?Re: how to beautify a text file on unix?
一个java的小问题Re: what is .ace file? thanks
推荐一下:尤达笔记Re: 刚发现WC还可以断点续传...
相关话题的讨论汇总
话题: indexer话题: ascii话题: text话题: large话题: volume
进入Software版参与讨论
1 (共1页)
t***s
发帖数: 48
1
【 以下文字转载自 CS 讨论区 】
发信人: truss (truss), 信区: CS
标 题: 【求教】Text Indexer for Large Volume of ASCII files【先谢】
发信站: BBS 未名空间站 (Wed Oct 17 14:02:57 2012, 美东)
我需要index大概四百万个ascii文件。哪位高人给推荐个好用的text indexer。多谢。
简单的说,就是个类似于text search engine里面indexer那一部分,但是提供比较方
便的command line access。最好在windows上。
具体点,就是能够index这四百万文件,把结果放在一个可以从command line方便读取
的repository里。可以是relational database或者其他proprietary的格式,只要能够
从command line或者perl之类的scripts读,结果能输出到ascii文件就可以。当然如果
可以从数据库里直接用SQL读更好。
安装越简单越好。最好都是command line。
我试过微软的search server和open source的lucene,都不太满意,主要是输出都是
web pages。像我的情况一个关键字上百页的输出。处理起来太麻烦。
再谢。
t****0
发帖数: 13
2
Write a simple app using lucene.net, should be straightforward.If need help,
contact me.
1 (共1页)
进入Software版参与讨论
相关主题
Re: 刚发现WC还可以断点续传...刚买不久的机器,可以显示中文,但是收藏夹里有些中文网站名显示不了
Re: 呵呵,喜欢WC的同志们好!What's the problem with 'ascii' codec?
Re: 怎样才能实现呢一个java的小问题
Windows Commander 4.50推荐一下:尤达笔记
Help: Microsoft Word cannot print text but can print graphics100个包子求助,word文档corrupted,如何恢复?
[转载] 一点小经验EBCDIC 格式文件怎么转成ASCII格式?谢谢 (转载)
Re: matlab 怎样把text matrix 读进matrix?自己的事情自己做——不用第三方软件实现多系统共存
请教把access编码由unicode换成ascii的方法 (转载)多系统引导我最酷
相关话题的讨论汇总
话题: indexer话题: ascii话题: text话题: large话题: volume