常见问题:
1.为什么不用百度谷歌等通用搜索引擎?通用搜索引擎不能及时、全部抓取网站最新页面内容;对搜索结果的展示也是通用的,没有差异性;不能按照自身业务逻辑去做 排序、过滤、展示是其最大的弱项,无法提供热词,搜索推荐词,关联词等功能;对站内各种文件资源,如word,pdf等无法有效定制搜索。 因此,站内搜索的出现也是有其具体原因和需求的。
2.已经在线网站,可以再增加站内搜索吗?
可以。根据需索引的内容,提供专用索引API,供开发人员使用站内搜索; 或者网站提供的数据源,我们抓取数据,建立维护索引。
3.可否做多种格式文件搜索?
可以定制对txt,word,pdf等多种格式文档的搜索。支持多种数据库建立索引。
4.站内搜索与数据库模式匹配检索有什么不同?
站内搜索是倒排索引,检索数度快。结合分词功能,定制权重,相似度打分等机制,搜索结果更加全面准确。
5.数据量很大,文档的数量级上亿,能否支持?
可以。提供单节点和云两种站内搜索服务,采用分布式云搜索可以解决大数据量的高效查询、高可靠性等问题。