Sphinx使用及近实时索引实现

Sphinx介绍

  Sphinx是由一个开源的全文检索引擎,功能类似Lucune,用C++编写,可为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成,当前系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据,通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)

Sphinx特性


    1:Sphinx支持高速建立索引(可达10MB/秒,而Lucene建立索引的速度是1.8MB/秒)
    2:高性能的搜索(在2--4GB的文本数据上,平均每次检索响应时间小于0.1秒)
    3:高扩展性(实测最高可对100GB的文本建立索引,单一索引可包含1亿条记录)
    4:提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法
    5:支持分布式搜索
    6:支持短语搜索
    7:可作为MySQL的存储引擎提供搜索服务
    8:支持布尔、短语、词语相似度等多种检索模式
    9:文档支持多个全文检索字段

系统组成
整个Sphinx系统由多个可执行程序和一套api组成,这里引用Coreseek(一个基于Sphinx的开源检索引擎,提供了良好的中文支持)的一个结构图做个示例


Sphinx使用及近实时索引实现

原文链接: https://www.cnblogs.com/bjanzhuo/archive/2013/02/17/3575994.html

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍

    Sphinx使用及近实时索引实现

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/78145

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年2月9日 下午6:25
下一篇 2023年2月9日 下午6:25

相关推荐