`

coreseek配置文件语法

 
阅读更多

sql_query_range
分区查询设置。可选选项,默认为空。仅适用于sql数据源(mysql,pgsql,mssql)
设置这个选项会启用文档的区段查询,分区段查询有助于避免在索引大量数据时发生myisam表臭名昭著的死锁问题。(同样有助于解决其他不那么声名狼藉的问题,比如大数据集上的性能下降问题,或者InnoDB对多个大型读事务(read transactions)进行序列化时消耗额外资源的问题)
此选项掻定的查询语句必须获取用于分区的最小和最大文档ID。它必须返回正好两个整数字段,先是最小ID然后是最大ID,字段的名字会被忽略。
当启用了分区段查询时,sql_query 要求包括 $start 和 $end 宏(因为重复多次索引整个表显示是个错误)。注意,$start 。。。 $end 所指定的区间不会重叠,因此不会在查询中删除ID正好等于 $start 或 $end 的文档。
事例
sql_query_range = select min(id),max(id) from documents
sql_range_step = 1000
sql_query = select * from documents where id>=$start and id<= $end

sql_attr_uint(32位无符号整型)
声明无符号整数。可声明同一类型的多个不同名称的属性
sql_attr_bool
声明布尔属性
sql_attr_bigint
64位整数属性声明。多个值(可以同时声明多个属性),可选选项。仅适用于sql。与sql_att_uint不同,这些值是有符号的
sql_attr_timestamp
声明unix时间戳属性
例如
sql_attr_timestamp = UNIX_TIMESTAMP(added_datetime) as added_ts

sql_query_post
后取查询。可选项,默认值为空。仅适用于sql数据
此查询在sql_query 成功执行后立即执行。如果取后取查询产生了错误,该错误被当作警告被报告,但索引不会因此终止。取后查询的结果会被忽略。注意当取后查询执行时索引还尚未完成,而后面的索引仍然可能失败。因此在这个查询中不应进行任何永久性的更新。例如,不应在此查询中更新辅助表中存储的最近成功索引的文档ID值
示例
sql_query_post = DROP TABLE my_tmp_table

sql_query_post_index
后索引查询。可选项,默认值为空。仅适用于sql数据源
此查询在索引完全成功结束后执行。如果此查询产生错误,该错误会被当作警告报告,但索引不会因此而终止,该查询的结果集被忽略。此查询中可以使用宏 $maxid,它会被扩展为索引过程中实际得到的最大的文档ID
示例
sql_query_post_index = REPLACE INTO counters(id,val) values ('max_indexed_id',$maxid)

sql_ranged_throttle
分区查询的间隔时间(throttling),单位是毫秒。可选选项,默认值为0(无间隔时间)。仅适用于sql数据源
此选项旨在避免indexer对数据库服务器构成太大的负担。它会使indexer在每个分区查询的步之后休眠若干毫秒。休眠无条件执行,并在取结果的查询之前执行
示例
sql_ranged_throttle = 1000 #sleep for 1 sec before each query step

sql_query_info
文档信息查询。可选选项,默认为空
仅被命令行搜索所用,用来获取和显示文档信息
示例
sql_query_info = select * from documents where id=$id

分享到:
评论

相关推荐

    coreseek-3.2.14.zip

    部署CoreSeek涉及到配置索引源、建立索引、设置查询服务器等步骤,开发者需要熟悉MySQL等数据库操作,并了解基本的Sphinx或CoreSeek配置文件。 5. 维护与社区支持: 尽管官方已经关闭,但开发者社区仍然可能存在对...

    coreseek3.1.14

    9. **配置文件**:CoreSeek的配置文件通常包含服务器设置、索引设置、日志配置等,用户可以根据自己的需求调整这些设置以优化搜索性能。 10. **社区支持**:作为一个开源项目,CoreSeek拥有活跃的社区,用户可以...

    coreseek搜索服务1

    5. **查询语法**:CoreSeek支持的查询语法,如布尔运算符、短语搜索、模糊匹配、排序和分页等。 6. **日志分析与调优**:通过分析日志文件来优化搜索性能,包括调整索引更新频率、内存使用、查询效率等。 7. **API...

    coreseek-4.1-win32

    3. **配置文件**:在CoreSeek中,用户通常需要编辑配置文件(如`searchd.conf`和`sphinx.conf`)来设定索引的创建、更新规则,以及搜索服务的行为。这些配置文件包含了关于数据源、索引设置、网络监听端口、日志文件...

    coreseek3.2.14带注释的代码

    5. **配置文件**:CoreSeek的配置文件可以自定义各种参数,包括索引设置、搜索行为、日志记录等,对于调整系统性能和适应不同应用场景至关重要。 6. **日志和监控**:系统运行时的日志记录和性能监控也是源码中不可...

    coreseek-3.2.14.tar.gz

    通过解压"coreseek-3.2.14.tar.gz",你可以获得CoreSeek的源代码、配置文件、文档等资源,从而开始你的全文搜索引擎之旅。在实际应用中,你需要根据具体需求调整配置,优化索引,编写接口代码,最终实现一个高效、...

    coreseek-4.1

    6. **安装与配置**:安装CoreSeek 4.1时,用户需要按照官方文档或者社区提供的指南进行,包括下载安装包、配置索引设置、创建数据源、定义搜索语法等步骤。配置过程中可能涉及设置日志文件、索引更新计划、搜索结果...

    coreseek-4.1 x64 x86合集插件包.zip

    压缩包中的"coreseek-4.1-win64-pinyin-poly.zip"和"coreseek-4.1-win32-pinyin-talend.zip"两个文件分别对应64位和32位Windows系统下的中文分词插件。其中,“pinyin”可能是指拼音支持,这对于处理中文字符和进行...

    coreseek-3.2.14

    - **示例**:可能有示例配置文件和示例程序,方便用户快速上手。 - **库文件**:必要的库文件和依赖,用于编译和运行CoreSeek。 - **工具**:可能包括分词工具、管理工具等,用于辅助管理和优化搜索性能。 在实际...

    coreseek.rar

    在学习和使用CoreSeek时,你需要理解其基本架构、掌握配置文件的编写,以及熟悉如何处理数据源和索引更新。同时,了解Sphinx的API调用方法,以便在自己的应用程序中集成全文检索功能。在实际应用中,可能还需要根据...

    配合《带有sphinx搜索功能的yii2框架实例》的资源

    这可以通过修改Sphinx的配置文件完成,或者使用Sphinx提供的API动态创建索引。 4. **集成Yii2**:在Yii2框架中,你需要创建一个组件或服务来管理Sphinx的连接和查询。这可能涉及到编写控制器、模型和视图代码,以便...

    Windows下安装使用Sphinx

    创建配置文件 `E:\coreseek\etc\mysql.conf`,其内容如下: ```ini sourcemysql { type=mysql sql_host=localhost sql_user=root sql_pass= sql_db=test sql_port=3306 sql_query_pre=SET NAMES utf8 sql_...

    PHP+Mysql+Sphinx高效的站内搜索引擎搭建详释.docx

    2. **配置文件设置**:在E:\coreseek\etc\目录下创建名为mysql.conf的配置文件,内容如下: ``` source mysql{ type= mysql sql_host= localhost sql_user= root sql_pass= your_password sql_db= test sql_...

    中日韩分词词库.zip

    在实际应用中,开发者需要将词库文件解压并导入到CoreSeek或Sphinx的配置中。具体操作涉及设置词库路径、调整分词算法参数等,这些都需要对搜索引擎的内部机制有一定了解。一旦配置成功,系统就能自动识别和处理中日...

    php5.4.3-win32

    压缩包中的文件“php5.4.3”可能是包含了PHP的完整安装包,包括PHP解释器、配置文件、扩展库等。安装时,用户通常需要根据自己的需求配置php.ini文件,选择启用哪些扩展,并将PHP与Web服务器(如Apache或Nginx)集成...

Global site tag (gtag.js) - Google Analytics