`
m635674608
  • 浏览: 5053595 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

elasticsearch 批量入库bulk性能测试

 
阅读更多

经过测试不同的分词器性能不能同。

 

1万条数据  

分词器                          时间

es默认分词器               1秒多

ik                                   60秒左右

mmseg                         1秒多

ansj                               未知

paoding                        未知

keyword                        1秒多

 

 

后来更新ik版本发现性能有所提升,但是还是没有mmseg性能高,应该mmseg分词分的比ik少。

 

插入主要的性能还是分词器的性能

 

 

 

http://my.oschina.net/naqin/blog/347200

分享到:
评论

相关推荐

    elasticsearch-bulk-insert-plugin.zip

    Elasticsearch-Bulk-Insert-Plugin 是一个专为Kettle设计的插件,主要用于高效地将大量数据批量插入到Elasticsearch(ES)集群中。Elasticsearch是一种流行且功能强大的分布式搜索引擎,常用于大数据分析、日志分析...

    elasticsearch 性能测试

    **Elasticsearch 性能测试** Elasticsearch 是一个分布式、全文检索的搜索引擎,广泛应用于数据分析、日志聚合和实时搜索场景。为了确保系统在高负载下仍能保持高效稳定,性能测试是至关重要的。本篇文章将围绕如何...

    springBoot整合kafka和elasticSearch,实现批量拉取日志以及批量更新到es里

    2. **批量大小**:合理调整Kafka消费者和Elasticsearch的批量大小,过大可能导致内存溢出,过小则会影响性能。 3. **错误处理**:处理可能出现的异常,如网络中断、ES索引冲突等,确保系统的健壮性。 4. **索引分片...

    elasticsearch-bulk-insert-plugin-8.2.0.0-342.zip

    在标题中提到的"elasticsearch-bulk-insert-plugin-8.2.0.0-342.zip"是一个针对Kettle(也称为Pentaho Data Integration)的插件,它允许用户通过Kettle与Elasticsearch进行批量数据插入。Kettle是一款开源的数据...

    docker实现elasticsearch批量dump导出导入

    docker实现elasticsearch批量dump导出导入,实现es批量导入导出

    elasticsearch-bulk-insert-plugin-8.x-es7.x.x.zip

    kettle 支持elasticsearch7.x 批量上传的插件,减压后放到data-integration\plugins 目录下即可

    Java做客户端对Elasticsearch服务的增删改查及批量修改操作

    Java做客户端对Elasticsearch服务的增删改查及批量修改操作,代码简洁易懂,思路清晰有注释.详情参考https://blog.csdn.net/linhaiyun_ytdx/article/category/7042758

    Oracle数据批量导入elasticsearch脚本

    Linux环境下使用sqlplus工具将oracle中的数据导入到elasticsearch中。只需要在es_bulk_tool.properties配置sql即可实现数据的批量导入。在elasticsearch6中测试通过。shell脚本需要使用sqlplus。

    java语言kafka数据批量导入到Elasticsearch实例

    消费kafka数据,然后批量导入到Elasticsearch,本例子使用的kafka版本0.10,es版本是6.4,使用bulk方式批量导入到es中,也可以一条一条的导入,不过比较慢。 <groupId>org.elasticsearch <artifactId>elastic...

    curl.rar ElasticSearch 批量导入一批数据

    4. **使用`curl`命令**:在命令行中,使用`curl`发送POST请求到ElasticSearch的 `_bulk` API,这个API专门用于批量操作。 ```bash curl -X POST "localhost:9200/your_index_name/_bulk?pretty" -H 'Content-Type...

    elasticsearch-bulk-insert-plugin-9插件,支持ES7.16

    总之,elasticsearch-bulk-insert-plugin-9是一个专门为Kettle设计的Elasticsearch批量插入插件,专为Elasticsearch 7.16版本优化,它通过 Bulk API 提升了数据导入的速度,是大数据处理和分析场景下的理想选择。...

    ElasticSearch官方测试数据

    官方提供的测试数据集是检验Elasticsearch功能、性能和稳定性的关键资源,可以帮助开发者和用户深入了解其工作原理和优化技巧。 ### 一、Elasticsearch核心概念 1. **文档(Document)**:Elasticsearch处理的基本...

    elasticsearch-bulk-insert-plugin-8.2.0.4-606.zip

    kettle7.1+elasticsearch7.0.1版本,此包通过pentaho-kettle-8.2.0.4-R源码编译,可用于elasticsearch7.0.1版本,解压此包,放入在kettle的plugin中,重启kettle即可,在配置项中设置address:<es的id>,port:9200

    ES查询客户端,elasticsearch可视化工具 elasticsearch查询客户端

    Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于数据检索、分析和管理。作为分布式、RESTful风格的搜索和数据分析引擎,Elasticsearch能够提供实时、高可用性以及可扩展的搜索功能。在进行日常的数据...

    kettle elasticsearch插件

    kettle etl工具中,实现批量导入到 elasticsearch中的插件

    基于Spring Batch向Elasticsearch批量导入数据示例

    基于Spring Batch向Elasticsearch批量导入数据示例 本文介绍了基于Spring Batch向Elasticsearch批量导入数据示例,旨在解决大规模数据从数据库导入Elasticsearch时的效率问题。Spring Batch框架使用ItemReader分页...

Global site tag (gtag.js) - Google Analytics