ES 写入瓶颈需要进行压测,才能确定实际是否达到瓶颈

筛查分析

普及:JMQ 默认生产者发送消息 QPS 受到主题的 broker 数量影响,(8w/s)/broker

3.2.1 MQ 积压分析

1)分析原因一、ES 写入量大,导致 ES 写入 QPS 瓶颈

ES 写入瓶颈需要进行压测,才能确定实际是否达到瓶颈;
通过查询集群负载,写入队列有无积压,cpu 高不高,来定位
以下为调整 MQ 批量消费大小后的 ES 监控
写入队列无积压,CPU 不高,写入 QPS 没有达到瓶颈

2)分析原因二、ES 写入慢导致消费积压

ES 解析服务解析慢,瓶颈在 ES 解析处
根据当前系统 CPU、负载信息定位是否服务器性能满负荷,是否扩容
无报警信息,整体运行平稳,基本排除业务资源达到瓶颈问题引起写入慢

MQ 消费端消费慢,瓶颈在消费并发处
当前主题分片数 3,队列数为 15,默认最大并发数为 15*10,报警当时入队数 500~700/s
定位问题,为 MQ 消费慢,其根本原因为受到 ES-Parse 业务系统处理速度影响

3.3 临时处理方案

开启 mq 并行消费策略,写入 QPS 显著增加

4 如何提升消费速率,提升写入 ES 速率

造成问题原因核心点是 MQ 积压,业务系统消费慢,MQ 入队数大于出队数,导致积压

4.1 原理分析

4.1.1 存储流程解析

第一步:binlake 订阅 mysql binlog
第二步:发 MQ,JMQ 数据传输
第三步:消费 JMQ 数据,ES Paser 数据解析,
第四步:数据存储

4.1.2 binlake 基本原理

4.1.3 binlake 发送 MQ 过程

4.1.4 JMQ 消费原理

JMQ 消费默认就是批量消费
消费原理如下图

批量消费与并行消费原理如下图

通过分析,在未开启并行消费前提下,当前主题最大处并发的消费处理能力

即是队列数

4.2 提升消费速率的几种方案

4.2.1MQ 增加消费速度方法

扩容,增加并发消费能力
针对 MQ 默认情况下,一切扩容都能解决问题,增大分片数,增加队列数
需要额外资源,申请扩容新的 broker,同时考虑增加消费端实例

增加批量大小
首先保证,业务系统 (ES-Parse) 消费 MQ 消息,处理 10 条和处理 100 条速度基本一样
实践:国际财务针对此方法进行代码逻辑改造

开启并行数
理论上增加(并行数 / 批量数)的倍数并发处理能力
要求数据无序,针对乱序,数据存储,不影响业务

4.2.2 并行有序的方案

1)实现数据幂等性,增加缓存,并行消费策略

方案流程

feidodo网络
关注 关注
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch写入速度优化
qq_27639777的博客
05-15 2093
文章目录背景translog flush间隔调整索引刷新间隔refresh_interval段合并优化indexing buffer使用bulk请求bulk线程池和队列并发执行bulk请求磁盘间的任务均衡节点间的任务均衡索引过程调整和优化自动生成doc ID调整字段Mappings调整_source字段禁用_all字段对Analyzed的字段禁用Normsindex_options设置 背景 在ES的默认设置下,是综合考虑数据可靠性、搜索实时性、写入速度等因素的。有时候,业务上对数据可靠性和搜索实时性要求并
使用ESRally压测ElasticSearch性能
架构师修炼道路
02-06 375
Rally是Elasticsearch的基准测试框架,由官方提供维护。
Elasticsearch进阶(一)写入性能基准测试写入性能优化
03-01
进入正题之前,解决之前的一个疑问:Elasticsearch集群是否已经正确工作?截图时,只上传过一次小测试数据(143万条),设置为:从图中可以看出,ip10节点上设置的数据目录:data1和data2目录工作正常,但是数据相同ip12中数据与ip10中数据不同,但是data1与data2数据相同ip13数据与ip12相同ip11既不是master候选者,也不是data节点,验证发现确实无数据分配多个分片和副本是分布式搜索功能设计的精髓系统:macOS10.13.4处理器:2.3GhzInterCorei5内存:8GB2133MHzLPDDR3SSDs注:jamesjxin在博客中说到:确保
ES亿级数据检索优化,三秒返回突破性能瓶颈
民工哥的博客
01-04 1820
「读者福利!2 TB 各类技术资源免费赠送」一、前言数据平台已迭代了三个版本,从刚开始遇到很多常见的难题,到终于有片段时间整理一些已完善的文档,在此分享以供需要的朋友参考,少走些弯路...
ElasticSearch读写性能调优
最新发布
qq_44027353的博客
08-15 1177
深层次理解,虽然是每隔一秒就会将内存中的segment数据刷新到segment file中,但实际上这里并没有直接到磁盘文件,而是先写入到OS Cache中。以refresh_interval为间隔时间,将保存在ES 内存缓存区中的数据 刷新到 os的文件系统缓存中,定期清空es的buffer,生成segment。注意:ES 的默认设置,已经综合考虑了数据可靠性,搜索的实时性,写入速度,一般不要盲目修改。将segment刷新到os cache中,并开放了查询权限,以提升搜索的实时性。
Elasticsearch的性能瓶颈与解决方案
AI天才研究院
01-25 1318
1.背景介绍 1. 背景介绍 Elasticsearch是一个分布式、实时的搜索和分析引擎,它基于Lucene库构建,具有高性能、高可扩展性和高可用性。在大规模数据处理和实时搜索场景中,Elasticsearch是一个非常重要的工具。然而,随着数据量的增加和查询压力的加大,Elasticsearch可能会遇到性能瓶颈。本文将讨论Elasticsearch的性能瓶颈以及相应的解决方案。 2. ...
Elasticsearch写入瓶颈导致skywalking大盘空白
chihujiang3132的博客
03-20 1230
前言 继上次skywalking出故障《https://my.oschina.net/keking/blog/3016839》不到一个月,线上skywalking又出毛病了。又是大盘空白,trace列表最近的数据都查询不出来,但是时间稍久的数据就能查询出来,如一天前的数据有,一个小时前的数...
flink 写入es_Flink 实时写入数据到 ElasticSearch 性能调优
weixin_39854440的博客
12-22 826
背景说明线上业务反应使用Flink消费上游kafka topic里的轨迹数据出现backpressure,数据积压严重。单次bulk的写入量为:3000/50mb/30s,并行度为48。针对该问题,为了避免影响线上业务申请了一个与线上集群配置相同的ES集群。本着复现问题进行优化就能解决的思路进行调优测试。测试环境elasticsearch 2.3.3flink 1.6.3flink-connect...
logstash 吞吐量优化_filebeat+kafka+logstash+elasticsearch全链路日志收集系统压测分享...
weixin_39671509的博客
12-20 458
前阵子做了一次日志收集系统压测,我们的全链路日志收集系统采用filebeat+kafka+logstash+elasticsearch,今天主要分享原始日志入库ES压测经验,并不涉及storm的实时日志处理。压测目标是120万条日志/分钟,压测团队由本人、自动压测同事、SRE、众多PO、领导组成。压测的目标是明确的,却不太好下手。经过优化后,大概摸索出了方案。真是团队协作才完成,手上排满了别的活...
ES索引写入性能优化
zhutianrong520的博客
12-21 973
最近一直想总结一篇es的优化文章,看了几篇博客,总结一下,方便以后遇上es线上优化问题有参考之处: 1、用bulk批量写入 es批量写入时,应该使用es的bulk写入,bulk写入还是应该考虑es的node数,shard分片数。业务中尽量将写入es的数据聚合起来分批写入。 bulk批量写入性能比你一条一条写入大量的document的性能要好很多。但是如果要知道一个bulk请求最佳的大小,需要对单...
ES 异常写入解决流程
u010483897的博客
02-18 2928
ES 异常写入解决流程
es性能差原因
leijmdas的专栏
06-10 406
此外,其他因素如索引性能、查询性能、存储设备的性能、合理的分片和副本数量、以及JVM垃圾回收策略等也可能影响ES性能。索引段合并占用IO资源:索引段合并太频繁会占用大量IO资源,建议调整索引段合并线程设置。查询业务占用资源:高并发或大数据查询可能占用大量资源,需要衡量系统侧重并可能需要扩容。Bulk队列积压:大量bulk队列积压导致线程被拒绝,需要降低业务请求的并发量。写入时指定DOC ID:这可能导致需要从磁盘进行一次读操作,占用大量磁盘IO。
es如何提升写入性能
婲落ヽ红颜谇的博客
08-14 3322
背景 前段时间,为了降低用户使用ElasticSearch的存储成本,我们做了数据的冷热分离。为了保持集群磁盘利用率不变,我们减少了热节点数量。ElasticSearch集群开始出现写入瓶颈,节点产生大量的写入rejected,大量从kafka同步的数据出现写入延迟。我们深入分析写入瓶颈,找到了突破点,最终将Elasticsearch的写入性能提升一倍以上,解决了ElasticSearch瓶颈导致的写入延迟。这篇文章介绍了我们是如何发现写入瓶颈,并对瓶颈进行深入分析,最终进行了创新性优化,极大的提升了...
如何监控ES性能
zhinengyunwei的博客
01-19 6304
作者:石文 时间:2018-07-03 本部分来自一篇外文文章,这篇外文文章包括如下四部分。 Part1:如何监控ES性能 What is Elasticsearch? * 什么是Elasticsearch?* Elasticsearch is an open source distributed document store and search engine that stores and...
推荐一款es轻量级的压测工具
bohu83的博客
10-27 2086
如果测试服务器充足,可以部署在多个上,一个节点可以部署多个loadgen.改下名字。之前折腾2天想用es 官网推荐的es压测工具,各种坑,参见我之前的安装过程。如何修改参数,参见官网:就是设置es的账户,ip, 写body,读的url。开多个情况,每个设置不同的配置,这样更好的模拟线上的不同读写速率,值得推荐。有一点,这是基准的压测,不能很好的模拟线上的同事读写某个比例的情况。分别设定不同的并发,模拟业务读写不同的es索引。下载,解压,修改loadgen.yml 即可。这里面很多参数,主要是读写的速度。
(Elasticsearch)ES写入性能优化方案
杜海的博客
03-16 5024
ES的默认设置下,是综合考虑数据的可靠性,搜索实时性,写入速度等因素的。当离开默认设置,追求极致写入速度时,很多是以牺牲可靠性和搜索实时性为代价的。有时候,业务上对数据可靠性和搜索实时性要求不高,反而对写入速度要求很高,此时可以调整一些策略,最大化写入速度。 综合来说可以从以下几个方面入手: 加大translog flush间隔,目的是降低iops,writeblock (可靠性降低) 加大index refresh间隔,除了降低I/O,更重要的是降低segment merge频率 调整bulk
Elasticsearch压测工具esrally:安装、配置与实战应用
Elasticsearch压测工具Elasticsearch Rally (esrally)是一个官方推荐的性能评估工具,它专门针对Elasticsearch进行测试,特别是在源码修改或应用调优时,可以用来验证优化效果。本文将详细介绍esrally的安装、配置、...
写文章

热门文章

  • 分享一下微信付费文章功能怎么做 4470
  • 怎么做微信小程序商家店铺_分享商家店铺小程序制作 3667
  • 微信抽奖活动小程序制作步骤有这篇就够了 2747
  • ES 写入瓶颈需要进行压测,才能确定实际是否达到瓶颈 1946
  • 做个小程序商城大约多少钱_分享小程序商城制作教程 1870

最新评论

  • 2 ClickHouse 存储策略

    CSDN-Ada助手: 有的人说,无论什么样的大数据系统,最后都会变成导出Excel数据系统,你怎么看呢?

  • 解密 openGauss 数据库中的函数依赖关系

    CSDN-Ada助手: 使用分布式 sqlite 能搞大数据不?

大家在看

  • 高级项目经理培训材料|31页PPT
  • 社区团购系统设计/社区团购/系统设计/电商平台/互联网产品/用户体验/用户界面/功能模块/数据流程(源码+LW+调试文档+讲解等)/MySQL/SpringBoot/VueHTML5/Java 620
  • 用Java爬虫API,轻松获取taobao商品SKU信息 691
  • 在使用PyQt5的时候,怎么根据结构体所含的变量个数,自动创建对应lineEidt来接收数据传给结构体 40
  • Java程序员无聊时会做什么--JavaFX和JavaCV写一个自己的桌面应用玩玩,第4章,记录一个AI生成的视频剪辑工具的诞生。视频批量分割,视频批量混剪,视频自动剪辑,小视频批量生成,视频批量转图 282

最新文章

  • 微信优惠券怎么制作
  • 微信商城小程序怎么弄_重塑购物体验
  • 微信小程序报名表怎么弄_轻松打造高效便捷的互动新体验
2024年16篇
2023年20篇
2022年44篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳坪山网站建设公司网站优化有什么忌讳奉贤网站优化seo网站优化怎么做开源网站优化关键词浦东网站优化找哪家新安县网站优化seo齐河网站优化报价郑州网站优化收费多少蚌埠网站优化哪个好江北新区快速网站优化网站内容优化注意什么网站内部优化手册平顶山网站建设优化哪家专业丽江网站优化推广价格静安区专业网站优化定制方案苹果cms网站怎么优化商丘网站自然优化哪家价格便宜苏州相城网站优化郑州网站优化营销方案一个完整的网站优化方案河源网站优化赤峰网站自然优化刷手机搜索网站优化均安网站优化如何律师网站优化的基础网站搜索引擎优化分析阳江设备网站seo优化东莞电子网站优化软件福田门户网站优化方法赵县网站优化seo香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化