elasticSearch常见的面试题

常见的面试问题

描述使用场景

es集群架构3个节点,根据不同的服务创建不同的索引,根据日期和环境,平均每天递增60*2,大约60Gb的数据。

调优技巧

原文参考: 干货 | BAT等一线大厂 Elasticsearch面试题解读 - 掘金

设计阶段的调优
  1. 根据业务增长的需求,采取日期模版创建索引,通过roll over API实现滚动索引

定义条件,生成新的索引,但都指向一个别名

https://juejin.cn/post/6959744054905012231

  1. 根据别名对索引进行管理

  2. 凌晨对索引进行force_merge操作,释放空间

合并Lucene索引在每个分片中保存的分段数,强制合并减少分片中的分段数量

https://blog.csdn.net/weixin_43820556/article/details/122986027

  1. 冷热分离机制,热数据放在SSD,冷数据定期shrink操作,缩减存储

删除副本,只读索引,减少主分片的数量

https://blog.csdn.net/UbuntuTouch/article/details/109004225

  1. 使用curator进行索引的生命周期管理

对索引和快照进行管理,配置规则,定时任务调用

https://cloud.tencent.com/developer/article/1382110

  1. 仅针对需要分词的字段,选用合适的分词器

  2. Mapping阶段充分结合各个字段的属性,是否要检索、存储

写入调优
  1. 写入前refresh_interval=-1

默认情况下索引的refresh_interval为1秒,这意味着数据写1秒后就可以被搜索到,每次索引的 refresh 会产生一个新的 lucene 段,这会导致频繁的 segment merge 行为,如果你不需要这么高的搜索实时性,应该降低索引refresh 周期

  1. 采用bulk批量写入

  2. 使用自动生成的id

写入 doc 时如果是外部指定了 id,es 会先尝试读取原来doc的版本号, 判断是否需要更新,使用自动生成 doc id 可以避免这个环节

查询调优
  1. 禁用批量terms(分页)
  2. 数据量大时,先基于时间范围检索
  3. 充分利用倒排索引机制,keyword查询
  4. 合理的路由机制

索引数据多的调优和部署

动态索引

基于模板+时间+rollover api 滚动创建索引

存储层面

冷热数据分离存储,冷数据force_merge+shrink压缩

部署层面

合理的前期规划,动态增加节点缓解集群压力

master选举机制

基本前提
  1. 候选主节点才能成为主节点
  2. 最小主节点数防止脑裂
选举流程

索引文档流程

在这里插入图片描述

文档获取分片

文档id计算目标分片id

shard = hash(_routing) % (num_of_primary_shards)
shigen01
关注 关注
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
写文章

热门文章

  • python优雅地爬虫 8643
  • python爬虫 压箱底的笔记 4906
  • numpy的使用习题集 4027
  • 通过 Python+Nacos实现微服务,细解微服务架构 2710
  • mybatis-plus使用拦截器实现sql完整打印 2618

分类专栏

  • python 15篇
  • Java后端 8篇
  • 前端 3篇
  • 设计 1篇
  • spring boot 4篇
  • 大数据 1篇
  • pandas 1篇
  • macos 1篇
  • Java学习资料 9篇
  • Java多线程 5篇
  • Java疑难 4篇
  • Java反射 3篇
  • 数据挖掘与处理 5篇
  • 网络爬虫 4篇
  • 反射出现的异常 3篇
  • python排序 1篇
  • linux服务与管理 1篇
  • SSM整合 1篇
  • ajax异步 1篇

最新评论

  • 当一个程序员的博客突然变少

    普通网友: 支持一下,细节很到位!【我也写了一些相关领域的文章,希望能够得到博主的指导,共同进步!】

  • 通过 Python+Nacos实现微服务,细解微服务架构

    slongshen: 能不能提供下源码呀,谢谢

  • mybatis-plus使用拦截器实现sql完整打印

    征途黯然.: mybatisplus使用拦截器实现sql完整打印 article is great, thank you for sharing!表情包

  • 后端字典的优雅设计

    香辣奥利奥: 听君一席话,如听一席话表情包

  • mybatis-plus使用拦截器实现sql完整打印

    全栈小5: 博主这篇文章内容很不错,结构清晰,思维活跃,具有条理性可以借鉴并学习和落地,内容丰富图文详细,认真看完收获很大,学习了,期待博主更多的好文章。支持【mybatis-plus使用拦截器实现sql完整打印,博主这篇文章,值得一看】

大家在看

  • HONEYWELL处理卡EL111849
  • shell中比较两个文件脚本实例讲解
  • 数字信息压缩
  • 每日一题:Leetcode-85 最大矩形 253
  • 缓存穿透/击穿/雪崩(附生产BUG)

最新文章

  • python将照片集导出成视频
  • 借助spring的IOC能力消除条件判断
  • 巧用switch-case消除条件判断
2024年37篇
2023年105篇
2022年1篇
2021年30篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳坪山网站建设公司seo网站优化方案网站先诊断再优化咸阳网站优化济宁市谷歌网站优化建邺区中小型网站优化好吗廊坊推荐网站推广优化丰南专业的网站优化黄岛优化网站公司巩义百度网站优化价格表鄂州洛阳网站优化seo优化哪个网站最好网站优化原创文章东莞专业网站优化多少钱移动网站优化点击软件上海网站长尾关键词优化扬州广陵优化网站哪家好固安企业网站seo优化如何知道网站优化代码做优化用什么网站模板四川品质网站优化产品介绍便宜的优化网站惠州网站综合优化费用多少牟平区品牌网站优化公司哪家网站优化好杭州网站优化推广海安市网站关键词优化厂家黑龙江网站优化汉阳网站优化推广公司哪家最好遵义网站优化好吗网站优化优质商家香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化