最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[综合] 如何做一次Elasticsearch技术分享?

[复制链接]
跳转到指定楼层
楼主
发表于 2019-7-3 11:38:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
0、问题引出

经群讨论,建议从以下几个方面展开,大家有好的想法,也欢迎留言交流。

1、可视化展示ELK效果

如果条件允许,demo的内容是:通过logstash 同步日志或数据库(Oracle、mysql)表的数据到 Elasticsearch,然后通过kibana进行可视化。

  • 1 通过Canvas对数据进行可视化布局与展现,可以实现非常酷炫的大屏展示效果。

  • 2 展示实时数据的数据量。

  • 3 展示你定的几个维度的数据信息。


这么切入的目的:很直观,很明显,很接地气。用到ELK技术栈的内容,有 带动性 ,让参与的同事不犯困且很容易让大家对它产生兴趣。

2、 Elk stack大家族简介

考虑到不同受众关注点不同。结合业务的数据的特点,从输入、中间处理、存储&检索、分析等全数据流环节展开。

2.1 输入

Elastic 支持的输入包含但不限于:

  • 日志类数据:类log4j.log,apache log等,可借助 beats或logstash同步

  • 关系型数据库:mysql oracle pgsql等

  • 非关系型数据库:mongodb redis等

  • 实时数据流:flink Spark kafka hdfs等

  • 大数据hadoop hdfs等


此处的不同数据的导入,Lostash有丰富的input/output插件,支持N多不同数据源接入,估计同事也会 眼前一亮 。

2.2 中间处理ETL基础数据很可能是 异构

的数据,中间的ETL非常重要。

logstash filter、elasticsearch ingest 都具备ETL功能。


2.3 存储&检索

基于合理的数据建模,在Elastic落地存储,Elastic提供全文检索、数据聚合等。

2.4 分析

强调一下,kibana的可视化和监控功能。

2.5 ELKB认知

Elastic Stack数据平台由Logstash、Beats、ElasticSearch和Kibana四大核心产品组成,在数据摄取、存储计算分析及数据可视化方面有着无可比拟的优势。

  • E = Elasticsearch,在存储、计算和分析方面,ElasticSearch允许执行和合并多种类型的搜索,解决不断涌现的各种用例,并具有极高的可用性及容错性,充分保障集群安全。

  • L = Logstash, Logstash 是开源的 服务器 端数据 处理管道 ,可同时从多个来源采集、转换数据,并将数据发送到存储库中。

  • K = Kibana,Kibana作为用户界面的核心,集成了丰富的可视化工具、界面交互开发 工具 和管理工具,帮助开发人员将数据轻松分享给任何人,甚至还能通过机器学习来监测数据中的隐藏异常并追溯其来源。

  • B = Beats,Beats作为轻量级的数据搬运工,集合了多种单一用途数据采集器,将数据发送给Logstash或ElasticSearch,其可扩展的框架及丰富的预置采集器将使工作事半功倍。


以上,主要从大而全的维度,讲解ELK,给大家带来全景认知。

以这四大核心产品为基础构建的Elastic数据平台实现了数据实时性、相关性及扩展性的完美结合,不仅可以处理各种数据,还能深入挖掘数据的内在关联并迅速呈现,彻底解决企业的 大数据实时处理难题 。

3、 Elasticsearch 是什么?

展示的过程中:可以通过kibana的dsl进行展开的讲解。注意例子:可以提前准备好,规划好时间,不用现场敲代码。

此时可以借助head插件或者kibama-dev讲解。

3.1 Elasticsearch的组成

如果是集群部署的更好。
讲解内容包括:

  • 集群、

  • 索引、

  • 分片、

  • 副本、

  • 分段、

  • 倒排索引。

  • ES的底层是lucene等。


3.2 Elasticsearch分布式可扩展的特性

强调Elasticsearch可以支持PB级别甚至更高级别数据量的存储。

3.3 强调Elasticsearch 特点
  • 简单的restful api,天生的兼容多语言开发。

  • 分布式的实时文件存储,每个字段都被索引且可用于搜索。

  • 分布式的实时分析搜索引擎,海量数据下近实时 秒级 响应。

  • 易扩展,处理PB级结构化或非结构化数据。


4、 Elasticsearch 能做什么?4.1 全文检索等

其实也可以类比一下mysql,强调一下:关系型 数据库 一些检索是做不到的。

对比的目的:因为大家都熟悉关系型数据库,这样能够

加深理解 。

也可以类比下Google,百度等传统的搜索引擎。告诉同事,其实他们可以做的功能我们都可以做。比如:全文检索,高亮,分页,统计聚合,高级检索等。

检索的分类:

  • 精确匹配。

  • 模糊检索。

  • 正则检索。

  • 强调全文检索。强调他的快。基于倒排索引实现。
    等等。


检索类型可以画一个脑图。
其实可以,举个例子。演示一下最好。

4.2 聚合分析

这里也可以举一下例子。
比如:对比一下mycle的group by,limit等功能点讲解。
聚合的分类很多,可以抽几个进行讲解。

4.3 应用场景
  • 记录和日志分析

  • 采集和组合公共数据

  • 全文搜索及个性化推荐

  • 事件数据和指标

  • 数据可视化


5、Elasticsearch 极易上手且性能牛逼

主流的 Java 、 python 、 ruby 等。C++等也有个人开源维护API。

可以借助他山之石,把其他公司的应用场景、对应的硬件资源、写入、查询、QPS等性能指标展示出来,凸显牛逼功能和性能。

6、Elastic 前景光明

Elasticsearch在DBRanking 数据库排行榜搜索引擎部分近几年一直处于第一名的领先优势。

基于Elastic的分布式、可扩展性、良好的性能,BAT、滴滴、美团、小米、华为、携程、360、有赞等 几乎所有的主流互联网公司甚至婚庆网站的搜索引擎已经都已经转成ES了。

那么咱们公司还在犹豫什么呢?

7、Elastic技术社区非常活跃

这里主要强调,出了问题也 不用怕 ,一个人搞不定,还有国外、国内官方论坛、社区,基本很短时间都能解决问题。

交流的高效性、问题解决的速度、github迭代更新的速度。以及最近的版本更新的速度:比如7.0的发布,7.0的新特性。大家也会对新的特性充满期待。速度提升快。

估计讲完这些大家都会 跃跃欲试 了。

8、Elasticsearch 相对薄弱的环节

有所为,有所不为。

8.1 多表关联

不能简单认为,将 mysql 同步到Elasticsearch就能解决问题了。

我们除了看到基于倒排索引Elasticsearch的全文检索的强大,也要看到Elasticsearch对于关系型数据库多表关联的支持相对薄弱,nested类型、Join类型的多表关联操作大数据场景下都会有性能问题。

8.2 深度分页

从性能角度考虑,Elasticsearch默认支持10000条数据的返回,除非修改max_result_window参数。

也就是会出现越往后翻页越慢的情况。这点,补救方案:scroll+scroll_after实现。

但是,更长远角度,建议:参考Google、百度的深度分页实现。

8.3 实时性

Elasticsearch是 近实时 的系统,不是准实时。受限于:refresh_inteval设置,有最快1s延时。

准实时要求高的场景,建议选型注意。

9 小结

ELK远不止文章中提到的这些内容,可以说,以上列举的只是 冰山一角 的点,N多底层原理(索引分片原理、写入原理、检索原理、倒排索引原理、高可靠性原理、大数据实战场景等)都没有提及或展开。

来源: 铭毅天下


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-6-2 06:01

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表