Filebeat + Kafka + Elasticsearch + Kibana 实现日志收集与管理(1)_filebeat kafka elasticsearch kibana-CSDN博客

最后

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~

给大家准备的学习资料包括但不限于：

Python 环境、pycharm编辑器/永久激活/翻译插件

python 零基础视频教程

Python 界面开发实战教程

Python 爬虫实战教程

Python 数据分析实战教程

python 游戏开发实战教程

Python 电子书100本

Python 学习路线规划

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

上篇文章介绍了如何在 Django 中优雅的记录日志，这篇来谈谈怎么管理以及查看日志。

说到查看日志，这么简单的事情还值得写篇文章吗？文件已经有了，直接 vim 打开不就完了。话虽如此，但有时候这样做却并不可行。

如果是单台服务器的话，直接查看本地文件也是可以的，再搭配一些 Linux 命令，基本可以快速定位到问题。但现实情况中，我们的服务大部分都是部署在多台服务器上的，如果出现故障，到底是哪台服务器出的问题呢？很难排查，只能逐个登录服务器查看日志，这样做效率就太低了。

所以，必须得有一个集中管理日志的地方，可以把多台服务器上的日志汇总到一起。这样如果出现故障，我们到日志集中管理平台上一查，就可以快速定位到问题，并且可以确切的知道具体是哪台服务器出现了问题，何乐而不为呢？

这篇文章主要就是来解决这个问题。

怎么解决呢？说来也简单，因为已经有一套非常成熟的日志分析框架了，叫 ELK，而且在各大互联网公司都有成功的应用实践，网上资料也很多。

由于公司里面已经有一套日志分析框架了，所以，这件事情对我来说就更简单了，我只需要把日志内容发出去就好了。

在这里，我没有用 Logstash，而是用了更轻量的 Filebeat，配置起来也更方便。

Filebeat 日志源配置：

filebeat.inputs:

Each - is an input. Most options can be set at the input level, so

you can use different inputs for various configurations.

Below are the input specific configurations.

type: log

Change to true to enable this input configuration.

enabled: true

Paths that should be crawled and fetched. Glob based paths.

paths:

/log/error.log

这三行可以将 json 内容解析成键值对的形式，否则会将全部 json 内容放到一个 message 字段里

json.keys_under_root: true

json.add_error_key: true

json.overwrite_keys: true

Filebeat 发送到 Elasticsearch：

#==================== Elasticsearch template setting ==========================

setup.template.name: “weblog”

setup.template.pattern: “weblog_*”

setup.template.overwrite: false

setup.template.enabled: true

setup.template.settings:

index.number_of_shards: 1

#-------------------------- Elasticsearch output ------------------------------

output.elasticsearch:

hosts: [“127.0.0.1:9200”]

按月建索引

index: “weblog_%{+YYYY.MM}”

Protocol - either `http` (default) or `https`.

protocol: “https”

Authentication credentials - either API key or username/password.

api_key: “id:api_key”

username: “elastic”

password: “changeme”

配置发送到 Elasticsearch 时候出现一个问题，花了很长时间才解决，问题如下：

(status=404): {“type”:“type_missing_exception”,“reason”:“type[doc] missing”,“index_uuid”:“j9yKwou6QDqwEdhn4ZfYmQ”,“index”:“secops-seclog_2020.04.16”,“caused_by”:{“type”:“illegal_state_exception”,“reason”:“trying to auto create mapping, but dynamic mapping is disabled”}}

网上查找资料，大部分给出的解决办法都是配置 document_type，但是我用的 Filebeat 是 5.6 版本，这个参数已经取消了，无奈只能另找办法。

最后，就在我已经快要放弃的时候，通过把 Elasticsearch template type 改成 doc，而不是用自定义字段，解决了这个问题。

而且我发现一个很奇怪的现象，那就是总能在快要放弃之时找到解决问题的办法，所以多坚持一下还是很有必要的。

发送到 Elasticsearch 之后，就可以通过 Kibana 从页面来查询数据了，但这样做并不是最好的办法。更通用的架构是，先把数据发送到数据总线 Kafka，然后通过消费者程序来消费 Kafka 里的数据，最后入库到 Elasticsearch 或者其他存储组件。

Filebeat 发送到 Kafka：

output.kafka:

hosts: [“kafka1:9092”]

topic: ‘web-log’

username: ‘XXX’

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习