# frostmourne **Repository Path**: blysin/frostmourne ## Basic Information - **Project Name**: frostmourne - **Description**: frostmourne是基于Elasticsearch, InfluxDB数据的监控,报警,分析系统. Monitor & alert & alarm & analyze for Elasticsearch && InfluxDB Log Data - **Primary Language**: Java - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 127 - **Created**: 2022-05-06 - **Last Updated**: 2022-05-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## [Github地址](https://github.com/AutohomeCorp/frostmourne) | [Gitee地址](https://gitee.com/tim_guai/frostmourne) ## 介绍 frostmourne(霜之哀伤)是汽车之家经销商技术部监控系统的开源版本,用于帮助开发监控应用日志,现主要用于监控Elasticsearch数据。 关于内部日志系统的设计实现感兴趣的话,请移步文章: 之家经销商技术部基于Elasticsearch的日志系统设计与实现 可以认为frostmoure是监控部分的实现。 如果你现在使用Elastic stack(ELK)建立起了日志系统,却苦恼于没有一个配套日志监控系统,也许它能帮到你。 ### 项目初衷 在用ELK建立起日志系统之后,我们发现应用日志监控这块除了ElastAlert之外,没有其他方案。我们初期使用ElastAlert来解决日志监控的问题, 但是随着配置的增加,不仅管理成本和使用成本较高,稳定性方面也不能让我们满意,所以为了更好的易用性,稳定性,我们决定自己做一套简单的监控系统, 来解决日志监控的问题。如果你面临和我们同样的问题,不妨一试。 但是项目并不仅限于elasticsearch数据,还有HTTP数据监控,InfluxDB数据监控,Mysql数据监控, ClickHouse数据监控,后面还会加入更多的常用数据源(如:prometheus, skywalking, iotdb, loki等)纳入监控范畴,需要做的东西还有很多,需要更多相关开发加入进来,欢迎联系我们,一起做大做强。 ## 主要功能 * 只需要写一条数据查询就可以轻松搞定监控 * 多种数据源(Elasticsearch, InfluxDB, Mysql/TiDb, ClickHouse)支持 * 多种数值计算类型监控(count,min,max,avg,sum,unique count,percentiles,standard deviation) * 支持数据分桶统计 * 多种报警消息发送方式(email,短信,钉钉(机器人),企业微信(机器人), WebHook, 飞书机器人) * 消息支持多种格式(text, markdown) * 灵活的报警消息freemarker模板定制,支持变量;消息模板管理 * 分布式调度实现,每个监控都是独立调度,互不影响 * 报警消息附带日志查询短链接,直达报警原因 * 数值同比监控 * HTTP数据监控, js表达式判断是否报警 * UI功能,简单易用(监控管理,测试,另存。执行日志,历史消息)。 * Elasticsearch数据查询,分享,下载 * 报警消息抑制功能,防止消息轰炸 * 自带账号,团队,部门信息管理模块,也可自己实现内部对接 * 集成LDAP登录认证 * 权限控制,数据隔离,各团队互不影响 ## 功能截图展示 报警效果图如下: 查看完整功能截图展示 ## 功能使用指南 * Elasticsearch数据监控指南 * HTTP监控使用说明 * InfluxDB数据监控指南 * Mysql数据监控指南 * Clickhouse数据监控指南 * 数值同比监控使用指南 * 消息模板配置 * 报警发送 * 报警抑制 * 用户管理和登录认证 * 注意事项 * 其他 ## 在线demo 为了更快的理解本项目的作用,提供了一个接口全mock的静态站点供大家预览功能: 在线demo 在线demo更新不及时,请以项目实际运行效果为准,demo只是用于快速浏览 ## 快速启动 提供docker-compose方式,让你更快运行起来便于更好理解项目作用。 详细请看文档:Quick-Start ## 部署 #### 预备环境准备:Mysql数据库表创建 > frostmourne所有表的创建语句都在[frostmourne.sql](./doc/mysql-schema/frostmourne.sql)文件中。 数据库密码默认使用明文,没有加密策略,如果你需要对密码进行加密,请参考druid官方文档:[druid数据库密码加密](https://github.com/alibaba/druid/wiki/%E4%BD%BF%E7%94%A8ConfigFilter) #### 一、k8s部署方式 k8s部署参考以下三个配置文件 * [frostmourne-monitor-namespace.yaml](./doc/docker/k8s/frostmourne-monitor-namespace.yaml) * [frostmourne-monitor-deployment.yaml](./doc/docker/k8s/frostmourne-monitor-deployment.yaml) * [frostmourne-monitor-service.yaml](./doc/docker/k8s/frostmourne-monitor-service.yaml) 相关参数在 frostmourne-monitor-deployment.yaml 文件里配置。需要注意的是在frostmourne-monitor-service.yaml里指定对外映射端口,默认nodePort=30054 ```bash kubectl applt -f frostmourne-monitor-namespace.yaml kubectl applt -f frostmourne-monitor-deployment.yaml kubectl apply -f frostmourne-monitor-service.yaml ``` #### 二、zip包部署方式 依赖环境 * JDK 1.8 * Mysql 5.7.8+ 需要将zip包解压,zip包下载地址:frostmourne-monitor-0.6.2-SNAPSHOT.zip ;然后根据自己的 环境修改应用配置文件application.properties文件和环境变量配置文件env,然后执行如下命令启动: ```bash ./scripts/startup.sh ``` 执行如下命令停止应用: ```bash ./scripts/shutdown.sh ``` #### 三、自构建部署方式 依赖环境 * JDK 1.8 * Maven 3.2.x+ * Mysql 5.7.8+ 在项目frostmourne主目录下执maven构建命令: ```bash mvn -U clean package -DskipTests=true ``` UI项目frostmourne-vue会自动把资源构建到frostmourne-monitor的resources/dist下,所以你只需要部署frostmourne-monitor。 frostmourne-monitor已经配置了assembly打包,target目录下会生成zip包,你只需要将zip包解压,然后根据自己的 环境修改应用配置文件application.properties文件和环境变量配置文件env,然后执行如下命令启动: ```bash ./scripts/startup.sh ``` 执行如下命令停止应用: ```bash ./scripts/shutdown.sh ``` ## 开发调试 调试环境要求 * JDK 1.8 * Node 16.14.2 (推荐) * Yarn 1.22.10 (推荐) 或 Npm 8.7.0 * Mysql 5.7.8+ * Elasticsearch 6.3.2+ 启动frostmourne-monitor项目, 启动参数增加: ``` -Dmysql.host=localhost -Dmysql.user=root -Dmysql.password=example -Dlog.console.level=INFO ``` mysql相关参数修改为自己环境的,active profile设置为local, 测试地址: http://localhost:10054 使用VS Code打开frostmourne-vue目录,进行UI调试。执行如下命令: ```bash # install dependency yarn install # 建议不要直接使用 cnpm 安装以来,会有各种诡异的 bug。可以通过如下操作解决 npm 下载速度慢的问题 yarn install --registry=https://registry.npm.taobao.org # develop yarn dev ``` 会自动打开: http://localhost:9528 搭建本地开发调试环境或者需要做二次开发遇到什么困难的都可以加群沟通,欢迎各路英雄多多PR ## 发版历史 [ReleaseNotes](./ReleaseNotes.md) ### 技术说明 项目基于Java实现,详细请看:[技术说明](./doc/wiki/technical.md) ## 后续规划 目前已知的规划有: * ~~发布0.6.2-RELEASE~~ [2022-05-05] * ~~改进消息静默功能:添加静默判断表达式,对报警事件数据和静默时间内的事件数据指定字段对比。这样可以避免漏报同时防止报警消息过多。~~ [2022-05-05] * 解决邮箱报警不支持ssl的问题 * 增加ping监控报警,一个监控最多监控10个ping。 * doc: 增加已注册公司图标列表 * mysql, influxdb, clickhouse监控增加表达式监控规则 * Elasticsearch数据名增加kibana链接配置,在数据查询页面增加kibana地址跳转链接,方便将数据查询切换至kibana * Elasticsearch监控数值实现环比监控 * 短信报警方式实现,默认用阿里云短信实现 * 增加邮箱在线配置页面功能 * 增加企业微信在线配置页面功能 * 将短链接id以16进制格式展示,解决id数字很大的时候较长的问题 * 增加邮箱在线配置页面功能 * 增加消息内容长度配置,超过长度配置部分将被截掉 * 增加本项目内程序日志采集至mysql并提供查询页面,方便排查问题和监控 * 员工换组增加是否迁移监控至新组的选项,如果勾选将该员工创建的监控也转移至新组 * 增加报警组支持 * 增加监控转组功能 * Elasticsearch数据名增加traceid字段配置,可以配置跳转链接。例如: 配置skywalking的链接将跳转到skywalking对应的调用链 * 增加[prometheus](https://github.com/prometheus/prometheus)数据监控报警支持 * 增加[skywalking](https://github.com/apache/skywalking)数据监控报警支持 * 增加[iotdb](https://github.com/apache/iotdb)数据监控报警 * 增加[loki](https://github.com/grafana/loki)数据监控报警 * influxDB数据查询除了返回数值,另外返回最新一个point详细数据用于报警消息模板 * 增加influxDB数据查询页面 * influxdb数据监控增加短链接,跳转到influxdb数据查询页面 * 监控列表增加"执行日志"操作按钮,点击跳转到对应监控执行日志列表页 * 增加时序数据历史数据比较规则 * 监控增加报警消息允许发送时间段设置,非允许发送时间段内消息将只记录不发送,发送状态为FORBID * 增加企业钉钉发消息默认实现(本地没有环境,需要帮助,欢迎PR,或者提供示例代码,先行谢过) * 更多报警方式补充(欢迎PR) * 后端接口增加数据校验并返回合适的提示信息 * 监控列表增加一个开关选项,只显示我的监控 * 监控调度配置后显示预计调度时间 * Elasticsearch数据名配置时自动提示索引名称 * 数据源增加连接测试功能 * 增加监控模板功能:可以创建多个变量,变量名用于填写监控模板,保存时将变量名替换为变量值, 基于监控模板创建监控只需要填写变量值即可,基于模板一次可以创建多个监控。 * 国际化 * 发布1.0-RELEASE * 增加frostmourne程序日志格式采集方案 * 增加frostmourne程序日志查询和分析功能 * 3-sigma离群点检测报警规则 * 加入时序数据异常检测算法规则(需要实验可行性,欢迎有相关经验的同僚联系) * 总结项目用到的知识点 ## 1.0-RELEASE核心Feature后续计划 * elasticsearch主流版本6,7,8支持 * 静默功能优化 * prometheus数据监控支持 * 报警升级功能 * msyql, influxdb, clickhouse监控增加表达式监控规则 * ping命令监控 * 增加本项目内程序日志采集至mysql并提供查询页面,方便排查问题和监控 * elasticearch数据配置支持数据分桶,分桶类型支持两种:1. 按字段值分组,相当于ES里的Terms Aggregation; 2. 按时间分组,相当于ES里的DateHistogramAggregation * Elasticsearch监控数值实现环比监控 ## Contributors [@menong-chen](https://github.com/menong-chen) [@fox2zz](https://github.com/fox2zz) [@xyzj91](https://github.com/xyzj91) [@wxmclub](https://github.com/wxmclub) [@wuaping](https://github.com/wuaping) ## 致谢 - [springboot](https://github.com/spring-projects/spring-boot) - [vue](https://cn.vuejs.org/index.html) - [vue-admin-template](https://github.com/PanJiaChen/vue-admin-template) - [xxl-job](https://github.com/xuxueli/xxl-job) - [element ui](https://element.eleme.cn/#/zh-CN) - [45短网址](https://45dwz.cn/) - [jjwt](https://github.com/jwtk/jjwt) - [mybatis-dynamic-sql](https://github.com/mybatis/mybatis-dynamic-sql) - [JetBrains](https://www.jetbrains.com/) ## License The project is licensed under the [MIT](LICENSE). ## 如何参与贡献 如果你觉得这个项目对你有所帮助想有所回馈,非常欢迎参与贡献。可以通过如下方式: * 从后续规划里选择合适的任务提交PR * 对文档进行必要补充 * 部署本项目使用起来并通过[issue#17](https://github.com/AutohomeCorp/frostmourne/issues/17)告知 * 帮忙扩散推广 * 在issue提出你的宝贵建议 * 加入交流群,解答交流问题。群内会不定时发布项目更新说明 * 开源不易,需要鼓励 * [代码规范说明](./doc/wiki/code_format.md) ## 联系我们 有问题或需要帮助请提issue或者加入QQ群: 1082617505,请优先选择提issue,便于问题的讨论和记录追踪,也方便有类似问题的伙伴搜索解决。 也欢迎对项目感兴趣的同僚加群沟通。 特别提一下:关于文档觉得哪里写的不通畅,不好理解,或者有哪方面缺失,都欢迎提issue。 ## 项目事记 * 2019-12-16: 发布github * 2020-06-14: 发布gitee * 2020-07-02: 合并第一个PR * 2020-07-04: 被elastic中文社区收录 [Elastic日报988期](https://elasticsearch.cn/article/14018) * 2020-07-13: github项目设置为私有,丢失82个star,29个fork * 2020-07-15: 重新公开github * 2020-08-23: 上gitee推荐 * 2020-08-27: gitee star破百 * 2020-10-12: github star破百 ## Stargazers over time [![Stargazers over time](https://starchart.cc/AutohomeCorp/frostmourne.svg)](https://starchart.cc/AutohomeCorp/frostmourne)