品牌 资讯 搭配 材料 时尚 热点 行业 首饰 玉石 行情

大数据Flink进阶(十一):Flink History Server配置使用

2023-04-10 01:12:04 来源:腾讯云

Flink History Server配置使用

基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应任务的统计信息,这些统计信息在生产环境中对我们来说非常重要,可以知道一个任务异常挂掉前发生了什么,便于定位问题。

当基于Standalone session模式提交相应任务时,集群重启后我们没有办法查看集群之前运行任务的情况,如果是基于pre-job方式提交任务,任务执行完成之后,那么相对应的统计信息也不会保存,基于Yarn运行的Flink任务也是一样道理。这样对于我们查看先前Flink作业统计信息或参数带来了不便。Flink中提供了History Server 来解决这个问题,可以在任务执行完成后保留相应的任务统计信息,便于分析和定位问题。


(资料图片仅供参考)

History Server 允许查询由JobManager归档的已完成作业的状态和统计日志信息。已完成的作业归档由JobManager上传持久化到某个路径下,这个路径可以是本地文件系统、HDFS、H3等,History Server 可以周期扫描该路径将归档的Flink任务日志恢复出来,从而可以查看相应Flink任务日志情况。

一、Standalone History Server配置与验证

1、配置

在Standalone中配置History Server 服务需要选择一台节点当做History Server ,这台节点可以是JobManager/TaskManager节点,也可以是Standalone集群外的一台节点,这里选择node4节点作为Flink History Server 节点。Standalone配置HistoryServer 服务步骤如下:

1.1、在JM 和 TM 节点上配置 flink-conf.yaml

在Flink Standalone JobManager和TaskManager节点上配置flink-conf.yaml文件,指定Flink完成任务持久化的路径,这里选择HDFS目录作为任务日志持久化保存目录。在node1、node2、node3节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,加入以下配置。

#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/

Flink会根据以上配置连接HDFS 目录存储任务数据,所以需要在node1、node2、node3节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile

1.2、在History Server 节点上配置 flink-conf.yaml

在node4节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,加入如下配置,配置HistoryServer。

#Flink History Server 节点historyserver.web.address: node4#Flink History Server 端口historyserver.web.port: 8082#Flink History Server 恢复任务的目录historyserver.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔(毫秒)historyserver.archive.fs.refresh-interval: 10000

Flink会根据以上配置连接HDFS目录恢复任务数据,这里要求"historyserver.archive.fs.dir"参数配置需要与Flink各个节点上配置的"jobmanager.archive.fs.dir"参数路径保持一致。此外,需要在node4节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

# vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效[root@node4 ~]# source /etc/profile

1.3、启动 Flink 历史日志服务器

在node4节点上启动Flink History Server

#启动Flink 历史日志服务器[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./historyserver.sh start

2、验证

History Server 启动后,可以通过https://node4:8082 来访问历史日志服务页面。

我们可以通过向Standalone集群中提交任务来验证History Server是否能正常展示运行Flink任务的统计信息,步骤如下:

2.1、启动 Standalone 集群

[root@node1 ~]# cd /software/flink-1.16.0/bin/[root@node1 bin]# ./start-cluster.sh

2.2、提交任务

向Flink集群中提交任务,任务还是选择读取Socket端口数据实时统计WordCount。首先在node5节点上启动socket服务:

[root@node5 ~]# nc -lk 9999

在node4 客户端提交Flink任务(可以在任意节点提交Flink任务),命令如下:

[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./flink run -m node1:8081 -c com.mashibing.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar

提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录,当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。

2.3、取消任务并查看历史日志

在node5节点向Socket 9999端口输入一些数据:

hello,ahello,bhello,chello,d

然后在Flink WebUI中取消当前任务:

取消任务后可以在"hdfs://mycluster/flink/completed-jobs"目录中看到取消任务的信息:

当任务取消后,也可以停止Flink集群,Flink集群重启后先前的任务统计信息不会展示,可以登录Flink历史日志服务器查看先前任务统计信息:

注意:在取消任务或者停止Flink集群后,需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。

二、Yarn History Server配置与验证

1、配置

Flink基于Yarn运行时,当Flink任务形成的集群停止后,无法看到对应任务的统计信息,也可以通过配置History Server来实现基于Yarn的Flink集群停止后查看任务的统计信息。

这里选择node5节点为History Server,基于Yarn运行Flink任务配置HistoryServer服务步骤如下:

1.1、在node5 节点上配置 flink-conf.yaml

在node5节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,最后配置以下配置项。

#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History 服务器地址historyserver.web.address: node5#HistroyServer WebUI 访问端口historyserver.web.port: 8082#HistoryServer历史日志服务恢复任务信息目录historyserver.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔(毫秒)historyserver.archive.fs.refresh-interval: 10000

Flink会根据以上配置连接HDFS 目录存储任务数据,所以需要在node5节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile

1.2、启动 Flink 历史日志服务器并访问

在node5节点上启动Flink History Server

#启动Flink 历史日志服务器[root@node5 ~]# cd /software/flink-1.16.0/bin/[root@node5 bin]# ./historyserver.sh start

访问历史日志服务地址:https://node5:8082

2、验证

在node5节点基于Yarn提交Flink任务来验证History Server是否能正常展示执行完成的Flink任务统计信息。步骤如下:

2.1、向Yarn 集群中提交 Flink任务

向Yarn集群中提交Flink任务,任务还是选择读取Socket端口数据实时统计WordCount。在node5节点启动socket服务器:

[root@node5 ~]# nc -lk 9999

在node5节点向Flink集群中提交Flink任务,命令如下:

[root@node5 ~]# cd /software/flink-1.16.0/bin/# 提交Flink任务[root@node5 bin]#./flink run-application -t yarn-application -c com.lanson.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar

提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录,当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。

2.2、取消任务并查看历史日志

在node5节点向Socket 9999端口输入一些数据:

hello,ahello,bhello,chello,d

然后登录Yarn(https://node1:8081) WebUI,找到提交的任务取消对应Flink任务:

取消任务后可以在"hdfs://mycluster/flink-yarn/completed-jobs"目录中看到取消任务的信息:

登录Flink历史日志服务器查看取消任务统计信息:

注意:在取消任务或者停止Flink集群后,需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。

标签:

(责任编辑:)

相关文章

大数据Flink进阶(十一):Flink History Server配置使用

​基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应任务的统计信息,这些统计信息在生产环境中

2023-04-10 01:12:04

福彩3D23089期赏析:真正的成功需要的是长期的坚持和不断的努力

​在生活中,我们经常会向那些在自己领域内取得成功的人看齐,渴望自己也能像他们一样光彩夺目。然而,成功的背后往往是长期的坚持和不断的努力

2023-04-09 21:38:19

焦点速讯:给老师送的花

​老师的生日到了,送花给老师一般就是白色康乃馨搭配百合,代表着尊敬之情,其他的花材有不同的含义,其他的含义就是一束适合于老

2023-04-09 21:12:04

焦点热文:北汽旗下多款汽车在俄销售工作将在几周内陆续展开 新车预购已开始

​据俄新社记者报道,俄罗斯北汽(BAIC)汽车首家4S店-BAICMajor在莫斯科开业。中国北汽集团俄罗斯公司总经理里

2023-04-09 19:49:05

环球快看点丨美畅股份:2023年一季度业绩预增30%-41%

​美畅股份披露一季度业绩预告。公司预计2023年一季度归属于上市公司股东的净利润37,000万元-40,000万元,比上年同期增长29 99%-40 53%。公司表

2023-04-09 17:57:17

转会市场即将关闭皇马引进姆巴佩的事情仍然没有进展-环球快播报

​转会市场即将关闭,皇马引进姆巴佩的事情仍然没有进展,现在可以说希望越来越渺茫。卡塔尔王室成员哈里发·本·哈马德·阿勒萨尼在社交网站...

2023-04-09 16:09:21

0.01秒,深夜救援!绍兴一男子欲跳楼轻生……

​去年4月诸暨市公安局巡特警大队辅警黄柏川不顾自身安危凌晨跳入江中挽救了一条鲜活的生命危急时刻!巡特警从20米桥上纵身一跃,挽救一条生命今

2023-04-09 14:49:10

四月剧集繁茂 《爱情而已》《无间》等多题材热播

​中新网北京4月9日电(记者高凯)从都市爱情剧《爱情而已》到年代谍战剧《无间》,4月到来,多类型题材剧于此间热播,内容市场延续开年便呈现出的

2023-04-09 12:48:22

夯实丰收基础搭好丰产架子 全国已春播粮食1亿亩 天天微资讯

​夯实丰收基础搭好丰产架子全国已春播粮食1亿亩---人民网北京4月9日电(记者李栋)据农业农村部最新农情调度显示,截至目前,全国已春播粮食1亿

2023-04-09 10:43:00

全球速看:豫商经济技术开发区:力争一年起步、二年成型、五年兴城

​豫商经济技术开发区:力争一年起步、二年成型、五年兴城

2023-04-09 09:02:09

实力被行业认可!海豹斩获央视“第三届中国汽车风云盛典”最高奖

​提到如今的国产汽车行业,就一个字:“卷”。在我看来这是好事情,各种技术迅速迭代,产品也越来越有竞争力。在这其中,比亚迪属于是不折不...

2023-04-09 07:08:19

从业聘用合同范本(通用11篇)|聚看点

​从业聘用合同范本第1篇甲方:乙方:二、法律顾问的任务和职责范围是:为甲方提供法律咨询,拟制、审查法律合同以及其他法律文本。为甲方内、外

2023-04-09 04:05:49

速读:吉林珲春市进口百万吨煤炭产业园项目跑出建设“加速度”

​吉林珲春市进口百万吨煤炭产业园项目跑出建设“加速度”,近年来,吉林省珲春市以铁路口岸为支点进行的国际贸易愈发频繁。珲春市进口百万吨...

2023-04-08 22:23:32

马特拉齐:当年齐达内说要把球衣给我,我说我更想要你的姐姐

​近日,马特拉齐接受了ItalianFootballTV的采访,对自己与齐达内在2006年世界杯决赛中的冲突进行了回忆,并透露了当时自己与齐达内的对话内容。当

2023-04-08 20:11:03

城厢街道发布“决战亚运”五大行动 天天时快讯

​现场,周胜华致辞并宣布城厢街道“全城健身心心厢融”全民健身活动启动。这五大行动分别为“全城健身·心心厢融”全民健身运动、“护航亚运...

2023-04-08 18:13:55

粉丝用了半年才发现,买的iPhone不是库存机!而是翻新机!

​你有木有想过,自己买的手机可能是翻新机?今天这位粉丝用了大半年才发现自己当初买的iPhoneXR是翻新机,不是原装机。当初商家表示是库存机,

2023-04-08 16:38:43

2023广东深圳市龙岗区公办幼儿园面向全国招聘园长、副园长公告(第一批)|全球观天下

​为进一步加强龙岗区公办幼儿园师资队伍建设,现面向全国公开招聘一批公办幼儿园园长、副园长,具体公告如下:一、招聘岗位公办幼

2023-04-08 14:50:02

篮网连续第五年打进季后赛 跻身联盟目前第五队_资讯推荐

​篮网连续第五年打进季后赛跻身联盟目前第五队,奇才,篮网队,雄鹿队,热火队,76人队,丹佛掘金队

2023-04-08 12:52:33

新消息丨mali g72 mp3怎么样_mali g72 mp3

​大家好,小榜来为大家解答以上的问题。malig72mp3怎么样,malig72mp3这个很多人还不知道,现在让我

2023-04-08 11:02:10

血清素控制视觉信息从眼睛到丘脑的传输 焦点速递

​众所周知,人类会根据他们所处的情况以及他们自己的感受和感觉,以不同的方式感知周围的环境。因此,恐惧、兴奋或饥饿等内部状态

2023-04-08 09:57:17

vue面试题八股文简答大全 让你更加轻松的回答面试官的vue面试题 当前头条

​Vue js是一个流行的JavaScript框架,它使得构建复杂的交互式应用程序变得更容易。Vue js基于MVVM模式设计,采用了响应式数据绑定和组件化的架构

2023-04-08 08:11:45

头条:宁夏2023年上半年中小学教师资格考试面试程序

​宁夏2023年上半年中小学教师资格考试面试程序 网上课程学习请电话咨询:400-622-5005!

2023-04-08 06:19:19

4月7日基金净值:富国中证国有企业改革指数(LOF)A最新净值1.045,涨0.48%

​4月7日,富国中证国有企业改革指数(LOF)A最新单位净值为1 045元,累计净值为1 355元,较前一交易日上涨0 48%。历史数据显示该基金近1个月上涨1

2023-04-08 02:43:27

当前播报:国家药品集采工作计划(20篇)

​国家药品集采工作计划第1篇20xx年采购管理部将围绕集团公司工作主题和指导思想,更新观念,改变思维方式,创新管理手段,认真履行好服务、指导

2023-04-07 22:38:33

华通线缆:刘宽清及一致行动人近期减持1.22%公司股份,合计不再是公司持股5%以上股东 全球播报

​华通线缆4月7日公告,公司于4月6日收到公司股东刘宽清及其一致行动人张会志、宁波泽链通、宁波泽旺发来的《股份减持进展情况

2023-04-07 20:54:12

重点聚焦!马力刺客|混动车上马力机 被刺竟是我自己

​我原来想三台车都上马力机,是不是很大胆?一挡混动、两挡混动、三挡混动,都拉马力。就那一个坐标系,就完全是那个坐标系,放三条曲线,一目

2023-04-07 19:48:42

世界百事通!腾讯QQ Windows全新架构版9.8.1灰度内测发布

​IT之家4月7日消息,据IT之家网友反馈,腾讯WindowsQQ全新架构版迎来了9 8 1 11665灰度内测,本次需要登录资格,没有报名W

2023-04-07 18:40:55

全球微资讯!打着"修复"幌子非法采矿 涉世老板被判刑四年六个月

​正义网烟台4月7日电(记者郭树合通讯员曲冠宇)白天削高填低、平整山体,午夜货车轰鸣、偷运石材,看似在修复矿山环境,实则在非法盗采矿石。3月29

2023-04-07 17:33:44

估值减半大 V 嫌弃,推特「马氏休克疗法」开启第二季-全球观焦点

​最近这一周,Twitter再次凭实力把自己推上风口浪尖,先是上周五在GitHub上公开代码,接受公众检查;周末又重启「TwitterBlue」,继续尝试

2023-04-07 16:45:35

“首发首秀首展”将云集第三届消博会 最新

​原标题:60多个国家和地区的3100余个品牌参展(引题)“首发首秀首展”将云集第三届消博会(主题)第三届中国国际消费品博览会将于2023年4...

2023-04-07 15:58:16