博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Oozie分布式工作流——Action节点
阅读量:5129 次
发布时间:2019-06-13

本文共 2413 字,大约阅读时间需要 8 分钟。

前篇讲述了下什么是流控制节点,本篇继续来说一下什么是 Action Nodes操作节点。Action节点有一些比较通用的特性:

Action节点是远程的

所有oozie创建的计算和处理任务都是异步的,没有任何应用是工作在oozie内部的。基本上都是创建一个oozie任务,oozie任务会以map的形式,在各个节点再创建相应的任务。因此当你执行spark任务的时候,就会发现yarn集群监控列表里面会同时有两个任务出现。

Action节点是异步的

oozie创建的任务都是异步的,对于大多数的任务来说,oozie都是创建action,然后一直等到这个action完成,才退出。对于fs的异常操作来说,是同步的。

oozie可以通过两种方式检测任务是否完成——回调和轮训。

当oozie创建一个任务时,会提供一个唯一的回调url,当任务完成时,会调用该url通知完成。当无法回调时,也可以采用轮训的机制,检测是否完成。

Action有两种状态,ok和error

如果任务异常退出,那么需要明确的提供error-code,这个信息可以用于decision控制节点进行决策选择。每个工作流都应该清晰的定义errorcode

Action的恢复机制

oozie对于不同的错误有不同的处理方式:

  • 对于那些偶然的错误,比如网络原因或者远程系统暂时不能访问,oozie会根据预先设置的参数进行重试。这个参数可以在action中进行重写。
  • 对于那些非偶然的错误,oozie会挂起任务,直到管理员或者外部系统手动解决。

一些常用的Action

FS Action

fs Action允许操作hdfs上的文件或者目录,比如move,delete,mkdir,chmod,touchz,chgrp等等。

这个FS命令都是同步执行的,只有节点完成该命令操作,才会继续往下执行。

如果使用了路径,那么路径可以使用EL表达式参数化,但是一定要是绝对路径才行。对于move,delete,chmod,chgrp命令来说,可以使用通配符。但是对于move命令,只能给源路径使用通配。

语法规则如下:

...
...
...
...
...
...
...

delete命令可以删除指定的路径的内容,如果目标是一个目录,那么会级联删除下面的所有内容。

mkdir命令会创建指定的路径内容,如果路径上缺少父级目录,也会自动创建。如果目录已经存在,那么什么都不会做。

move命令中,source路径必须要指定。下面是使用move的一些场景:

  • 文件系统URI(比如hdfs://{namenode})可以在target中省略,因为系统会默认使用source的URI。
  • target路径的父级目录都必须存在
  • 如果target目录已经存在,那么将会替换目标文件

chmod命令可以改变路径的权限。权限跟linux类似,都是-rwxrw-rw-或者755的形式。默认的情况下权限会应用到目标目录以及其子文件。如果只想应用到目录而不影响它的文件,可以把dir-files属性设置为false.如果想要级联修改内部的所有文件,可以内部嵌套一个recursive元素.

touchz命令在该文件不存在的时候会创建一个长度为0的文件。如果文件已经存在,那么仅会更新一下该文件的修改时间。touchz命令仅支持绝对路径。

chgrp命令可以修改路径的所有组。属性跟chmod是一样的。

举个例子:

...
...

在其他的工作流节点中,也可以使用fs操作:

...
hdfs://foo:8020
fs-info.xml
some.property
some.value
...

这个功能在其他的工作流节点中是非常常用的,像我们平时使用的sqoop操作都需要实现执行以下delete删除目标数据。

转载于:https://www.cnblogs.com/xing901022/p/6492867.html

你可能感兴趣的文章
TCP/ip协议栈之内核调优
查看>>
重型数控机床技术:铣镗加工中心的主轴结构
查看>>
jdbcUtils连接数据库
查看>>
bzoj 3611: [Heoi2014]大工程
查看>>
6 spark 存储体系 --内存管理
查看>>
PDF/WORD/EXCEL 图片预览
查看>>
数据库优化方面的事情
查看>>
onRetainNonConfigurationInstance方法状态保存
查看>>
DevExpress组件之——TreeList组件
查看>>
P2916 [USACO08NOV]安慰奶牛Cheering up the Cow
查看>>
PV操作(转)
查看>>
软考笔记第六天之各排序算法的实现
查看>>
修补PHPRPC_Client中(JAVA版本),创建Socket连接时Timeout不起作用
查看>>
第五次作业160809308周子济
查看>>
Latex在texstudio中的参考文献编译
查看>>
Applese 的毒气炸弹 G 牛客寒假算法基础集训营4(图论+最小生成树)
查看>>
Day 24 20190208 老男孩python学习第24天 内容整理
查看>>
php ascii hex编码
查看>>
Hadoop.2.x_网站PV示例
查看>>
48 直接操作css样式 文本操作 属性操作 登录验证 全选取消反选
查看>>