组合数据集

应用场景:不同的业务数据存储的数据库和数据表均不相同,当需要分析企业整体的经营状况,则需要将各业务数据汇总分析。在DMP平台中,用户可先将需要分析的不同业务的数据表制作成单个数据集,再创建 “组合数据集” ,通过SQL语句进行多表查询,表连结等操作。

添加过程

1)在数据集主界面,选择组合数据集,进入添加界面;选择需要做组合的数据集,可多选,数据集个数不限

可以添加组合的数据集类型有以下2种:
1.excel数据集;
2.数据集连接模式为“调度模式”的SQL数据集;

API数据集,数据集连接模式为“直连模式”的SQL数据集均不能做组合。

添加组合数据集

2)配置数据界面分为3个操作区:数据集和字段选择区,SQL语句编辑区,数据预览和字段编辑区;

添加组合数据集

数据集与字段选择区

DMP中的组合数据集使用的SQL语法,为标准的MySQL语法,但有2点区别:

  • 字段名需要用中括号 [] 圈起,否则字段名无效;
  • 表名需要用方括号 {} 圈起,否则表名无效;

表名和字段名插入SQL语句有2种方式:

  • 点击 表名/字段 后的插入按钮,将字段添加到右侧的SQL语句;
  • 在右侧SQL语句中输入 表名/字段名,用 方括号{} 或 中括号[] 圈起;

添加组合数据集

SQL语句编辑区

自由编辑SQL语句,对数据进行筛选,组合等操作(注意:仅支持MySQL语法),编辑完成后,点击“运行”按钮,下方数据预览区则将展示最新查询数据;

添加组合数据集

数据预览和字段编辑区

字段编辑区修改别名,添加备注,修改数据类型,设置字段可见性等功能,具体配置见 字段设置

巡检规则具体使用见 数据巡检

3)数据配置完成后,进行保存,数据集路径和名称必填,默认保存在根目录下;

调度开启与否选择:

开启调度后,数据集将根据选择的调度时间节点自动更新数据,适合源数据有更新周期的数据集;

调度方案:默认为“依赖周期,定时调度”(注:调度方案“依赖流程,等待上游调度结束继续运行”为DMP大数据处理平台功能,DMP大数据可视化分析平台不含该方案

results matching ""

    No results matching ""