SQL数据集配置
应用场景:已添加Mysql数据源,使用该类型的数据源创建SQL数据集使用。
添加过程:
1)在数据集主界面,选择SQL数据集,进入添加界面;
数据源列表中包含SQL数据源,MysoftERP数据源,Datahub数据源3种类型的,此处选择SQL数据源;
2)预览数据界面分为3个操作区:数据表选择区,SQL编辑区,数据预览和字段编辑区;
数据表选择区
选择需要连接的数据表,可搜索 表名和表备注名 快捷查找;找到数据表之后,点击表的查询按钮,在SQL编辑区将自动生成select语句(默认是全查询);
SQL语句编辑区
可自由编辑SQL语句,对数据进行筛选,组合等操作(注意:SQL数据集仅支持MySQL语法),编辑完成后,点击“运行”按钮,下方数据区则将展示最新查询数据;
数据预览和字段编辑区
字段编辑区修改别名,添加备注,修改数据类型,设置字段可见性等功能,具体配置见 字段设置;
巡检规则具体使用见 数据巡检
3)保存数据集,数据集路径和名称必填,默认保存在根目录下;
SQL数据源的数据会定时更新,所以SQL数据集需要设置数据更新的方式,目前提供两种数据更新方式:调度模式和直连模式;
调度模式
开启调度后,数据集将根据选择的调度时间节点自动更新数据,适合源数据有更新周期的数据集;
调度方案:默认为“依赖周期,定时调度”(注:调度方案“依赖流程,等待上游调度结束继续运行”为DMP大数据处理平台功能,DMP大数据可视化分析平台不含该方案)
调度时间可选择 每月,每周,每天,每小时,每分钟,不同时间的选项如下:
直连模式
直连模式下,当源数据更新时,数据集会自动更新,适合源数据不定期更新的数据集;
注:调度模式的SQL数据集创建成功后,需要经过流程运行取数,所以返回列表时数据为空,待流程运行结束后,即会显示数据。