使用IntelliJ IDEA搭建datax-web开发环境

news2025/6/9 22:59:53

记录:372

场景:使用IntelliJ IDEA搭建datax-web开发环境,以及datax-web基本使用。

版本:

JDK 1.8

Python 2.7.5

datax-web开源地址:https://github.com/WeiYe-Jing/datax-web

1.配置Maven环境

1.1安装目录

目录:D:\dev

1.2配置Maven远程和本地镜像仓库

修改文件:D:\dev\apache-maven-3.8.7\conf\settings.xml

修改内容:

<mirror> 
    <id>nexus-aliyun</id> 
    <mirrorOf>*</mirrorOf> 
    <name>Nexus aliyun</name> 
    <url>https://maven.aliyun.com/repository/public</url> 
</mirror>
<localRepository>D:\dev\maven-repo-3.8.7\repository</localRepository>

解析:在<mirrors></mirrors>标签内添加<mirror></mirror>内容,在</ettings></settings>标签内添加<localRepository></localRepository>。

1.3本地镜像仓库目录和配置文件

创建D:\dev\maven-repo-3.8.7\repository目录。

把D:\dev\apache-maven-3.8.7\conf\settings.xml文件拷贝到D:\dev\maven-repo-3.8.7\settings.xml

解析:repository中存放从远程仓库下载到本地的jar包等信息。

1.3配置环境变量和生效

依次点击和选择:此电脑->属性->高级系统设置->环境变量

在系统变量编辑框修改配置。

<1>新建系统变量

变量名称:MAVEN_HOME

变量值:D:\dev\maven-repo-3.8.7

<2>编辑系统变量Path

编辑系统变量Path,并添加行配置。

变量名称:Path

变量值:%MAVEN_HOME%\bin

2.下载源码

下载发布版本datax-web-v-2.1.2。

源码地址:https://github.com/WeiYe-Jing/datax-web

2.1浏览器直接下载

地址:https://github.com/WeiYe-Jing/datax-web/archive/refs/tags/v-2.1.2.zip

解析:直接在浏览器中输入地址就能下载。

2.2使用Git下载

命令:git@github.com:WeiYe-Jing/datax-web.git

3.解压源码

源码解压目录:D:\dev\ForDx\datax-web

4.使用IntelliJ IDEA打开源码

4.1在IDEA配置Maven

依次选择菜单:File->Settings->Build, Execution, Deployment->Build Tools->Maven。在对话框根据本机情况填写配置信息。本例配置信息。

Maven home path:D:/dev/apache-maven-3.6.3-idea

User settings file: D:\dev\apache-maven-3.6.3-idea\conf\settings.xml

Local repository:D:\dev\maven-idea-3.6.3

4.2解决缺少winutils.exe环境变量

datax-web在运行时报错,缺少winutils.exe环境变量。

(1)下载包

下载包:https://github.com/srccodes/hadoop-common-2.2.0-bin

(2)解压包

包名称:hadoop-common-2.2.0-bin-master,解压到指定目录。

(3)配置环境变量

右键:此电脑->高级系统设置->环境变量->系统变量

变量:

名称:HADOOP_HOME

值:D:\Program Files\hadoop\hadoop-common-2.2.0

添加Path变量:

名称:Path

值:%HADOOP_HOME%\bin

(4)环境变量生效

报错不生效的话,就重启电脑。

5.修改配置

端口约定

datax-admin服务端口:8081

datax-executor服务端口:8082

5.1配置文件的${}说明

在源码中提供的application.yml中使用了${}获取变量。${}获取变量来源方式,包括env.properties文件和bootstrap.properties文件。

(1)使用${}从env.properties获取配置变量

第一步,shell脚本从env.properties读取变量。

第二步,在shell脚本中,使用JAVA_OPTS的-D方式组装变量。

第三步,在shell脚本中,使用java命令把JAVA_OPTS参数传递给JVM,成为系统属性变量。

第四步,启动微服务时,在加载application.yml从使用${}从JVM系统属性变量中获取变量值。

(2)使用${}从bootstrap.properties获取配置变量

微服务在启动时,使用${}从JVM系统属性变量中获取变量值。

第一步:微服务启动时,会先加载bootstrap.properties变量,变量成为了系统属性变量。

第二步:微服务加载application.yml时,会使用${}从JVM系统属性变量中获取变量值。。

5.2修改datax-admin服务配置

在官网的application.yml配置文件中,使用${}获取变量值,

(1)配置端口

修改文件:../datax-admin/src/main/resources/application.yml文件

修改内容:

server:

port: 8081

(2)配置数据源

修改文件:../datax-admin/src/main/resources/bootstrap.properties文件

修改内容:

DB_HOST=192.168.19.202
DB_PORT=3306
DB_USERNAME=root
DB_PASSWORD=123456
DB_DATABASE=datax_web

解析:在application.yml中使用${}从bootstrap.properties中获取变量。

(2)修改输出日志

修改文件:../datax-admin/src/main/resources/application.yml文件

修改内容:

logging:
  level:
    com.wugui.datax.admin.mapper: info
    path: ./data/applogs/admin

5.3修改datax-executor服务配置

(1)配置端口

修改文件:../datax-executor/src/main/resources/application.yml文件

修改内容:

server:
  port: 8082

(2)配置日志

修改文件:../datax-executor/src/main/resources/application.yml文件

修改内容:

logging:
  config: classpath:logback.xml
  path: ./data/applogs/executor/jobhandler

(3)配置datax的job相关配置

datax:
  job:
    admin:
      addresses: http://127.0.0.1:8081
    executor:
      appname: datax-executor
      ip:
      port: 9999
      logpath: ./data/applogs/executor/jobhandler
      logretentiondays: 30
    accessToken:
  executor:
    jsonpath: D:\\dev\\ForDx\\space\\executor\\json
  pypath: D:\dev\ForDx\space\datax\bin\datax.py

(4)已编译的datax放入指定目录

在application.yml配置了datax的执行脚本,需要把已编译的datax全量包放入指定目录,datax-executor在执行时,调用datax.py,去调用datax的插件。

目录:D:\dev\ForDx\space\datax

脚本:D:\dev\ForDx\space\datax\bin\datax.py

6.在IntelliJ IDEA中启动

6.1启动datax-admin

在IntelliJ IDEA中,选中com.wugui.datax.admin.DataXAdminApplication启动类启动微服务。

6.2启动datax-executor

在IntelliJ IDEA中,选中com.wugui.datax.executor.DataXExecutorApplication启动类启动微服务。

7.登录信息

地址:http://127.0.0.1:8081/index.html

用户名/口令:admin/123456

8.基本操作

使用页面操作从MySQL数据hub01同步数据到MySQL数据库hub02中。

8.1登录页和首页

(1)登录页面

(2)首页

8.2项目管理

在项目管理,创建一个项目。

8.3数据源管理

创建两个数据源,分别是hub01和hub02。

数据源1:jdbc:mysql://192.168.19.202:3306/hub01?useSSL=false

数据源2:jdbc:mysql://192.168.19.202:3306/hub02?useSSL=false

8.4执行器管理

执行器管理,使用默认执行器。

8.5任务管理

在任务管理中,配置同步任务。

8.5.1DataX任务模板

在任务管理-DataX任务模板,配置任务模板。

8.5.2任务构建

在任务管理,任务构建,配置任务。

(1)构建reader

构建Reader,选择数据源,数据库表,配置相关信息。

(2)构建writer

构建writer,选择数据源,数据库表,配置相关信息。

(3)字段映射

对reader读取的表和writer写入的表做字段映射。

(4)构建

构建:生成JSON格式任务数据,是DataX要求的任务格式。

选择模板:选择DataX任务模板中已经生成的模板

复制JSON:可以复制配置任务的JSON数据。

构建前:

构建后:

(5)生成的JSON数据

生成的JSON数据,是DataX要求的标准格式的JSON数据,也就是任务数据。

{
  "job": {
    "setting": {
      "speed": {
        "channel": 3,
        "byte": 1048576
      },
      "errorLimit": {
        "record": 0,
        "percentage": 0.02
      }
    },
    "content": [
      {
        "reader": {
          "name": "mysqlreader",
          "parameter": {
            "username": "xxxxxx",
            "password": "xxxxxx",
            "column": [
              "`ID`",
              "`CITY_NAME`",
              "`LAND_AREA`",
              "`POPULATION`",
              "`GROSS`",
              "`CITY_DESCRIBE`",
              "`DATA_YEAR`",
              "`UPDATE_TIME`"
            ],
            "splitPk": "",
            "connection": [
              {
                "table": [
                  "t_city_01"
                ],
                "jdbcUrl": [
                  "jdbc:mysql://192.168.19.202:3306/hub01?useSSL=false"
                ]
              }
            ]
          }
        },
        "writer": {
          "name": "mysqlwriter",
          "parameter": {
            "username": "xxxxxx",
            "password": "xxxxxx",
            "column": [
              "`ID`",
              "`CITY_NAME`",
              "`LAND_AREA`",
              "`POPULATION`",
              "`GROSS`",
              "`CITY_DESCRIBE`",
              "`DATA_YEAR`",
              "`UPDATE_TIME`"
            ],
            "connection": [
              {
                "table": [
                  "t_city_02"
                ],
                "jdbcUrl": "jdbc:mysql://192.168.19.202:3306/hub02?useSSL=false"
              }
            ]
          }
        }
      }
    ]
  }
}

9.执行任务

在任务管理->任务管理目录下,下来菜单有以下有用操作。

执行一次:触发手动执行任务。

查看日志:会打印执行的详细日志。

编辑:可以对任务按需编辑。

删除:删除任务。

10.执行结果

把hub01数据库的t_city_01数据同步到了把hub02数据库的t_city_02。

11.集成Swagger

在datax-web中集成的Swagger作为接口API文档发布。

11.1静态页面位置

Swagger的静态资源在swagger-bootstrap-ui-1.9.6.jar包中。

静态页面目录:../META-INF/resources/doc.html

访问可用地址:

Local-API: http://127.0.0.1:8081/doc.html

External-API: http://192.168.19.1:8081/doc.html

11.2静态页面加载类

配置类:com.wugui.datax.admin.config.ServiceModelToSwagger2MapperImpl

配置类:com.wugui.datax.admin.config.SwaggerConfig

11.3DataX Web Api文档首页

访问文档页面,可以查看API文档信息。

以上,感谢。

2023年2月9日

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/334151.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring6-基于XML自动装配

一、介绍自动装配&#xff1a;根据指定的策略&#xff0c;在IOC容器中匹配某一个bean&#xff0c;自动为指定的bean中所依赖的类类型或接口类型属性赋值二、创建controllerpackage com.wsy.auto.controller;import com.wsy.auto.service.UserService; import com.wsy.auto.serv…

应用于LSSVM对偶问题的张量列车卡尔曼滤波器的代码(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 ​ &#x1f4a5;1 概述 支持向量机是借助优化方法解决机器学习问题的新工具.近年来,支持向量机越来越受到人们的广泛关注,在其理论研究和算法实现方…

Vue拼图验证

vue-puzzle-verification 封装的一个用于登录验证的拼图的vue组件&#xff0c;使用了canvas画图和拖拽的一些技巧。支持大小、形状、图片、偏差、范围的自定义。 一、安装使用 npm install vue-puzzle-verification 二、main.js里引入 import PuzzleVerification from vue…

训练营day18

513.找树左下角的值 力扣题目链接(opens new window) 给定一个二叉树&#xff0c;在树的最后一行找到最左边的值。 示例 1: 示例 2: var findBottomLeftValue function(root) {let queue [root];let res root.val;while (queue.length) {let node queue.shift();if (nod…

Blender——烘培记录

参考链接&#xff1a;Blender2.8基础三&#xff1a;贴图烘培篇Blender 材质如何导出到 UE 和 Unity 里使用贴图烘焙打开【渲染属性】面板&#xff0c;把【渲染引擎】改为【Cycles】。把【设备】改为GPU计算&#xff0c;可以加快烘培速度。创建一个【图像纹理】节点&#xff08;…

fastadmin后台表单文字过长,限制显示,鼠标悬停显示全部

问题&#xff1a;显示文字区域过长&#xff0c;影响用户体验感 解决措施&#xff1a; 特别注意&#xff1a; return "<span styledisplay: block;overflow: hidden;text-overflow: ellipsis;white-space: nowrap; title" row.contents ">" value …

ARM uboot源码分析1-启动第一阶段

一、start.S 引入 1、u-boot.lds 中找到 start.S 入口 (1) 在 C 语言中整个项目的入口就是 main 函数&#xff08;这是 C 语言规定的&#xff09;&#xff0c;所以譬如说一个有 10000 个.c 文件的项目&#xff0c;第一个要分析的文件就是包含了 main 函数的那个文件。 (2) 在…

分享75个JS焦点图代码,总有一款适合您

分享75个JS焦点图代码&#xff0c;总有一款适合您 75个JS焦点图代码下载链接&#xff1a;https://pan.baidu.com/s/1WuydBKN3eYd3H64lPXv0Fw?pwd0nq7 提取码&#xff1a;0nq7 Python采集代码下载链接&#xff1a;https://wwgn.lanzoul.com/iKGwb0kye3wj base_url "…

MySQL面试题:关系型数据库SQL和非关系型数据库NoSQL

文章目录一、四大非关系型数据库与关系型数据库的对比1. 关系型数据库2. 基于列的数据库3. 键值对存储4. 文档存储5. 图形数据库参考文章&#xff08;金文&#xff09;&#xff1a;四大非关系型数据库类型&#xff0c;你知道多少 参考文章&#xff1a;“行式存储”和“列式存储…

2022虎符CTF-WEB赛后复现

1、ezphp 参考Jacko师傅的这篇虎符CTF 写的已经很详细了&#xff0c;先简单梳理一下题目&#xff0c;题目与P师傅的这篇文章类似我是如何利用环境变量注入执行任意命令。简单来说就是不同的系统&#xff0c;他的system命令调用的命令不同。 php中调用system本质上是调用了sh…

UDP报文结构

UDP协议 基本特点&#xff1a;无连接、不可靠传输、面向数据报、全双工 UDP协议报文结构 &#xff0c;以下分别是种画法 对上图进行解释&#xff1a; UDP就会把载荷数据&#xff08;就通过UDP socket ,也就是send方法拿来的数据&#xff0c;基础上再在前面拼接上几个字节的…

appium ios真机自动化环境搭建运行(送源码)

appium ios真机自动化环境搭建&运行&#xff08;送源码&#xff09; 目录&#xff1a;导读 &#xff08;1&#xff09;安装JDK&#xff0c;并配置环境变量&#xff0c;方法如下&#xff1a; &#xff08;2&#xff09;安装Xcode、Xcode commandline tools和iOS模拟器 &…

如何判断反馈电路的类型-反馈类型-三极管

如何判断反馈电路的类型 反馈电路类型很多&#xff0c;可根据不同的标准分类&#xff1a; ①根据反馈的极性分&#xff1a;有正反馈和负反馈。 ②根据反馈信号和输出信号的关系分&#xff1a;有电压反馈和电流反馈。 ③根据反馈信号和输入信号的关系分&#xff1a;有串联反…

渗透测试 -- IP、端口信息收集

数据来源 01 IP信息收集 1&#xff09;IP反查域名 同IP网站查询&#xff0c;同服务器网站查询 - 站长工具 专业精准的IP库服务商_IPIP 2&#xff09;域名查询IP IP/IPv6查询&#xff0c;服务器地址查询 - 站长工具 或直接 ping 一下域名就会返回IP 3&#xff09;CDN 如…

补天平台安全问题收录情况分享记录

声明 本文是学习2017年上半年 补天平台漏洞收录分析报告. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 补天平台及补天白帽大会介绍 “补天平台”&#xff0c;成立于2013年3月&#xff0c;全称为“补天漏洞响应平台”。平台旨在收集散落在民间的安…

MySQL8.0之前实现row_number以及计算玩家连续登录天数

使用MySQL 5.7版本统计 玩家连续登录天数 原始数据 玩家同一天多次登录只保留一条 select DISTINCT(FROM_UNIXTIME(login_time,%Y-%m-%d)) as login_date,rid from t_log_login order by rid; 借助两个变量统计每个玩家登录日期对应的次数 SELECT * FROM(SELECT DISTINCT …

云镜CVE-2022-25578复现

CVE-2022-25578复现漏洞信息漏洞复现读取flag&#x1f349; shell来源&#xff1a;https://yunjing.ichunqiu.com/cve/detail/960?type1&pay2漏洞信息 漏洞名称taocms v3.0.2允许攻击者通过编辑.htaccess文件执行任意代码漏洞编号CVE-2022-25578危害等级超危漏洞类型任意…

day34|343. 整数拆分、96.不同的二叉搜索树

343. 整数拆分 给定一个正整数 n &#xff0c;将其拆分为 k 个 正整数 的和&#xff08; k > 2 &#xff09;&#xff0c;并使这些整数的乘积最大化。 返回 你可以获得的最大乘积 。 示例 1: 输入: n 2 输出: 1 解释: 2 1 1, 1 1 1。 示例 2: 输入: n 10 输出: 36 解…

电子技术——共栅(共基)放大器

电子技术——共栅&#xff08;共基&#xff09;放大器 在本节我们学习IC中共栅&#xff08;共基&#xff09;放大器的配置&#xff0c;虽然我们之前在分立电路中学习过共栅&#xff08;共基&#xff09;放大器的配置。但是在IC中共栅&#xff08;共基&#xff09;放大器主要作为…

MES系统助力电子厂行业,打造高能效工厂

ES主要包括生产计划系统、工艺管理系统、质量管理系统、生产过程管理系统、设备管理系统、仓储管理系统及数据采集和统计分析系统等。实现生产过程可视化、可追溯。管理人员可以在管理界面对生产实时控制&#xff0c;从而根据需要精准调整生产&#xff0c;达到提高生产效率、缩…