ETL工具 — Data Integration (Kettle) 下载安装
一、Data Integration(Kettle) 是基于java开发的一款软件,首先必须先安装JDK。
1.下载JDK安装包,下载地址: http://www.oracle.com/technetwork/java/javase/downloads/index.html
点击下载按钮进入下载界面 ,根据系统选择相应的版本下载。
2.下载后安装JDK,安装过程中可以自定义安装目录等信息,例如我们选择安装目录为 C:\Program Files\Java\jdk1.8.0_112。
3.安装完成后,需要配置环境变量。
3.1 右击"我的电脑",点击"属性",选择"高级系统设置";
3.2 选择"高级"选项卡,点击"环境变量";
3.3 在"系统变量"中设置3项属性,JAVA_HOME,PATH,CLASSPATH 。若已存在则点击"编辑",不存在则点击"新建"。
变量设置参数如下:
- 变量名:JAVA_HOME
- 变量值:C:\Program Files\Java\jdk1.8.0_112 // 要根据自己的实际路径配置
- 变量名:CLASSPATH
- 变量值:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar; //注意前面有个"."
- 变量名:Path
- 变量值:%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;
4. 验证JDK安装是否成功。
"开始"->"运行",键入"cmd",键入命令: java -version,出现如下版本信息,说明已安装成功。
二、Data Integration 7.0 的下载
进入pentaho的官网下载最新版本:http://community.pentaho.com
各版本文件的下载地址:https://sourceforge.net/projects/pentaho/files/
我下载了7.0版本 pdi-ce-7.0.0.0-25.zip,解压后直接双击Spoon.bat运行。启动需要等一小会儿,然后进入kettle的主界面。
为方便启动,你也可以把Spoon.bat创建一个快捷方式到桌面。
在根目录的\samples子目录里有很多小例子,供我们慢慢学习。
这样kettle环境部署配置工作大功告成,可以开始我们的kettle之旅了。