hadoop 运行 Java程序

2024-02-11 06:22•java•阅读 2816

最近在研究分布式数据，其中用到的就是Hadoop,　Ｈadoop网上的资料不多，特别是运行中运行的问题更是找不到，以下是我运行的一点心得，嘻嘻。

如果在map/reduce的程序中用到java 的代码，可以在java的环境下写好，我用的是eclipse。

１. 进入工程目录找到代码，进bin目录，将用到的包打成 .jar 文件。bin 文件下是 .class文件，一定要是bin,不是src文件中的 .java 文件。在ubuntu的打.jar 的命令是　jar -cvf jarname.jar ./*

2. 将打好的 .jar文件复制到　Hadoop的目录下。

3. 切换到Hadoop目录下，编译含map/reduce函数的test .java 文件。命令：　javac -classpath hadoop-0.19.2-dev-core.jar:jarname.jar test.jar -d a. 　a是编译后.class存放的文件夹。

编译时要注意每次改动test.java文件时都要编译一次，而且在core.jar:jarname.jar中不能有空格，我就是因为有空格，导致test.java文件中老是出现软件包不存在的错误。而且这是jarname.jar 要在Hadoop目录下。如果没有:后面的，是不是就直接在lib文件下匹配，以后在研究下。

如果不用引人其它包，把:jarname.jar 去掉。

4. 进入含编译文件的a 文件夹，打　tests.jar 文件。

5. 运行代码：　bin/hadoop jar tests.jar org.test in out　org.test中org是包名, in 是输入文件，out是输出文件。

其中tests.jar　放在Ｈadoop目录下就可以了，但引用的jarname.jar　要放到lib文件夹下。　

上一篇 »根据linux自带的JDK，配置JAVA_HOME目录
下一篇 »在AWS EMR上运行Map Reduce的Java示例程序及操作小计

hadoop 运行 Java程序

相关推荐

java反编译获取源码

JAVA不经过Catch，Exception e直接到finally或者退出原因

eclipse编写的java程序在dos环境下运行的写法

控制台方式运行java程序示例

MAC & Eclipse运行java程序报错：Could not find or load main class

解释型程序python\java与编译型程序C在IO以及运行上的效率差异

大数据mapreduce全局排序top-N之python实现

Java中如何计算一段程序的运行时间？