如何用ruby来写hadoop的mapreduce并生成jar包-技术博客集

如何用ruby来写hadoop的mapreduce并生成jar包
编程技术 / houtizong 发布于 3年前 172

ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢：

1.安装rvm：

不说了网上有

2.安装ruby：

由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。

3.安装jruby：

rvm install jruby然后等待安装完成

4.给编写mapreduce的目录设置默认的ruby版本和gemset：

进入到目标目录，执行rvm --create --ruby-version jruby-1.7.19@hadoop

生成两个文件.ruby-version和.ruby-gemset，一个是定义当前目录的默认ruby版本，一个是定义默认的gemset。

有了这两个文件已进入这个目录rvm自动帮你切换到jruby@hadoop，这样才能运行rubydoop。

5.编写代码：

需要说明的是目录结构必须是

├── Gemfile

├── lib

│ ├── word_count_job.rb

│ └── word_count.rb

└── Rakefile

如果没有需要安装的gem，则touch个空的Gemfile就好，所有的代码都放在lib目录下。

6.生成jar包：

rake package

7.用hadoop运行生成的jar包：

hadoop jar build/word_count.jar word_count_job path/to/input path/to/output

上一篇：rust的指针作为函数返回值是直接传递，还是先销毁后创建？

下一篇：SQL的各种连接查询

请勿发布不友善或者负能量的内容。与人为善，比聪明更重要！

<div > ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm： &nbsp; &nbsp; 不说了 网上有 2.安装ruby： &nbsp; &nbsp; 由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： &nbsp; &nbsp; rvm install jruby然后等待安装完成 4.给编写mapreduce的目录设置默认的ruby版本和gemset： &nbsp; &nbsp; 进入到目标目录，执行rvm --create --ruby-version jruby-1.7.19@hadoop &nbsp; &nbsp; 生成两个文件.ruby-version和.ruby-gemset，一个是定义当前目录的默认ruby版本，一个是定义默认的gemset。 &nbsp; &nbsp; 有了这两个文件已进入这个目录rvm自动帮你切换到jruby@hadoop，这样才能运行rubydoop。 5.编写代码： &nbsp; &nbsp; 需要说明的是目录结构必须是 &nbsp; &nbsp;&nbsp;├── Gemfile &nbsp; &nbsp; ├── lib &nbsp; &nbsp; │ &nbsp; ├── word_count_job.rb &nbsp; &nbsp; │ &nbsp; └── word_count.rb &nbsp; &nbsp; └── Rakefile &nbsp; &nbsp; 如果没有需要安装的gem，则touch个空的Gemfile就好，所有的代码都放在lib目录下。 6.生成jar包： &nbsp; &nbsp; rake package 7.用hadoop运行生成的jar包： &nbsp; &nbsp; hadoop jar build/word_count.jar word_count_job path/to/input path/to/output </div>

留言需要登陆哦

技术博客集 - 网站简介：
前后端技术：
后端基于Hyperf2.1框架开发,前端使用Bootstrap可视化布局系统生成
网站主要作用：
1.编程技术分享及讨论交流，内置聊天系统;
2.测试交流框架问题，比如：Hyperf、Laravel、TP、beego;
3.本站数据是基于大数据采集等爬虫技术为基础助力分享知识，如有侵权请发邮件到站长邮箱，站长会尽快处理;
4.站长邮箱：[email protected];

文章归档

文章标签

友情链接

首页
关于我们

Auther ·HouTiZong: 侯体宗的博客