博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
理解MapReduce计算构架
阅读量:5160 次
发布时间:2019-06-13

本文共 339 字,大约阅读时间需要 1 分钟。

用Python编写WordCount程序任务

程序

WordCount

输入

一个包含大量单词的文本文件

输出

文件中每个单词及其出现次数(频数),并按照单词字母顺序排序,每个单词和其频数占一行,单词和频数之间有间隔

1.编写map函数,reduce函数

  首先先创建文件

 

  然后编写两个函数

 

 

 

2.将其权限作出相应修改

 

3.本机上测试运行代码

 

4.放到HDFS上运行

5.下载并上传文件到hdfs上

 

6.用Hadoop Streaming命令提交任务

  先找到Streaming的Jar包

  配置默认环境变量

  让配置生效并测试

  编写run.sh脚本程序

 

运行结果

转载于:https://www.cnblogs.com/veol/p/9021337.html

你可能感兴趣的文章
(转)Android studio 使用心得(五)—代码混淆和破解apk
查看>>
构建之法阅读笔记03
查看>>
ES5_03_Object扩展
查看>>
Apache-ab 接口性能测试
查看>>
EF 4.1 Code First Walkthrough
查看>>
常用MySQL语法
查看>>
bzoj 2600: [Ioi2011]ricehub
查看>>
创建数据库,表
查看>>
工厂模式
查看>>
计算机网络基础知识
查看>>
C#里如何遍历枚举所有的项
查看>>
如何在键盘出现时滚动表格,以适应输入框的显示
查看>>
超级强大的鼠标手势工具
查看>>
常用Dockerfile举例
查看>>
jquery的ajax用法
查看>>
设计模式-策略模式(Strategy)
查看>>
django orm 数据查询详解
查看>>
JarvisOJ Basic 熟悉的声音
查看>>
C# list导出Excel(二)
查看>>
CAS 单点登录模块学习
查看>>