Hadoop MapReduce编程规范

发布时间 2023-12-13 10:29:34作者: SpringCore

用户编写的程序分为三个部分:Mapper、Reducer和Driver

1.Mapper阶段

  1. 用户自定义的Mapper要继承自己的父类
  2. Mapper的输入数据是KV对的形式(KV的类型可自定义)
  3. Mapper中的业务逻辑写在map()方法中
  4. Mapper的输出数据是KV对的形式(KV的类型可自定义)
  5. map()方法(MapTask进程)对每一个<K,V>调用一次