跳到主要内容
开发谷
  • 编程题库
  • 更多
您正在用访客帐号访问
登录
编程题库
  1. 首页
  2. 编程题库
  3. 电商推荐引擎项目实训
  4. 18、在hdfs目录存在文件,Map任务,输出记录

18、在hdfs目录存在文件,Map任务,输出记录

完成条件
查看 提交
打开: 2023年12月15日 星期五 00:00

在hdfs目录/tmp/table/student中存在student.txt文件,按tab分隔,字段名为(学号,姓名,课程号,班级名称),hdfs目录/tmp/table/student_location中存在student_location.txt文件,按tab分隔,字段名为(学号,省份,城市,区名),在Map任务中用student_location.txt文件中的学号过滤student.txt中的学号字段,输出student.txt中的存在交集的记录,输出结果结构按tab分隔后的四个字段为(学号,姓名,课程号,班级名称,省份,城市)。

◄ 17、在HDFS目录中有一系列文件,求数值类型、字母类型、中文类型各自的次数
19、数据进行按工号字段的分组 ►
您正在用访客帐号访问 (登录)
‎数据保留摘要‎
本网站基于Moodle
上海总部

Tel: 021-56778147

上海静安区共和新路2802号

智苑文创1号楼5层

昆山基地

Tel: 0512-50190290

昆山巴城学院路828号昆山

浦东软件园北楼4、5、8层

杰普软件园

Tel: 0512-57853816

昆山巴城迎宾路祖冲之路

杰普软件园

杰普产品官网

杰普微信订阅号

需要帮助联系我们

友情链接:   杰普官网  产品中心  了解我们   更多>>
Copyright©2023    昆山杰普软件科技有限公司     苏ICP备2020067766号-2