首页职场攻略文章详情

Hadoop到底是干什么用的

来源：蓝山简历

阅读:1044 次

你可能适合的模板

5年工作经验用户运营简历模板

应届生通用个人简历模板

应届生个人简历封面模板

需求分析师个人简历模板

托管老师个人简历模板

hadoop是什么？

(1)Hadoop是一个开源的框架，可编写和运行分布式应用处理大规模数据，是专为离线和大规模数据分析而设计的，并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS（文件系统，数据存储技术相关）+ Mapreduce（数据处理），Hadoop的数据来源可以是任何形式，在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能，具有更灵活的处理能力，不管任何数据形式最终会转化为key/value，key/value是基本数据单元。用函数式变成Mapreduce代替SQL，SQL是查询语句，而Mapreduce则是使用脚本和代码，而对于适用于关系型数据库，习惯SQL的Hadoop有开源工具hive代替。

(2)Hadoop就是一个分布式计算的解决方案.

hadoop能做什么？

hadoop擅长日志分析，facebook就用Hive来进行日志分析，2009年时facebook就有非编程人员的30%的人使用HiveQL进行数据分析；淘宝搜索中的自定义筛选也使用的Hive；利用Pig还可以做高级的数据处理，包括Twitter、LinkedIn 上用于发现您可能认识的人，可以实现类似Amazon.com的协同过滤的推荐效果。淘宝的商品推荐也是！在Yahoo！的40%的Hadoop作业是用pig运行的，包括垃圾邮件的识别和过滤，还有用户特征建模。（2012年8月25新更新，天猫的推荐系统是hive，少量尝试mahout！）

也就是所谓的大数据云计算了，举个简单的例子：

比如，1亿个1相加得出计算结果, 我们很轻易知道结果是 1亿。但是计算机不知道，那么单台计算机处理的方式做一个一亿次的循环每次结果+1。

而分布式的处理方式则变成：我用1万台计算机，每个计算机只需要计算1万个1相加，然后再有一台计算机把 1万台计算机得到的结果再相加，从而得到最后的结果。

理论上讲, 计算速度就提高了1万倍。这就是hadoop能做到的事。

上一篇：通信工程是干什么的

下一篇：外企面试常见问题

相关文章推荐

英文简历怎么写

英文简历怎么写标准的求职简历主要由四个基本内容组成：1、基本情况：姓名、性别、出生日期、婚姻状况和联系方式等。2、教育背景：按时间顺序列出初中至最高学历的学校、专业和主要课程。所参加的各种专业知识和技能培训。3、工作经历：按时间顺序列出参加工作至今所有的就业记录，包括公司/单位名称、职务、就任及离任时间，应该突出所任每个职位的职责、工作性质等，此为求职简历的精髓部分。4、其他：个人特长及爱好、其他技能、专业团体、著述和证明人等。 2025-08-12 00:05:50

新闻与传播专业如何找实习

新闻与传播专业如何找实习新闻与传播专业作为传统的文科专业，最后的选择路径无非是公务员，老师，文员，或者进入国企央企，而新传可能多两条路，新媒体运营、记者和编辑。无论是机构媒体自媒体平台型媒体，实习经验是越丰富约好，业界基本都是看作品，学历是锦上添花。最好的局面是，学历也不错，实习经历也丰富。那么新闻与传播专业如何找实习? 2025-08-12 00:05:49

个人简历的制作要点

个人简历的制作要点一份简洁有效的简历一眼望去应该是主次分明，重点一目了然，如果排版不清晰，混乱堆积，看着就使人眼光缭乱，如此排版自然会首先被面试官排除，因为如果连基本的排版都做不好，由此可推面试者的做事条理。 2025-08-12 00:05:49

个人简历一般怎么写

个人简历一般怎么写个人信息要填写的内容包括：姓名，出生年月，性别，毕业院校，籍贯，所修专业，学历，毕业时间，手机号码，电子邮箱，求职地点，职能类别，求职意向，工作年限； 2025-08-12 00:05:49

热门文章推荐

自我介绍如何留下好印象？

培训开场自我介绍怎么讲？

新项目启动会怎么介绍自己？

线下洽谈自我介绍怎么说？

谈合作自我介绍怎么破冰？

线上对接如何自我介绍？

热门模板

广告设计简历求职模版

广告设计简历求职模版

web前端工程简历模版

web前端工程简历模版

企业管理简历求职模版

企业管理简历求职模版

教培简历求职模版

教培简历求职模版

金融研究员简历通用模版

金融研究员简历通用模版

数据平台后端开发简历通用模版

数据平台后端开发简历通用模版

服务

求职简历个人简历关于我们

模版

简历模板 PPT模板 Word模板

攻略

职场攻略简历攻略

资讯

毕业论文范文大全

企业微信

企业微信

简历网客服

简历网客服

蓝山简历微信公众号

简历网公众号

沪ICP备2021002117号-2

Copyright © 2020- 2023 上海蓝山办公软件有限公司

www.jianli.com

简历网 All Rights Reserved.版权所有

友情链接：

客服电话：193-3284-5867 客服QQ：281713165