飒软-致力于企业软件选型-专注于数字化经济建设

商品详情

Hadoop系统提供了分布式存储、计算和资源调度引擎，用于大规模数据处理和分析。OBS服务实现了Hadoop的HDFS协议，在大数据场景中可以替代Hadoop系统中的HDFS服务，实现Spark、MapReduce、Hive等大数据生态与OBS服务的对接，为大数据计算提供“数据湖”存储。

本镜像已经集成了以下组件，并且实现了OBS服务的对接：

hive（基于hadoop的数据仓库）

由Facebook开源，最初用于解决海量结构化的日志数据统计问题。

hive定于了一种类似sql的查询语言（hql）将sql转化为mapreduce任务在hadoop上执行。

flume（日志收集工具）

cloudera开源的日志收集系统，具有分布式，高可靠，高容错，易于定制和扩展的特点。他将数据从产生，传输，处理并写入目标的路径的过程抽象为数据流，在具体的数据流中，数据源支持在flume中定制数据发送方，从而支持收集各种不同协议数据。

spark：

spark是个开源的数据分析集群计算框架，最初由加州大学伯克利分校AMPLab，建立于HDFS之上。spark与hadoop一样，用于构建大规模，延迟低的数据分析应用。spark采用Scala语言实现，使用Scala作为应用框架。

spark采用基于内存的分布式数据集，优化了迭代式的工作负载以及交互式查询。

与hadoop不同的是，spark与Scala紧密集成，Scala象管理本地collective对象那样管理分布式数据集。spark支持分布式数据集上的迭代式任务，实际上可以在hadoop文件系统上与hadoop一起运行（通过YARN,MESOS等实现）

商品参数

商品介绍

本商品提供了hadoop生态下，hadoop，spark，hive，flume组件集成OBS

规格定价

购买方式

用户案例

服务支持

使用指南

hadoop-obs分布式系统.docx 下载

软件文档

平台支持范围

售后服务时间：
8:00-22:00
售后服务内容：售后内容xxx
通用客服电话：17761229166
服务邮箱：liy@saruan.net

用户评价

0条点评

0

5星

0

4星

0

3星

0

2星

0

1星

0

用户问答

有疑问快问商家吧~