博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据框架、概念等 简短总结 (持续总结中)
阅读量:4217 次
发布时间:2019-05-26

本文共 605 字,大约阅读时间需要 2 分钟。

数据仓库 

更关注数据分析层面(OLAP)

一次写入、多次读取

HDFS 分布式文件系统

HDFS适合批处理场景,不支持数据随机查找,不适合增量数据处理且不支持数据更新

Habse

分布式文件系统的动态查询,HDFS的随机读写操作

HBase并不适合传统的事物处理程序或关联分析,不支持复杂查询

Hive

分布式文件系统的类SQL 查询

Hive不是为在线事务处理而设计

Spark

分布式计算框架,微批量数据的处理

RDD  弹性分布式数据集

主要在于 弹性、 和 分布式 两个特点

Kafka

高吞吐的消息队列、系统间的解耦

ElasticSearch

1、先做事情   建立索引(倒排索引)

2、少做事情   域中检索

Apsche Yarn

Apache  Mesos

Mesos是Apache下的开源布式资源管理框架,它被称为是分布式系统的内核

Kubernetes 

容器文件

1、可分割、2、可压缩、3、可序列化、4、可传输

Patquet  列式存储

保存时,预读功能,统计信息

读取时,可以根据统计信息做Push Down

ORC FILE  优化的列式存储

AVRO  行式存储

 

大数据技术相关的个人讲义

https://github.com/tianyeshiye/MyCourse

 

 

微服务架构

微服务是一种服务间松耦合的、每个服务之间高度自治并且使用轻量级协议进行通信的可持续集成部署的分布式架构体系

 

转载地址:http://xyvmi.baihongyu.com/

你可能感兴趣的文章
idea创建maven项目并关联gitee
查看>>
HashMap和Hashtable的区别
查看>>
JVM 对 Java 的原生锁做了哪些优化?
查看>>
JAVA实现简单的阻塞队列
查看>>
我的2020
查看>>
idea快捷键使用
查看>>
2.1MAC协议概述
查看>>
2.3 WSN的MAC协议
查看>>
图解后缀表达式的计算过程
查看>>
栈与队列的应用——计算表达式的值
查看>>
静态链表——sharing
查看>>
静态链表——sorting
查看>>
DFS——背包问题
查看>>
DFS——选数问题
查看>>
BFS——求矩阵中“块”的个数
查看>>
BFS——走迷宫的最小步数
查看>>
并查集——好朋友
查看>>
关键路径
查看>>
Python学习笔记——数据分析之Seaborn绘图
查看>>
Web前端学习笔记——JavaScript之事件详解
查看>>