IT/빅데이터분석기사
[빅분기 1과목] 하둡 에코시스템(Hadoop EcoSystem) 이란?
aram
2023. 3. 13. 20:45
#Hadoop 하둡
HDFS : 하둡 분산파일시스템(읽기중심)
Hbase : 분산칼럼기반 데이터베이스
MapReduce 맵리듀스 : 분산컴퓨팅 지원 프레임워크
* 단점 : HDFS에 저장된 데이터 변경 불가, 실시간 데이터 분석에는 부적합 등
1-하둡이란?
하둡은 2006년 야후의 더그 커팅이 '넛치'라는 검색엔진을 개발하는 과정에서 대용량의 비정형 데이터를 기존의 RDB 기술로는 처리가 힘들다는 것을 깨닫고, 새로운 기술을 찾는 …
wikidocs.net
=> 이를 보완하기 위해 나온
#Hadoop EcoSystem 하둡 에코시스템
- 코어 : HDFS, 맵리듀스
- 서브 : 분산데이터를 다루기 위해 만들어진 추가 프로젝트
하둡(Hadoop) 기초 정리
하둡에 대해 알아보기 전에 큰 흐름에서의 하둡에 대해 이해를 해보자. 하둡은 기본적으로 빅데이터를 처리하는 과정 속에서 사용되어진다. 빅데이터를 처리하는 흐름으로는 우선 데이터를 수
han-py.tistory.com
하둡 에코시스템(Hadoop-Ecosystem)이란
이전 포스팅 2019/11/10 - [빅데이터 꿈나무] - 하둡(Hadoop)이란? 시작하기 앞서.. (내가 했던 그리고 쉽게들 하는) 하둡에 대한 오해 1. 하둡은 빅데이터에만 사용된다? 많은 사람들은 하둡이라고 하면
butter-shower.tistory.com
> 깔끔한 정리 good
728x90