매일공부

[빅분기 1과목] 하둡 에코시스템(Hadoop EcoSystem) 이란? 본문

IT/빅데이터분석기사

[빅분기 1과목] 하둡 에코시스템(Hadoop EcoSystem) 이란?

aram 2023. 3. 13. 20:45

 

#Hadoop 하둡

HDFS : 하둡 분산파일시스템(읽기중심)

Hbase : 분산칼럼기반 데이터베이스

MapReduce 맵리듀스 : 분산컴퓨팅 지원 프레임워크

* 단점 : HDFS에 저장된 데이터 변경 불가, 실시간 데이터 분석에는 부적합 등

 

1-하둡이란?

하둡은 2006년 야후의 더그 커팅이 '넛치'라는 검색엔진을 개발하는 과정에서 대용량의 비정형 데이터를 기존의 RDB 기술로는 처리가 힘들다는 것을 깨닫고, 새로운 기술을 찾는 …

wikidocs.net

 

 

=> 이를 보완하기 위해 나온

#Hadoop EcoSystem 하둡 에코시스템

https://mr-devlife.com/what-is-hadoop-eco-system/
시작하세요! 하둡 프로그래밍(위키북스)

- 코어 : HDFS, 맵리듀스

- 서브 : 분산데이터를 다루기 위해 만들어진 추가 프로젝트

 

 

 

하둡(Hadoop) 기초 정리

하둡에 대해 알아보기 전에 큰 흐름에서의 하둡에 대해 이해를 해보자. 하둡은 기본적으로 빅데이터를 처리하는 과정 속에서 사용되어진다. 빅데이터를 처리하는 흐름으로는 우선 데이터를 수

han-py.tistory.com

 

하둡 에코시스템(Hadoop-Ecosystem)이란

이전 포스팅 2019/11/10 - [빅데이터 꿈나무] - 하둡(Hadoop)이란? 시작하기 앞서.. (내가 했던 그리고 쉽게들 하는) 하둡에 대한 오해 1. 하둡은 빅데이터에만 사용된다? 많은 사람들은 하둡이라고 하면

butter-shower.tistory.com

> 깔끔한 정리 good

 

728x90
Comments