빅데이터1 [Hadoop] 빅데이터 오픈 소스 프레임 워크 하둡이란? | Big data Open source Frame work Hadoop 이란? 하둡 소프트웨어 라이브러리는 간단한 프로그래밍 모델을 사용하여 여러대의 컴퓨터 클러스터에서 대규모 데이터 세트를 분산 처리 할 수있게 해주는 프레임워크 이다. 단일 서버에서 수천대의 머신으로 확장 할 수 있도록 설계되었다. 일반적으로 하둡파일시스템(HDFS)과 맵리듀스(MapReduce)프레임워크로 시작되었으나, 여러 데이터저장, 실행엔진, 프로그래밍 및 데이터처리 같은 하둡 생태계 전반을 포함하는 의미로 확장 발전 되었다. [출처] [빅데이터] 하둡(Hadoop)이란?|작성자 에이콘아카데미 하둡 프레임워크는 중요 구성요소 1. 맵리듀스 데이터처리 프레임워크 - 데이터 처리 및 프로그래밍의 패러다임이라고 표현. 데이터베이스 엔진과 유사하다. 2. 하둡 분산형 파일시스템(Hadoop D.. 2019. 10. 1. 이전 1 다음