Big Data 시대의 도래 Hadoop 에 주목하자

시스템은 운영시간이 길어지면 길수록 데이터는 늘어난다.

그 데이터가 어디까지 커질지는 알수가 없다.

대용량 파일에 대한 관리 문제를 구글에서 먼저 접근하여 2004년 논문을 발표하였다.

이에 오픈소스 진영에서 아파치에서 HDFS(Hadoop Distributed File System)을 내놓았다.

적은 서버 모델을 여러대 운영하여 대형파일을 운영할 수 있도록 해주는 모델이다.


파일을 64M 단위로 나누어 장비에 분산저장하는 방식으로 사용자는 하나의 파일로 보이나 실제는 나누어 저장되어 있다.

페이스북, 야후, 아이비엠등에서 사용하고 있다.

대용량 파일에서 좋은 대안이 아닐 수 없다

댓글

이 블로그의 인기 게시물

한글 2010 에서 Ctrl + F10 누르면 특수문자 안뜰 때

아이폰에서 RFID 사용하는 방법

맥 화면이 안나올때 조치방법