정형 / 반정형 / 비정형 데이터 분류
1. 정형 데이터 Structured
보통 RDBMS 의 고정된 필드에 저장되며 데이터 스키마를 지원한다.
RDB와 스프레드 시트가 대표적이다.
2. 반정형 데이터 Semi-structured
데이터 속성인 메타데이터를 가지며 일반적으로 스토리지에 저장되는 데이터 파일이다.
XML 형태의 데이터로 값과 형식이 다소 일관성이 없다.
HTML, XML, JSON, 웹문서, 웹로그, 센서 데이터 등이 있다.
3. 비정형 데이터 UnStructured
언어 분석이 가능한 텍스트 데이터이다.
형태와 구조가 복잡한 이미지나 동영상 같은 멀티미디어 데이터이다.
소셜 데이터, 문서, 이미지, 오디오, 비디오 등이 있다.
이상 빅데이터에서 사용하는 데이터 유형 분류이다.
보통 RDBMS 의 고정된 필드에 저장되며 데이터 스키마를 지원한다.
RDB와 스프레드 시트가 대표적이다.
2. 반정형 데이터 Semi-structured
데이터 속성인 메타데이터를 가지며 일반적으로 스토리지에 저장되는 데이터 파일이다.
XML 형태의 데이터로 값과 형식이 다소 일관성이 없다.
HTML, XML, JSON, 웹문서, 웹로그, 센서 데이터 등이 있다.
3. 비정형 데이터 UnStructured
언어 분석이 가능한 텍스트 데이터이다.
형태와 구조가 복잡한 이미지나 동영상 같은 멀티미디어 데이터이다.
소셜 데이터, 문서, 이미지, 오디오, 비디오 등이 있다.
이상 빅데이터에서 사용하는 데이터 유형 분류이다.
댓글
댓글 쓰기