빅데이터 종류
1. 정형 데이터 (Structured Data)
정형 데이터는 관계형 데이터베이스와 같은 구조에서 저장되는 데이터이다. 이러한 데이터는 명확한 규칙에 따라 저장되고, 테이블, 열, 로우로 구성된다. 예를 들어 주문 내역, 고객 정보, 재고 현황과 같은 데이터가 정형 데이터에 해당한다. 정형 데이터는 SQL과 같은 쿼리 언어를 사용하여 쉽게 관리하고 분석할 수 있다.
2. 비정형 데이터 (Unstructured Data)
비정형 데이터는 구조화되어 있지 않은 형태의 데이터이다. 이러한 데이터는 주로 텍스트, 사진, 동영상, 소셜 미디어 게시물 등으로 구성된다. 비정형 데이터는 규칙에 따라 저장되지 않기 때문에 데이터베이스에 직접 적재하는 것이 어렵다. 비정형 데이터를 분석하기 위해서는 텍스트 마이닝, 이미지 처리, 영상 분석 등의 특별한 기술과 도구가 필요하다.
3. 반정형 데이터 (Semi-structured Data)
반정형 데이터는 부분적으로 구조화되어 있는 데이터로, 일부는 구조화된 형태를 가지고 있지만 나머지는 비구조화되어 있다. 일반적인 형태는 비정형 데이터와 비슷하지만, 데이터에 메타데이터나 태그가 포함되어 있어 검색이나 분류에 용이하다. 일반적인 예로는 XML이나 JSON 형태의 데이터가 있다.
4. 메타데이터 (Metadata)
메타데이터는 데이터에 대한 설명이나 데이터 자체의 특성을 나타내는 데이터이다. 예를 들어 파일의 크기, 생성일, 수정일 등이 메타데이터에 해당한다. 메타데이터는 데이터를 관리하고 분석할 때 유용한 정보를 제공한다.
5. 시계열 데이터 (Time Series Data)
시계열 데이터는 일정한 시간 간격으로 발생한 데이터의 시퀀스이다. 예를 들어 주식 시장에서 각 시간별 주가, 경기 데이터에서 특정 기간 동안의 경기 결과 등이 시계열 데이터에 해당한다. 시계열 데이터는 패턴 분석, 예측, 이상 탐지 등의 분석에 유용하다.