Data
Updated:
DATA
Data (데이터): 현실 세계로부터 수집된 사실 , 값 들중 정형화되고 기록될만한 가치가 있다고 판단되는 현실세계의 현상이나 사건에 대한 묘사.
Information (정보) : 어떤 상황에 의사 결정을 할 수 있게하는 지식.
DIKW 피라미드
지혜 /\
--
지식 / \
------
정보 / \
----------
데이터 / \
---------------
Data 특징
존재적 특징
정서적 데이터
데이터 하나에 함축된 의미를 갖고있는 데이터 ( 나는 오늘 기분이 좋다.)
정량적 데이터
측정이나 설명이 가능한 데이터 ( 이름 , 나이 등등)
형태적 특징
정형데이터
- 저장하는 데이터의 구조( 스키마 )가 미리 정의
- TType, Length가 미리 정의되어있음.
- DBMS에서 스키마를 관리하는 DB(Dictionary)가 별도로 존재하며 DB저장소와 구분됨
반정형 데이터
- 메타데이터를 갖고있으며, 파일 형태로 저장됨
비정형 데이터
- 객체화 되어있는 데이터
- 텍스트 , 이미지 , 동영상 등이 비 정형 데이터임.
구분 | 정형데이터 | 반정형 데이터 | 비정형 데이터 |
---|---|---|---|
source | 내부 업무 데이터 , DBMS시스템 ,DW 시스템 | 웹 센서 Excel | Pdf 이미지/오디오/비디오 SNS, GIS |
저장 형태 | Data Base , 스프레드 시트 | XML CSV .log | .pdf Mp4 , mp3 , .mpec .jpg,png,jepg 등 |
수집 방법 | SQL , OPEN API | Scrapper , Crawler Opne API , Longscriber , Sencsor | Scrapper , Crawler , 촬영 , 녹음 |
수집 난이도 | 낮음 | 보통 | 높음 |
처리 난이도 | 낮음 | 보통 | 높음 |
필요한 기술 | ERD해석 , SQR프로그래밍 , 통계 | XML 처리 , No SQL , 수집 및 처리기술 | 텍스트마이닝 , GIS , 이미지 , 영상 분석 ( 파싱 ➡️ 메타기반 데이터셋 ➡️ 정형데이터 구조 로 변환) |
Leave a comment