Data Science/Data Science

정형 데이터와 비정형 데이터

눈곱만큼도모름 2024. 4. 30. 14:21
728x90
반응형

정형데이터 : 수치(연속형, 이산형), 짧은 텍스트, 날짜, 시간
비정형 데이터 : 음성, 이미지, 비디오, 텍스트 문서 등

정형 데이터
항상 사전에 정의된 데이터모델, 스키마라는 엄격한 형식을 준수,
데이터 프레임으로 정리가능하고 구성, 정리, 분석이 쉽다.

비정형 데이터는
스키마에 맞지 않다. 
용량이 크며 데이터분석이 어려울수 있다.
때문에 분석이나 학습데이터로 확용하고자 할경우 전형데이터 또는 반정형 데이터를 추출하기위한 전처리가 필요하다.

 

728x90
반응형

'Data Science > Data Science' 카테고리의 다른 글

[DS] Data-centric AI  (0) 2023.08.01