정형 데이터는 파일이나 기록 내 고정된 위치에 저장되는 데이터입니다. 일반적으로 관계형 데이터베이스(RDBMS)에 저장되지만 NoSQL 데이터베이스에서도 찾을 수 있습니다. 정형 데이터는 텍스트, 날짜 또는 숫자일 수 있습니다.
비정형 데이터는 파일 및 개체 데이터로 구성되며 사전에 정의된 방식으로 정의되거나 저장되지 않습니다. 가장 일반적인 비정형 데이터는 텍스트로 구성되지만 숫자, 이미지 및 오디오를 포함할 수도 있습니다. 비정형 데이터는 비즈니스의 모든 기능에서 사용됩니다. 예시: 재무(송장, 양식), 의료(의무 기록과 이미지), 공공 부문(문서, 연구 데이터), 제조(설계 파일), 마케팅(사진), IT(IoT 데이터), 영업(고객 이메일), 고객 서비스(소셜 미디어) 등.
빠르게 변화하고 축적되고 있지만, 수집 및 저장되는 비정형 데이터의 대부분은 수작업으로 처리됩니다. 예를 들어, 이메일은 대부분 사람이 읽고, 중요한 내용을 추출하고(다른 이메일이나 애플리케이션에 복사하여 붙여넣는 등), 그 내용을 바탕으로 조치를 취함으로써 처리됩니다.
그러나 머신 러닝, 머신 비전, 자연어 처리 같은 AI 기술의 발전으로 이러한 비정형 정보를 더 많이 자동으로 활용 및 분석하여 비즈니스 인사이트를 더 빠르게 얻을 수 있게 되었습니다.