Los datos estructurados son datos que se almacenan en un lugar fijo dentro de un archivo o registro. Normalmente se almacenan en una base de datos relacional (RDBMS), pero también se puede encontrar en bases de datos NoSQL, por ejemplo. Los datos estructurados pueden ser texto, fechas o números.
Los datos no estructurados comprenden datos de archivos y objetos y no se han definido ni almacenado de forma predefinida. Aunque los datos no estructurados más comunes consisten en texto, también pueden incluir números, imágenes y audio. Los datos no estructurados se utilizan en todas las funciones del negocio. Algunos ejemplos son: finanzas (facturas, formularios), sanidad (registros médicos e imágenes), sector público (documentos, datos de investigación), fabricación (archivos de diseño), marketing (fotos), TI (datos de IoT), ventas (correos electrónicos con clientes), atención al cliente (redes sociales) y más.
Aunque cambian y se acumulan rápidamente, gran parte de los datos no estructurados que se recopilan y almacenan se procesan manualmente, si es que lo hacen. Por ejemplo, el correo electrónico suele ser procesado por una persona que lo lee, extrae lo importante (a veces copiándolo y pegándolo en otro correo electrónico o en una aplicación) y toma medidas en función de su contenido.
Pero con el avance de las tecnologías de IA como el aprendizaje automático, la visión artificial y el procesamiento del lenguaje natural, más información no estructurada se puede aprovechar y analizar automáticamente, lo que impulsa una visión empresarial más rápida.