Strukturierte Daten sind Daten, die an einem festen Ort innerhalb einer Datei oder einem Datensatz gespeichert sind. Sie werden normalerweise in einer relationalen Datenbank (RDBMS) gespeichert, sind aber auch z. B. in NoSQL-Datenbanken zu finden. Strukturierte Daten können Texte, Termine oder Zahlen sein.
Unstrukturierte Daten sind Datei- und Objektdaten, die nicht definiert oder auf vorgegebene Weise gespeichert wurden. Obwohl die meisten typischen unstrukturierten Daten aus Text bestehen, können auch Zahlen, Bilder oder Audios darunter sein. Unstrukturierte Daten werden in jedem Bereich des Geschäftslebens verwendet: Hier einige Beispiele: Finanzen (Rechnungen, Formulare), Gesundheitswesen (Krankenakten und Bildmaterial), öffentlicher Sektor (Dokumente, Forschungsdaten), Fertigung (Designdaten), Marketing (Fotos), IT (IoT-Daten), Vertrieb (E-Mails mit Kunden), Kundenservice (soziale Medien) u. a.
Obwohl es sich gegenwärtig rasch ändert, werden die meisten derzeit gesammelten und gespeicherten unstrukturierten Daten, wenn überhaupt, manuell verarbeitet. E-Mails werden z. B. hauptsächlich von Menschen bearbeitet, die sie lesen, das Wichtige daraus extrahieren (manchmal durch Kopieren und Einfügen in eine andere E-Mail oder in eine Anwendung) und je nach dem Inhalt aktiv werden.
Doch mit fortschreitenden KI-Technologien wie maschinellem Lernen, maschineller Bildverarbeitung und natürlicher Sprachverarbeitung können noch mehr von diesen unstrukturierten Daten genutzt und automatisch analysiert werden, sodass man schnellere Geschäftseinblicke erhält.