Wat is Gestructureerde Data?

Deze blog is onderdeel van de blogreeks: “Data Structuur: de basis”

Verzamelen van de juiste data: Gestructureerde Data

 

Om waardevolle informatie uit je data te kunnen halen is het belangrijk dat de data op een bepaalde manier is gestructureerd of gestructureerd kan worden. Maar wat is gestructureerde data eigenlijk?

Gestructureerde data wordt meestal gevonden in Excel datasets of relationele databases (in deze blog gaan we verder in op relationele databases). Het betekent dat alle gegevens worden opgeslagen in kolommen of velden. Elke rij geeft een nieuw exemplaar aan (persoon, item, bedrijf of ander stuk informatie). Wanneer je data gestructureerd is, is het eenvoudiger om stukjes informatie te zoeken voor jou als persoon, maar ook voor de computer, om uiteindelijk snellere en betere analyses uit te voeren.

Ongestructureerde data is in wezen ‘al het andere’. Ongestructureerde data kan een onderliggende structuur hebben, maar zijn niet gestructureerd via vooraf gedefinieerde datamodellen of schema’s. Het kan tekstueel of niet-tekstueel zijn, en door mensen of machines gegenereerd.

Voorbeelden van ongestructureerde data:

  • Tekstbestanden: tekstverwerking, spreadsheets, presentaties, e-mail, logboeken.
  • E-mail: e-mail heeft een bepaalde onderliggende structuur dankzij de metadata, en we noemen het soms semi-gestructureerd. Het berichtveld is echter ongestructureerd en traditionele analysetools kunnen het niet automatisch verwerken tot een bepaalde structuur.
  • Sociale media: data van Facebook, Twitter, LinkedIn.
  • Website: YouTube, Instagram, sites voor het delen van foto’s.
  • Mobiele data: tekstberichten, locaties.
  • Communicatie: Chat, IM, telefoonopnames, samenwerkingssoftware.
  • Media: mp3, digitale foto’s, audio- en videobestanden.
  • Zakelijke toepassingen: MS Office-documenten, productiviteitstoepassingen.
Voorbeeld van ongestructureerde data en gestructureerde data

Aan de hand van deze blog hopen we je dat je een beter beeld heb gekregen van wat gestructureerde data en ongestructureerde data is. Ter reflectie kun je jezelf de Volgende vragen stellen: ‘Wat voor type ongestructureerde data heb ik?’, en indien aanwezig, ‘Hoe zou ik deze data om kunnen zetten naar gestructureerde data?’

Wil jij je data beter structureren, zodat je hier betere inzichten uit kunt halen?

Bel ons, stuur een berichtje via het contactformulier of stuur ons een e-mail. Wij worden er blij van om samen met jullie te kijken hoe je je data beter kunt structuren, zodat je hier later interessante inzichten uit kunt halen!

Wil je meer lezen over wat schone data precies is? Klik dan op deze link.

Maaike Blok

Maaike Blok

Maaike heeft een Master in Data Science en Entrepreneurship en ervaring als manager binnen verschillende ondernemingen. Samen kunnen we kijken hoe we jouw vraagstuk kunnen herschrijven naar een datavraagstuk. Klik hier om haar een mail te sturen.

Benieuwd wat we met jouw
data kunnen doen?

Scroll naar top