
Data Science ofwel in het Nederlands Datawetenschap is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten te onttrekken uit zowel gestructureerde als ongestructureerde data. Eigenlijk bestaat een data analyst al langer als het begrip zelf aangezien we al heel lang data interpreteren.
Data science wordt g-eigenlijk onderverdeeld in 3 grote categorieën :
Storing | Scrubbing | Analyzing |
Hierin word de data opgeslagen | Hierin wordt de dat “simpeler” gemaakt om te analyseren | Hierin wordt data gevisualiseerd zodat ze makkelijker is om te interpreteren. |
Tools | ||
spreadsheet | Text-editors, scripting tools and programming languages | Python |
Waarom volgde ik deze cursus?
Het is zeer belangrijk om gestructureerd te werk te gaan, hiervoor is het makkelijk om gebruik te maken van databases. Ik koos deze cursus om ik een inleidende cursus wou over wat databases zijn en hoe je ze kun gebruiken binnen jouw onderneming.
Wat leerde ik bij?
In de inleiding van de cursus ging het over de privacy regelingen met zoektermen. Je kent het wel, je zoekt bijvoorbeeld een paar schoenen om en de komende dagen wordt je overspoeld door advertenties over schoenen. Ook hoorde ik de zeer interessante term correlatie vallen. Correlatie is een statistische maat die uitdrukt in hoeverre twee variabelen lineair met elkaar verbonden zijn (d.w.z. dat zij samen met een constante snelheid veranderen). Het is een veelgebruikt instrument om eenvoudige verbanden te beschrijven zonder een uitspraak te doen over oorzaak en gevolg.