Datasett
samling av data / From Wikipedia, the free encyclopedia
Et datasett eller en datamengde er en samling av data. Innen tabulare data vil et datasett korrespondere til en eller flere databasetabeller, hvor hver kolonne i en tabell representerer en variabel og hver rad representerer en oppføring (record). Datasettet lister opp verdier for hver av variablene, som for eksempel høyde og masse til et objekt, og gjør dette for hvert av medlemmene i datasettet. Datasett kan også bestå av en samling av dokumenter eller filer.[2]
Innen åpne data er et datasett en enhet for å måle informasjonen som er utgitt i et offentlig åpent datalager. Den europeiske åpne dataportalen aggregerer mer enn en halv million datasett.[3] Enkelte andre problemstillinger (som sanntids datakilder,[4] ikke-relasjonelle datasett, med mer) gjør det vanskelig å nå konsensus om dette.[4]