Datadrivna beslut, rådata, aggregerad data, förädlad data, konsumerbar data… det finns ett virrvarr av termer som kan vara svårnavigerat för den som möter det för första gången.
Nedan exempel är helt fiktivt och baserar sej på fejkdata för att påvisa användningen av data och hur det kan nyttjas till många olika saker, baserat på hur man väljer att titta på den och vad man väljer att göra med den.
Tänk dej att du har ett antal anställda som alla har bilar, en del tankar med diesel, andra bensin. Du funderar på om det på något sätt går att agera proaktivt och göra besparingar på något som inte går att undvika. Alla måste ju tanka sina bilar, men kan de göra det på ett smartare sätt än idag som gör att du generellt kan sänka dina bränslekostnader?
Från ditt fönster råkar du se en bensinmack och du ser hela tiden att priserna justeras, både under dagen och från dag till dag. Så du bestämmer dej för att skriva upp priserna vid olika tidpunkter för att se vad du kan lära dej av det.
Din datainsamling (din rådata) över en månad skulle då kunna se ut så här:
| Datum | Tid | Bensin (kr/l) | Diesel (kr/l) |
|---|---|---|---|
| 2025-10-01 | 11:19 | 19,98 | 20,5 |
| 2025-10-01 | 16:33 | 19,77 | 20,28 |
| 2025-10-02 | 07:27 | 19,82 | 20,55 |
| 2025-10-06 | 08:02 | 19,44 | 20,19 |
| 2025-10-06 | 13:33 | 19,66 | 20,17 |
| 2025-10-07 | 10:11 | 19,79 | 20,57 |
| 2025-10-07 | 13:53 | 19,71 | 20,52 |
| 2025-10-08 | 08:48 | 19,75 | 20,36 |
| 2025-10-08 | 11:41 | 19,97 | 20,33 |
| 2025-10-13 | 07:20 | 19,8 | 20,42 |
| 2025-10-14 | 07:58 | 19,56 | 19,96 |
| 2025-10-20 | 15:52 | 19,72 | 20,16 |
| 2025-10-21 | 10:59 | 19,45 | 20,2 |
| 2025-10-21 | 14:48 | 19,42 | 20,08 |
| 2025-10-22 | 14:18 | 19,56 | 20,08 |
| 2025-10-23 | 11:25 | 19,69 | 20,49 |
| 2025-10-23 | 14:32 | 19,89 | 20,57 |
| 2025-10-27 | 13:38 | 19,49 | 19,89 |
| 2025-10-29 | 09:50 | 19,57 | 20,05 |
| 2025-10-29 | 11:40 | 19,72 | 19,91 |
| 2025-10-30 | 08:50 | 19,88 | 20,37 |
| 2025-10-31 | 16:10 | 19,88 | 20,65 |
Nu har du rådata som består av ett datum, en tid, ett pris på bensin och ett pris på diesel. Detta är din rådata. Din indata.
Utifrån den här datan skulle du kunna ta fram en massa information genom att förädla datan på olika sätt (göra olika beräkningar).
Exempelvis:
- Vilken veckodag är det billigast att tanka (du har ju inte veckodagen i datan, men i och med att du har ett datum så kan du komplettera med den informationen, det gör datorn med lätthet om du vet hur du ska be den om det) genom att räkna ut ett snittpris av alla priser som varit på respektive veckodag. Du får då en statistisk representation där du kan se vilken dag det statistiskt är billigast att tanka bensin respektive diesel.
- Baserat på tidsstämplarna kan du göra en annan beräkning (jämföra medelvärde) och ta reda på om det är billigare att tanka på förmiddagarna eller eftermiddagarna.
- Du kan göra en prognos baserat på datan och se om de första två veckornas medelpris är högre eller lägre än de sista två veckornas medelpris och på så vis få en fingervisning om nästa månads kostnad för drivmedel kommer öka eller minska.
- Skulle ditt dataunderlag sedan sträcka sig över flera år, så hade du också kunnat ta fram medelpriser för respektive månad och göra jämförelser som skulle kunna hjälpa dej i din ekonomiska prognos för drivmedelskostnaderna månad för månad och räkna ut procentsatser baserat på referensmånad och om det är generellt högre eller lägre och applicera det på kommande månaders ekonomisk prognos och även jämföra med faktiskt utfall.
Ovan är exempel på förädling av data. När det går från att vara rådata (det i tabellen) till att bli data du faktiskt använder till något. Det du har gjort i medelvärdesberäkningarna är att aggregera data, du har tagit en mängd datapunkter (varje ”rad” och skapat ett värde av dem). Det kan vara alltifrån medelvärde till adderade till högsta eller minsta värdet eller skillnad mellan högsta och minsta värdet, etc.
Förädla datan kan du göra på olika sätt, allt baserat på hur och var du vill använda datan (konsumera datan).
Är det bara du som är intresserad av att se den, kan excel vara en tillräckligt bra plats att både förädla data och konsumera data. Det kan du då göra genom renodlade uträkningar och själv avläsa siffervärdena som kanske är strukturerade i någon form av tabell, eller i någon form av diagram.
Min grundtes gällande förädling av data är att om den bara ska konsumeras av en person på ett ställe är det ok att den förädlas där den konsumeras. Kan vara i verktyg som excel eller en specifik Power-BI-rapport eller inom ett system. Är det data som ska konsumeras på flera ställen av flera användare och/eller system, är det bättre att skapa konsumerbardata från rådatan och presentera den färdigkonsumerbar för användaren/systemet. Exempelvis genom att spara den i en databas eller i någon typ av fil eller liknande. Den som sen vill titta på (konsumera) datan gör det i det verktyg och på den plats det är lämpligast att göra och kanske också kombineras med annan data hos just den konsumenten eller i just det systemet.