Datakvalitet i BI-strategi: Så bygger du förtroende för dina siffror
“Siffrorna stämmer inte.” Det är dödskyssen för varje BI-satsning. När ingen litar på datan går alla tillbaka till Excel och magkänsla. Datakvalitet är inte ett tekniskt problem – det är ett förtroendeproblem. Här är hur du löser det.
På Excel Department har vi implementerat BI för 60+ svenska företag. Den vanligaste anledningen till misslyckad BI är inte fel verktyg eller dålig design. Det är dålig datakvalitet som undergräver förtroende från dag ett.
Den här guiden visar inte akademiska teorier om data governance. Den visar praktiska steg som svenska medelstora företag faktiskt kan genomföra.
Varför datakvalitet avgör BI-framgång
Du kan ha världens snyggaste Power BI-dashboard. Men om VD:n öppnar den och säger “Det där stämmer inte”, är hela investeringen värdelös.
Kostanden av dålig datakvalitet
Ett handelsföretag vi arbetade med hade orderdata i tre system: CRM, ekonomisystem och lagerhantering. Samma order kunde ha olika ordernummer, olika värden och olika status i de tre systemen.
Resultat: – Försäljningsrapporter visade olika omsättning beroende på källa – Ledningsgrupp spenderade 45 minuter varje måndag på att “stämma av siffror” – Beslut försenades med veckor i väntan på “rätt siffra” – BI-dashboarden användes inte för ingen litade på den
Kostnad i pengar: – 3 personers tid 2 timmar/vecka att jämföra siffror = 30 000 kr/månad – Försenade beslut som kostade missade möjligheter = omätbart men betydande
Förtroende tar tid att bygga, sekunder att förstöra
När BI-systemet lanseras har ni 2-3 månader för att bevisa att det fungerar. Om siffror är fel under den perioden är det extremt svårt att återuppbygga förtroende.
Ett tillverkningsföretag lanserade produktionsdashboard. Vecka två hittade produktionschefen ett fel – en maskin visades som “stillestånd” trots att den körde. Felet fixades på 10 minuter, men produktionschefen slutade lita på systemet. Sex månader senare använde han fortfarande sina Excel-filer.
Läxa: Perfekt data från dag ett är omöjligt. Men transparent hantering av fel och snabba korrigeringar bygger förtroende.
De fem dimensionerna av datakvalitet
Datakvalitet är inte en binär fråga (bra/dålig). Det är flera dimensioner som alla måste hanteras.
1. Accuracy (Riktighet)
Definition: Reflekterar data verkligheten korrekt?
Exempel på accuracy-problem: – Kundadress: “Stokholm” istället för “Stockholm” – Produktpris: 1 000 kr istället för 10 000 kr (missat en nolla) – Datum: 2025-13-01 (månad 13 existerar inte)
Hur säkerställa accuracy: – Validering vid inmatning (dropdown istället för fritext där möjligt) – Automatiska kontroller (pris måste vara mellan X och Y) – Regelbundna audits mot källsystem
Verktyg i Excel/Power BI: – Power Query: IF-satser som flaggar osannolika värden – Excel: Datavalidering på celler – Power BI: DAX-mått som räknar antal “misstänkta” poster
2. Completeness (Fullständighet)
Definition: Är all nödvändig data närvarande?
Exempel på completeness-problem: – Kundpost utan e-postadress (behövs för kampanjer) – Order utan tilldelad säljare (omöjligt att räkna provision) – Produkter utan kategori (kan inte analysera per kategori)
Hur säkerställa completeness: – Obligatoriska fält i inmatningssystem – Identifiera kritiska vs nice-to-have-fält – Mät completeness: % av poster med fullständig info
Exempel från verklig kund:
Vi analyserade deras kunddata (3 200 kunder): – 100 % hade namn och kundnummer (bra!) – 87 % hade e-post (acceptabelt) – 34 % hade bransch registrerad (dåligt – kunde inte segmentera)
Åtgärd: Kampanj för att fylla i bransch. Efter 3 månader: 78 %.
3. Consistency (Konsistens)
Definition: Representeras samma sak på samma sätt överallt?
Exempel på consistency-problem: – Företagsnamn: “Volvo AB”, “Volvo”, “VOLVO AB”, “AB Volvo” – Produktnamn: “Widget-123”, “Widget 123”, “Widget123” – Datum: “2026-01-30”, “30/1/26”, “30 januari 2026”
Detta dödar BI-analyser: Försök räkna försäljning per kund när samma kund har fyra varianter av namnet. Ni får fyra kunder istället av en.
Hur säkerställa consistency: – Master data-register (en officiell källa för kundnamn, produktnamn etc.) – Standardiserade format (datum alltid YYYY-MM-DD, belopp alltid X XXX kr) – Automatisk konvertering vid import (Power Query kan standardisera format)
Power Query-exempel:
= Table.TransformColumns(Källa,{{"Datum", each Date.From(_), type date}})
Detta tvingar alla datum till standardformat oavsett hur de ser ut i källan.
4. Timeliness (Aktualitet)
Definition: Är data aktuell nog för det beslut som ska fattas?
Exempel på timeliness-problem: – Dashboard visar förra månadens siffror (för gammalt för daglig styrning) – Lagersaldo uppdateras en gång i veckan (för sällan för e-handel) – Säljdata uppdateras realtid (onödigt för månatlig styrelse-rapport)
Rätt aktualitet beror på användningsfall:
| Beslut | Behövd aktualitet |
|---|---|
| E-handel lagerstatus | Realtid/var 15:e min |
| Daglig försäljningsuppföljning | Nattetid (gårdagens siffror) |
| Månatlig ekonomirapport | En gång per månad |
| Årsredovisning | En gång per år |
Vanligt misstag: Försöka göra allt i realtid. Det kostar prestanda och är ofta onödigt.
Lösning: Definiera uppdateringsfrekvens per dashboard baserat på faktiskt behov.
Läs mer: Power BI för företag – Uppdateringsstrategier
5. Validity (Giltighet)
Definition: Följer data definierade regler och format?
Exempel på validity-problem: – E-post: “kontakt#företag.se” (@ saknas) – Telefon: “08123456” (för få siffror) – Organisationsnummer: “12345” (fel längd/format) – Pris: -500 kr (negativt pris inte tillåtet)
Hur säkerställa validity: – Datavalidering i källsystem (Excel, CRM, ERP) – Regex-kontroller vid import – Power Query-transformationer som flaggar ogiltiga värden
Praktisk process för att förbättra datakvalitet
Datakvalitet blir bättre genom systematiskt arbete, inte av magisk automation.
Fas 1: Datakvalitetsaudit (Vecka 1-2)
Steg 1: Identifiera kritiska datakällor – Vilka system innehåller data för er BI? – Vilka tabeller/fält är mest kritiska?
Steg 2: Mät nuläge
För varje kritisk datakälla, mät: – Accuracy: Stickprovskontroll mot verklighet – Completeness: % tomma fält – Consistency: Antal varianter av samma sak – Timeliness: Hur gammal är datan? – Validity: % poster som bryter regler
Exempel-rapport:
| Dimension | Mått | Resultat | Mål |
|---|---|---|---|
| Completeness | % kunder med bransch | 34 % | 80 % |
| Consistency | Antal namnvarianter för topp 100 kunder | 2,3 per kund | <1,1 |
| Timeliness | Ålder på orderdata | 18 timmar | <12 timmar |
| Validity | % ogiltiga e-postadresser | 8 % | <2 % |
Steg 3: Prioritera
Alla problem fixas inte på en gång. Prioritera baserat på: – Affärspåverkan (blockerar detta viktiga beslut?) – Svårighetsgrad (hur lätt är det att fixa?) – Synlighet (påverkar detta förtroende för BI?)
Fas 2: Quick wins (Vecka 3-4)
Fixa några uppenbara problem snabbt för att bygga momentum.
Exempel på quick wins: – Standardisera namnvarianter för topp 50 kunder (manuellt i master data) – Implementera datavalidering för e-post i CRM – Sätt upp automatisk nattlig uppdatering istället för manuell
Resultat: Synliga förbättringar som bygger förtroende för processen.
Fas 3: Systematisk förbättring (Månad 2-6)
Implementera processer för löpande kvalitet:
1. Data governance-struktur – Data owner: Ansvarar för kvaliteten på specifik data (t.ex. säljchef för kunddata) – Data steward: Utför dagligt kvalitetsarbete – Data governance board: Ledningsgrupp som prioriterar datakvalitetsarbete
2. Master data management
Definiera en officiell källa för: – Kunder (kundnummer, namn, kontaktinfo) – Produkter (artikelnummer, namn, kategori) – Anställda (personalnummer, namn, avdelning) – Organisationsstruktur (avdelningar, kostnadsställen)
3. Datavalidering vid källan
Bästa stället att säkra kvalitet är vid inmatning: – CRM-systemet tillåter inte ogiltig e-post – Ekonomisystem kräver att kostnadställe anges – Produktregistret har dropdown för kategori istället för fritext
4. Automatiska kvalitetskontroller
Bygg dashboards som flaggar kvalitetsproblem: – Nya dubbletter upptäckta – Fält som blivit tomma – Värden utanför normala intervall
Exempel Power BI-mått:
Andel kunder utan e-post =
DIVIDE(
COUNTROWS(FILTER(Kunder, ISBLANK(Kunder[Email]))),
COUNTROWS(Kunder)
)
Visualisera detta över tid. När siffran ökar, agera.
Fas 4: Kontinuerlig övervakning (Löpande)
Månadsvis kvalitetsrapport: – Trender för de fem dimensionerna – Nya problem identifierade – Avslutade förbättringsåtgärder – Nästa månads prioriteringar
Kvartalsvis datakvalitets-audit: – Stickprovskontroll av kritisk data – Validera att processer följs – Justera baserat på nya behov
Verktyg för datakvalitet
Olika verktyg för olika behov och budgetar.
Excel och Power Query (Gratis, ingår i Office 365)
Användningsområden: – Rensa och standardisera data vid import – Hitta dubbletter – Validera format – Konvertera mellan format
Exempel: Hitta dubbletter i kundlista
Power Query-steg: 1. Importera kunddata 2. Group by “Kundnamn”, räkna antal 3. Filtrera där antal > 1 4. Resultat: Alla dubbletter listade
Fördel: Ingen extra kostnad, majoriteten kan redan Excel.
Nackdel: Manuell process, inte skalbart för mycket stora datamängder.
Power BI Data Quality Dashboard
Bygg en dashboard som mäter kvalitet: – % completeness per fält över tid – Antal dubbletter upptäckta – Antal invalid värden – Ålder på data
Fördel: Synliggör kvalitet, driver förbättring.
SQL Server Data Quality Services (För större organisationer)
Om ni har SQL Server kan DQS användas för: – Automatisk dubblettdetektering – Datastandardisering – Matchning mellan källsystem
Fördel: Kraftfullt, automatiserat.
Nackdel: Kräver SQL Server-kompetens och infrastruktur.
Tredjepartsverktyg
Produkter som Talend, Informatica, Ataccama – kraftfulla men dyra och kompletta.
Rekommendation för svenska SME: Börja med Excel/Power Query och Power BI. Uppgradera när volymen kräver det.
Nästa steg – Förbättra er datakvalitet
Hur går ni från “vi vet att data är rörig” till faktisk förbättring?
Vecka 1: Kartlägg nuläget
Enkel checklista:
För era 3 viktigaste datakällor, svara: – [ ] Litar ni på siffrorna från denna källa? – [ ] Finns det dubbletter? – [ ] Är fält tomma som borde vara ifyllda? – [ ] Är formaten konsekventa? – [ ] Hur gammal är datan?
Om ni svarar “nej” eller “vet ej” på första frågan eller “ja” på 2-3, har ni datakvalitetsproblem.
Vecka 2-3: Kvantifiera problemet
Mät faktiskt: – Completeness: Öppna Excel, räkna tomma celler – Consistency: Använd Power Query, gruppera och räkna variationer – Timeliness: Kolla senaste uppdateringsdatum
Output: Enkel rapport som kvantifierar problemet.
Månad 2: Implementera quick wins
Välj 2-3 förbättringar ni kan göra direkt: – Rensa upp topp 50 dubbletter – Lägg till datavalidering i källsystem – Automatisera en manuell uppdateringsrutin
Output: Mätbara förbättringar som bygger förtroende.
Månad 3-6: Systematisera
- Tilldela data owners
- Bygg kvalitetsdashboard
- Etablera månatlig uppföljning
Behöver ni hjälp?
Excel Department hjälper svenska företag förbättra datakvalitet som del av BI-strategi.
Vår approach: 1. Datakvalitetsaudit – kvantifiera problemet 2. Master data-strategi – definiera källor och struktur 3. Implementation av kvalitetsprocesser 4. Automatisering med Power Query/Power BI 5. Utbildning för data owners och stewards
Boka kostnadsfri datakvalitets-genomgång (1 timme)
Sammanfattning
Datakvalitet är grunden för framgångsrik BI. Ingen använder dashboards de inte litar på.
De fem dimensionerna: – Accuracy: Är det rätt? – Completeness: Finns allt? – Consistency: Är det enhetligt? – Timeliness: Är det aktuellt? – Validity: Följer det reglerna?
Praktisk väg framåt: 1. Mät nuläge – kvantifiera problemet 2. Quick wins – bygg momentum 3. Systematisera – processer och ansvar 4. Automatisera – dashboards och kontroller 5. Övervaka – kontinuerlig förbättring
Perfekt datakvalitet är omöjligt. Men tillräckligt bra för att fatta bättre beslut än magkänsla är absolut uppnåeligt.
Börja med att mäta. Det ni kan mäta kan ni förbättra.
Relaterade guider: – Business intelligence för medelstora företag – Övergripande BI-strategi – Excel som BI-verktyg – Power Query för datarensning – Power BI för företag – Datamodellering och kvalitet