Guide – Konverter fra PDF til Excel
PDF-dokumenter bruges ofte som distributionsformat, og for at få adgang til dataene deri, skal de konverteres. Det udføres ved at importerer PDF til Excel, og med Power Query funktionen i Excel, konverteres dataene til brugbare Excel-data.
PDF-dokumentet
For at få de data du ønsker konverteret fra PDF til Excel, kræver det at de står pænt under hinanden i kolonner. PDF-dokumentet må godt indeholde forside, sidehoveder, sidefødder og billeder, for Power Query tager kun det indhold som den kan genkende som »tabeller«.
Eksempel
Eksemplet består af 4 sider i alt, en forside og tre sider med de ønskede data. Billederne på skrå viser en forstørrelse af henholdsvis data for Sjælland og sidefod/sidehoved:
Sådan Importer du PDF til Excel
1. Importér PDF dokumentet til Excel. Vælg under fanen »Data« »Hent data | Fra fil | Fra PDF-fil«:
Når du har markeret PDF-filen, klik på knappen »Importér«.
2. Vælg alle elementer. Listerne vi ønsker er dem som Excel har genkendt som tabeller, med navnene »Table…«. Vi vil samle alle listerne til én lang liste, derfor skal du markér linjen med det gule mappe-ikon, hvorefter en efterfølgende filtrering sørger for det kun er tabellerne der importeres:
Klik på knappen »Transformér data«.
3. Power Query. I dette vindue foretager vi alle nødvendige opsætninger så vi får dataene som vi ønsker det:
a. Filtrer for ønskede data. Vælg filtreringsknappen for kolonnen »Kind«, og filtre kun efter »Table«:
b. Fjerne overflødige data. Højreklik på kolonneoverskriften »Data« som skal beholdes, og vælg på genvejsmenuen »Fjern andre kolonner«:
c. Vise data. Klik på udfoldningsikonet, placeret i højre side ved kolonneoverskriften, og fravælg »Anvend det oprindelige….«:
d. Tilføje overskrifter. Den første linje i datasættes skal tilføjes som overskrifter:
Vælg knappen »Brug den første række som overskrifter« under fanen »Transformér«:
og her ses resultat:
e. Anvendte trin. Hver gang der ændres noget, gemmes handlingen i listen »ANVENDTE TRIN«, som vises i højre side af vinduet. Du kan slette et trin ved at klikke på krydset, hvis du fortryder en handling, og slet fra neden af og opefter, ellers kan der nemt ske ulykker!
Nogle gange hjælper PowerQuery for meget. Den har automatisk tilføjes trinnet »Ændret type« (i eksemplet giver dette dog ingen problemer), så lad os slette trinnet, ved at klikke på det røde kryds.
f. Fjerne uønskede ekstra rækker. Overskrifter fra hver liste, optræder i den samlede liste. De fjernes ved en filtrering, hvor du tager en af kolonnerne, f.eks. ”Landsdel” og fravælger ”Landsdel”:
g. Formatering af kolonnerne. Med knappen til venstre i kolonneoverskriften, kan kolonnes format ændres. Det nuværende format er en sammenblanding af både tekst (ABS) og tal (123):
Skift formaterne for kolonnerne til: Dato til »Dato«, Landsdel til »Tekst«, By til »Tekst« og Omsætning til »Valuta«:
h. Gem listen i Excel. I fanen Hjem, klik på den øverste halvdel af knappen »Luk og indlæs«:
Nu er de ønskede data fra PDF-dokument indsat i et nyt Excel ark, som en tabel:
(Bemærk omsætningstallene ikke er formateret, hertil må du bruge formateringsværktøjerne i Excel).
Efterfølgende ændringer
Er PDF-dokumentet blevet ændret med nye data (filen er blevet overskrevet), genindlæses dataene med alle de opsætninger der er lavet med Power Query, ved at højreklikke på tabellen og på genvejsmenuen vælge »Opdater«.
Ønsker du med den aktuelle opsætning, en andet kildefil (andet PDF-dokument med samme struktur), udføres det på følgende måde:
1. Åbne Power Query«. Vælg »Forespørgsler og forbindelser« under fanen Data:
I panelet »Forespørgsler og forbindelser« i højre side af vinduet, dobbeltklik på forbindelsen:
2. Vælg under fanen Hjem, »Indstillinger for datakilde«:
Markér på listen hvilken kildefil det er, og klik på knappen »Skift kilde…«, og dernæst på knappen »Gennemse…«:
Ud fra listen, kan der laves Pivottabeller, diagrammer, beregninger etc., som automatisk bliver opdateret, når forbindelsen til PDF-dokumentet bliver opdateret.
Vil du vide mere om Excel?
Excel kan mange ting, og hvis du er interesseret i at lære mere om hvordan du bruger Excel, så tjek vores Excel Kursus oversigt hvor du finder kurser i Aarhus og København
Er du til mere fleksibel læring, så kan vi tilbyde vores Excel E-learning kurser som består af en række videoer med øvelser.
Du kan også læse blogindlægget om hvordan man indsætter en PDF fil i Word
