Pracując z danymi, musimy się mierzyć z wieloma różnymi wyzwaniami. Jednym z najbardziej prozaicznych problemów jest próba wyciągnięcia z pliku PDF danych, których potrzebujemy. Oczywiście mowa o wyciągnięciu danych w inny sposób niż manualnie czy metodą robienia zrzutów ekranu. Jak można to zrobić inaczej? Odpowiedź jest prosta – z pomocą Power Query. Przyjrzyjmy się na przykładzie, jak tego dokonać, jednocześnie ułatwiając sobie pracę.

Pobieranie i przekształcanie pliku PDF za pomocą Power Query

Przekształcanie pliku PDF w Power Query – kiedy warto?

Podstawowa kwestia: kiedy warto rozważyć Power Query w kontekście przekształcania pliku PDF? Przede wszystkim wtedy, gdy potrzebujemy wyciągnąć z pliku PDF konkretną zawartość, np. tabelę, a na danych z tej tabeli chcemy dalej robić analizę lub linkować formuły do tychże danych. Jeśli potrzebujemy jedynie 2–3 liczby lub tabelę wyłącznie do celów prezentacji, to nie ma sensu utrudniać sobie życia i tworzyć zapytania PQ. Power Query jest tutaj najprostszym rozwiązaniem i w tym konkretnym przypadku Excel nam nie pomoże. Często jest tak, że można coś zrobić zarówno za pomocą Excela, jak i PQ. Różnica polega jedynie na stopniu trudności. Jednak nie tym razem.

Przekształcanie pliku PDF w Power Query – zestaw danych

Sam wykorzystałem Power Query wielokrotnie do obróbki pliku PDF z banku i zaimportowania tabeli z symulacją spłaty kredytu. Natomiast na potrzeby prezentacyjne spróbujemy zaimportować plik PDF ze skonsolidowanym sprawozdaniem finansowym pobrany ze strony CCC.eu. Do dalszych analiz potrzebujemy rachunek zysków i strat zawarty na drugiej stronie (na 86) PDF z podziałem na marki (CCC, Halfprice etc). Zestaw danych przed pobraniem i przekształceniem prezentuje Tabela 1.

Przekształcanie pliku PDF w Power Query – krok po kroku

By osiągnąć nasz cel, otwieramy nowy arkusz Excel i postępujemy zgodnie z poniższymi krokami:

  1. Data -> Get Data -> From File -> From PDF (Rysunek 1).
  1. Wybieramy plik, który zamierzamy zaimportować (plik w tym przypadku nazywa się 1q-24-CCC). Klikamy „Import”.
  2. Nasz plik ma 86 stron, więc jest to całkiem spory rozmiar i Power Query może potrzebować chwili, by wyświetlić okienko Nawigatora. Jak widzimy na Rysunku 2, po lewej stronie znajduje się spis stron, a po prawej podgląd. Bardzo ważne jest, żeby w tym momencie nie przekształcać całego zestawu danych (stałoby się tak, gdybyśmy wybrali folder 1q-24-ccc i kliknęli „transform data”). W ten sposób niepotrzebnie dodalibyśmy sobie pracy. W naszym przypadku w zupełności wystarczy kliknięcie w nazwę „Table001 (Page 2)”, a następnie „Transform data”. Uwaga. Wybierając Load, załadowaliśmy do zakładki Excela dane widoczne na podglądzie. Nam jednak zależy na delikatnej obróbce i danych wyłącznie w polskiej walucie.

Pozostałe 60% artykułu dostępne jest dla zalogowanych użytkowników serwisu.

Jeśli posiadasz aktywną prenumeratę przejdź do LOGOWANIA. Jeśli nie jesteś jeszcze naszym Czytelnikiem wybierz najkorzystniejszy WARIANT PRENUMERATY.

Zaloguj Zamów prenumeratę Kup dostęp do artykułu

Możesz zobaczyć ten artykuł, jak i wiele innych w naszym portalu Controlling 24. Wystarczy, że klikniesz tutaj.

Ulubione Drukuj

Zobacz również

Skuteczne wdrożenie systemu Business Intelligence – jak uniknąć typowych błędów?

Skuteczne wdrożenie systemu Business Intelligence – jak uniknąć typowych błędów?

Wdrożenie projektu IT to znaczące wyzwanie organizacyjne dla każdej firmy dążącej do usprawnienia kluczowych procesów. Projekty obejmujące budowę rozwiązań analitycznych czy korporacyjnych standardów raportowania są szczególnie skomplikowane i narażone na liczne błędy. Problemy mogą pojawić się na każdym etapie projektu — od planowania, przez wdrożenie, po adaptację i utrzymanie. Wyzwania, takie jak problemy komunikacyjne, sprzeczne wymagania czy brak wsparcia, mogą znacząco wpłynąć na sukces przedsięwzięcia. Jak im sprostać?

Czytaj więcej

Wskaźnik zwrotu z inwestycji ROI – jak go policzyć w Excelu?

Wskaźnik zwrotu z inwestycji ROI – jak go policzyć w Excelu?

Przy różnego rodzaju obliczeniach dotyczących zysków lub strat może się nam pojawić konieczność policzenia tzw. wskaźnika zwrotu z inwestycji ROI (ang. Return On Investment). Wskaźnik ten służy do stwierdzenia, czy dany towar lub dane działanie przynoszą firmie zysk czy stratę. W niniejszym artykule przyjrzymy się, w jaki sposób można taki wskaźnik policzyć z wykorzystaniem arkusza kalkulacyjnego Excel.

Czytaj więcej

Polecamy

Przejdź do

Partnerzy

Reklama

Polityka cookies

Dalsze aktywne korzystanie z Serwisu (przeglądanie treści, zamknięcie komunikatu, kliknięcie w odnośniki na stronie) bez zmian ustawień prywatności, wyrażasz zgodę na przetwarzanie danych osobowych przez EXPLANATOR oraz partnerów w celu realizacji usług, zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Usługa Cel użycia Włączone
Pliki cookies niezbędne do funkcjonowania strony Nie możesz wyłączyć tych plików cookies, ponieważ są one niezbędne by strona działała prawidłowo. W ramach tych plików cookies zapisywane są również zdefiniowane przez Ciebie ustawienia cookies. TAK
Pliki cookies analityczne Pliki cookies umożliwiające zbieranie informacji o sposobie korzystania przez użytkownika ze strony internetowej w celu optymalizacji jej funkcjonowania, oraz dostosowania do oczekiwań użytkownika. Informacje zebrane przez te pliki nie identyfikują żadnego konkretnego użytkownika.
Pliki cookies marketingowe Pliki cookies umożliwiające wyświetlanie użytkownikowi treści marketingowych dostosowanych do jego preferencji, oraz kierowanie do niego powiadomień o ofertach marketingowych odpowiadających jego zainteresowaniom, obejmujących informacje dotyczące produktów i usług administratora strony i podmiotów trzecich. Jeśli zdecydujesz się usunąć lub wyłączyć te pliki cookie, reklamy nadal będą wyświetlane, ale mogą one nie być odpowiednie dla Ciebie.