Jak przekonwertować stronę internetową na plik PDF lub obrazy w systemie Linux?

Jak przekonwertować stronę internetową na plik PDF lub obrazy w systemie Linux?

Chcesz wiedzieć, jak przechwycić stronę internetową i zapisać ją jako dokument PDF lub obraz za pomocą terminala? Na szczęście Linux ma mnóstwo narzędzi, których można użyć do zautomatyzowania zadania konwersji dokumentów HTML na pliki PDF i obrazy.





Ten artykuł wprowadzi Cię do wkhtmltopdf i wkhtmltoimage, narzędzi, których potrzebujesz, aby ułatwić sobie pracę.





Jak przekonwertować HTML na PDF

Jeśli chcesz przechwycić strony internetowe i przekonwertować je na plik PDF, pomoże Ci narzędzie wkhtmltopdf. Wkhtmltopdf to narzędzie wiersza polecenia typu open source służące do renderowania stron internetowych w dokumentach PDF.





Ponieważ narzędzie działa bezmyślnie w terminalu Linux, nie potrzebujesz żadnego sterownika internetowego ani platformy automatyzacji przeglądarki, takiej jak Selenium.

Zainstaluj wkhtmltopdf w systemie Linux

Wkhtmltopdf nie jest jednym ze standardowych pakietów preinstalowanych w systemie Linux. Będziesz musiał zainstalować go ręcznie za pomocą menedżera pakietów twojego systemu.



Aby zainstalować wkhtmltopdf w dystrybucjach opartych na Ubuntu i Debianie:

sudo apt install wkhtmltopdf

W dystrybucjach opartych na Arch, takich jak Manjaro Linux:





sudo pacman -S wkhtmltopdf

Instalacja wkhtmltopdf w dystrybucjach opartych na RHEL, takich jak Fedora i CentOS, jest również łatwa.

sudo dnf install wkhtmltopdf

Podstawowa składnia

Podstawowa składnia polecenia to:





wkhtmltopdf webpage filename

...gdzie Strona internetowa to adres URL strony internetowej, którą chcesz przekonwertować i Nazwa pliku to nazwa wyjściowego pliku PDF.

Aby przekonwertować stronę główną Google na dokument PDF:

wkhtmltopdf https://google.com google.pdf

Wyjście:

Po otwarciu pliku PDF zauważysz, że wkhtmltopdf precyzyjnie wyrenderował stronę internetową do dokumentu.

ten --kopie flaga ratuje życie, jeśli chcesz, aby plik wyjściowy zawierał wiele kopii strony internetowej. Zwróć uwagę, że podczas drukowania wielu kopii wkhtmltopdf nie wygeneruje wielu plików PDF, ale zamiast tego doda dodatkowe strony do jednego dokumentu.

Aby utworzyć trzy kopie strony głównej Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

Wyjściowy plik PDF będzie zawierał trzy strony określone w powyższym poleceniu.

Dodaj filtr skali szarości do wyjścia

Aby dodać filtr skali szarości do pliku PDF, użyj przycisku -g lub --skala szarości flaga z poleceniem:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Plik wyjściowy:

Zmień orientację pliku PDF

Domyślnie wkhtmltopdf generuje plik PDF w układzie pionowym, czyli pionowym. Aby zmienić to domyślne zachowanie i zamiast tego przechwytywać strony internetowe w orientacji poziomej, użyj przycisku --orientacja flaga z poleceniem:

wkhtmltopdf --orientation landscape https://google.com google.pdf

Wyjście:

Zwróć uwagę, że pozioma wersja dokumentu ma większy obszar białych znaków w porównaniu z wersją pionową.

Nie dołączaj obrazów podczas konwersji

Podczas generowania danych wyjściowych, jeśli nie chcesz, aby wkhtmltopdf renderował obrazy obecne na stronie internetowej, użyj --brak-obrazów flaga:

wkhtmltopdf --no-images https://google.com google.pdf

Wyjście:

Związane z: Najlepsze narzędzia do edycji pliku PDF w dowolnym miejscu

Jak przekonwertować stronę internetową na obrazy

Narzędzie wkhtmltoimage jest częścią pakietu wkhtmltopdf. Jeśli pracujesz nad raportem i chcesz dołączyć obrazy witryny, to narzędzie będzie działać na Twoją korzyść. Terminal Linux nie tylko ułatwia przechwytywanie obrazów, ale także oferuje szereg opcji umożliwiających dostosowanie wyników.

chrom zajmuje zbyt dużo pamięci

Podstawowa składnia

Wkhtmltoimage ma składnię podobną do wkhtmltopdf:

wkhtmltoimage webpage filename

...gdzie Strona internetowa to adres URL strony internetowej i Nazwa pliku to nazwa obrazu wyjściowego.

Konwertuj stronę internetową na obraz

Kontynuując powyższy przykład, przekonwertujmy stronę główną Google na obrazy.

wkhtmltoimage https://google.com google.png

Wyjście:

Możesz także określić niestandardowy format pliku, który ma mieć obraz wyjściowy. Wkhtmltoimage obsługuje następujące rozszerzenia plików:

  • JPEG/JPG
  • PNG
  • SVG

Na przykład, jeśli chcesz wygenerować obraz JPG, po prostu zamień rozszerzenie pliku na JPG w poleceniu:

wkhtmltoimage https://google.com google.jpg

Związane z: JPG vs. JPEG: jaka jest różnica między tymi formatami plików obrazów?

Przechwytywanie stron internetowych za pomocą terminala Linux

Musisz mieć zainstalowaną przeglądarkę plików PDF w systemie Linux, jeśli chcesz przeglądać pliki PDF generowane przez wkhtmltopdf. Podczas gdy większość dystrybucji Linuksa ma preinstalowany edytor PDF, możesz ręcznie wybrać i zainstalować edytor PDF, który odpowiada Twoim potrzebom.

Udział Udział Ćwierkać E-mail 5 najlepszych edytorów PDF dla systemu Linux, które powinieneś wypróbować

Chcesz edytować plik PDF w systemie Linux? Te edytory PDF dla systemu Linux można zainstalować bezpłatnie i są łatwe w użyciu.

Czytaj dalej
Powiązane tematy
  • Linux
  • PDF
  • Linux
O autorze Deepesh Sharma(79 opublikowanych artykułów)

Deepesh to Junior Editor dla Linuksa w MUO. Pisze przewodniki informacyjne o Linuksie, których celem jest zapewnienie błogiego doświadczenia wszystkim nowicjuszom. Nie jestem pewien co do filmów, ale jeśli chcesz porozmawiać o technologii, to jest twój facet. W wolnym czasie można go spotkać czytającego książki, słuchającego różnych gatunków muzycznych lub grającego na gitarze.

Więcej od Deepesha Sharma

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować