Cách chuyển trang web thành tệp PDF hoặc hình ảnh trong Linux

Cách chuyển trang web thành tệp PDF hoặc hình ảnh trong Linux

Bạn muốn biết cách bạn có thể chụp một trang web và lưu nó dưới dạng tài liệu PDF hoặc hình ảnh bằng cách sử dụng thiết bị đầu cuối? May mắn thay, Linux có rất nhiều tiện ích mà bạn có thể sử dụng để tự động hóa tác vụ chuyển đổi tài liệu HTML sang tệp PDF và hình ảnh.





Bài viết này sẽ giới thiệu cho bạn về wkhtmltopdf và wkhtmltoimage, những tiện ích mà bạn cần để giúp công việc của bạn trở nên dễ dàng hơn.





Cách chuyển đổi HTML sang PDF

Nếu bạn đang tìm cách chụp các trang web và chuyển đổi chúng thành tệp PDF, tiện ích wkhtmltopdf sẽ giúp bạn. Wkhtmltopdf là một công cụ dòng lệnh mã nguồn mở được sử dụng để hiển thị các trang web thành tài liệu PDF.





Vì công cụ này hoạt động trực tiếp bên trong thiết bị đầu cuối Linux, bạn sẽ không yêu cầu bất kỳ trình điều khiển web hoặc khung tự động hóa trình duyệt nào như Selenium.

Cài đặt wkhtmltopdf trên Linux

Wkhtmltopdf không phải là một trong những gói tiêu chuẩn được cài đặt sẵn trên Linux. Bạn sẽ phải cài đặt thủ công bằng trình quản lý gói của hệ thống.



Để cài đặt wkhtmltopdf trên Ubuntu và các bản phân phối dựa trên Debian:

sudo apt install wkhtmltopdf

Trên các bản phân phối dựa trên Arch như Manjaro Linux:





sudo pacman -S wkhtmltopdf

Cài đặt wkhtmltopdf trên các bản phân phối dựa trên RHEL như Fedora và CentOS cũng rất dễ dàng.

sudo dnf install wkhtmltopdf

Cú pháp cơ bản

Cú pháp cơ bản của lệnh là:





wkhtmltopdf webpage filename

...ở đâu trang web là URL của trang web mà bạn muốn chuyển đổi và tên tập tin là tên của tệp PDF đầu ra.

Để chuyển trang chủ Google thành tài liệu PDF:

wkhtmltopdf https://google.com google.pdf

Đầu ra:

Khi mở tệp PDF, bạn sẽ nhận thấy rằng wkhtmltopdf đã kết xuất chính xác trang web thành tài liệu.

Các --copies cờ là một cứu cánh nếu bạn muốn tệp đầu ra của mình có nhiều bản sao của trang web. Lưu ý rằng khi in nhiều bản sao, wkhtmltopdf sẽ không tạo nhiều tệp PDF mà thay vào đó sẽ thêm các trang bổ sung vào một tài liệu.

Để tạo ba bản sao của trang chủ Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

Tệp PDF đầu ra sẽ chứa ba trang như được chỉ định trong lệnh nói trên.

Thêm bộ lọc thang độ xám vào đầu ra

Để thêm bộ lọc thang độ xám vào tệp PDF, hãy sử dụng -NS hoặc --grayscale gắn cờ bằng lệnh:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Tệp đầu ra:

Thay đổi hướng của PDF

Theo mặc định, wkhtmltopdf tạo tệp PDF ở bố cục dọc, tức là dọc. Để thay đổi hành vi mặc định này và thay vào đó, chụp các trang web theo chiều ngang, hãy sử dụng --sự định hướng gắn cờ bằng lệnh:

wkhtmltopdf --orientation landscape https://google.com google.pdf

Đầu ra:

Lưu ý rằng phiên bản ngang của tài liệu có vùng khoảng trắng lớn hơn so với phiên bản dọc.

Không bao gồm hình ảnh khi chuyển đổi

Trong khi tạo đầu ra, nếu bạn không muốn wkhtmltopdf hiển thị hình ảnh có trong trang web, hãy sử dụng --Không có hình ảnh lá cờ:

wkhtmltopdf --no-images https://google.com google.pdf

Đầu ra:

Có liên quan: Các công cụ tốt nhất để chỉnh sửa tệp PDF ở mọi nơi

Làm thế nào để chuyển đổi một trang web thành hình ảnh

Tiện ích wkhtmltoimage là một phần của gói wkhtmltopdf. Nếu bạn đang làm việc trên một báo cáo và muốn bao gồm hình ảnh của một trang web, thì công cụ này sẽ có lợi cho bạn. Thiết bị đầu cuối Linux không chỉ giúp bạn chụp ảnh dễ dàng hơn mà còn cung cấp cho bạn một loạt các tùy chọn cho phép bạn tùy chỉnh đầu ra của mình.

phần mềm chỉnh sửa ảnh tốt nhất cho người mới bắt đầu

Cú pháp cơ bản

Wkhtmltoimage có cú pháp tương tự như wkhtmltopdf:

wkhtmltoimage webpage filename

...ở đâu trang web là URL của một trang web và tên tập tin là tên của hình ảnh đầu ra.

Chuyển đổi một trang web thành một hình ảnh

Tiếp tục với ví dụ đã nói ở trên, hãy chuyển trang chủ Google thành hình ảnh.

wkhtmltoimage https://google.com google.png

Đầu ra:

Bạn cũng có thể chỉ định định dạng tệp tùy chỉnh mà bạn muốn hình ảnh đầu ra có. Wkhtmltoimage hỗ trợ các phần mở rộng tệp sau:

  • JPEG / JPG
  • PNG
  • SVG

Ví dụ: nếu bạn muốn tạo hình ảnh JPG, chỉ cần thay thế phần mở rộng tệp bằng JPG trong lệnh:

wkhtmltoimage https://google.com google.jpg

Có liên quan: JPG và JPEG: Sự khác biệt giữa các định dạng tệp hình ảnh này là gì?

Chụp các trang web bằng Linux Terminal

Bạn phải cài đặt trình xem PDF trên hệ thống Linux của mình nếu bạn muốn xem các tệp PDF được tạo bởi wkhtmltopdf. Mặc dù hầu hết các bản phân phối Linux đều được cài đặt sẵn trình chỉnh sửa PDF, bạn có thể chọn và cài đặt trình chỉnh sửa PDF theo cách thủ công phù hợp với nhu cầu của mình.

Đăng lại Đăng lại tiếng riu ríu E-mail 5 trình chỉnh sửa PDF Linux tốt nhất mà bạn nên thử

Bạn cần chỉnh sửa tệp PDF trong Linux? Các trình chỉnh sửa PDF Linux này miễn phí cài đặt và dễ sử dụng.

Đọc tiếp
Chủ đề liên quan
  • Linux
  • PDF
  • Linux
Giới thiệu về tác giả Deepesh Sharma(Đã xuất bản 79 bài báo)

Deepesh là Junior Editor cho Linux tại MUO. Anh ấy viết các hướng dẫn thông tin về Linux, nhằm mục đích cung cấp trải nghiệm thú vị cho tất cả những người mới đến. Không chắc về phim, nhưng nếu bạn muốn nói về công nghệ, anh ấy là người của bạn. Khi rảnh rỗi, bạn có thể bắt gặp anh ấy đọc sách, nghe các thể loại âm nhạc khác nhau hoặc chơi guitar.

Xem thêm từ Deepesh Sharma

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký