Cách tải xuống toàn bộ trang web để đọc ngoại tuyến

Cách tải xuống toàn bộ trang web để đọc ngoại tuyến

Mặc dù ngày nay Wi-Fi có sẵn ở khắp mọi nơi, nhưng thỉnh thoảng bạn có thể thấy mình không có Wi-Fi. Và khi bạn làm vậy, có thể có những trang web mà bạn ước mình nên lưu lại để bạn có thể truy cập chúng khi ngoại tuyến — có thể để nghiên cứu, giải trí hoặc chỉ để hậu thế.





Khá cơ bản để lưu các trang web riêng lẻ để đọc ngoại tuyến, nhưng nếu bạn muốn tải xuống toàn bộ trang web thì sao? Đừng lo lắng, nó dễ dàng hơn bạn nghĩ. Nhưng đừng lấy lời của chúng tôi cho nó. Dưới đây là một số công cụ tiện lợi mà bạn có thể sử dụng để tải xuống bất kỳ trang web nào để đọc ngoại tuyến — mà không gặp bất kỳ phức tạp nào.





1. WebCopy

WebCopy của Cyotek lấy một URL của trang web và quét nó để tìm các liên kết, trang và phương tiện. Khi tìm thấy các trang, nó sẽ tìm kiếm một cách đệ quy các liên kết, trang và phương tiện khác cho đến khi toàn bộ trang web được phát hiện. Sau đó, bạn có thể sử dụng các tùy chọn cấu hình để quyết định tải xuống các phần ngoại tuyến.





Điều thú vị về WebCopy là bạn có thể thiết lập nhiều dự án mà mỗi dự án có cài đặt và cấu hình riêng. Điều này giúp bạn dễ dàng tải xuống lại nhiều trang web bất cứ khi nào bạn muốn, mỗi trang theo cùng một cách chính xác mọi lúc.

Một dự án có thể sao chép nhiều trang web, vì vậy hãy sử dụng chúng với một kế hoạch có tổ chức (ví dụ: dự án 'Công nghệ' để sao chép các trang web công nghệ).



cách lấy lại ảnh đã xóa trên android

Cách tải toàn bộ trang web bằng WebCopy

  1. Cài đặt và khởi chạy ứng dụng.
  2. Hướng đến Tệp> Mới để tạo một dự án mới.
  3. Nhập URL vào Trang mạng đồng ruộng.
  4. Thay đổi Lưu thư mục trường mà bạn muốn lưu trang web.
  5. Chơi xung quanh với Dự án> Quy tắc… ( tìm hiểu thêm về Quy tắc sao chép web ).
  6. Hướng đến Tệp> Lưu dưới dạng… để lưu dự án.
  7. Nhấp chuột Sao chép trên thanh công cụ để bắt đầu quá trình.

Sau khi sao chép xong, bạn có thể sử dụng Kết quả để xem trạng thái của từng trang riêng lẻ và / hoặc tệp phương tiện. Các Lỗi tab hiển thị bất kỳ sự cố nào có thể đã xảy ra và Đã bỏ qua tab hiển thị các tệp chưa được tải xuống.

Liên quan: Ứng dụng tốt nhất để lưu các bài báo để đọc ngoại tuyến





Nhưng quan trọng nhất là Sơ đồ trang web , hiển thị cấu trúc thư mục đầy đủ của trang web do WebCopy phát hiện.

Để xem trang web ngoại tuyến, hãy mở File Explorer và điều hướng đến thư mục lưu bạn đã chỉ định. Mở index.html (Hoặc đôi khi index.htm ) trong trình duyệt bạn chọn để bắt đầu duyệt.





Tải xuống: WebCopy cho các cửa sổ (Miễn phí)

2. HTTrack

HTTrack được biết đến nhiều hơn WebCopy và được cho là tốt hơn vì nó là mã nguồn mở và có sẵn trên các nền tảng khác ngoài Windows. Giao diện hơi lộn xộn và không có nhiều thứ để mong muốn, tuy nhiên, nó hoạt động tốt, vì vậy đừng để điều đó khiến bạn bỏ đi.

Giống như WebCopy, nó sử dụng cách tiếp cận dựa trên dự án cho phép bạn sao chép nhiều trang web và giữ cho tất cả chúng được ngăn nắp. Bạn có thể tạm dừng và tiếp tục tải xuống, đồng thời có thể cập nhật các trang web đã sao chép bằng cách tải xuống lại các tệp cũ và mới.

Cách tải trang web hoàn chỉnh với HTTrack

  1. Cài đặt và khởi chạy ứng dụng.
  2. Nhấp chuột Kế tiếp để bắt đầu tạo một dự án mới.
  3. Đặt tên, danh mục, đường dẫn cơ sở cho dự án, sau đó nhấp vào Kế tiếp .
  4. Lựa chọn Tải xuống (các) trang web cho Hành động, sau đó nhập URL của từng trang web vào Địa chỉ web hộp, một URL trên mỗi dòng. Bạn cũng có thể lưu trữ URL trong tệp TXT và nhập nó, điều này rất tiện lợi khi bạn muốn tải xuống lại các trang web tương tự sau này. Nhấp chuột Kế tiếp .
  5. Điều chỉnh các thông số nếu bạn muốn, sau đó nhấp vào Kết thúc .

Sau khi mọi thứ được tải xuống, bạn có thể duyệt trang web như bình thường bằng cách đi tới nơi các tệp đã được tải xuống và mở index.html hoặc index.htm trong một trình duyệt.

pin thay thế tốt nhất cho macbook pro

Cách sử dụng HTTrack với Linux

Nếu bạn là người dùng Ubuntu, đây là cách bạn có thể sử dụng HTTrack để lưu toàn bộ trang web:

  1. Khởi chạy Phần cuối và gõ lệnh sau: sudo apt-get install httrack
  2. Nó sẽ yêu cầu mật khẩu Ubuntu của bạn (nếu bạn đã đặt mật khẩu). Nhập nó vào và nhấn Vào . Terminal sẽ tải xuống công cụ sau vài phút.
  3. Cuối cùng, gõ lệnh này và nhấn Vào . Đối với ví dụ này, chúng tôi đã tải xuống trang web phổ biến, Thu thập chất xám . httrack https://www.brainpickings.org/
  4. Điều này sẽ tải xuống toàn bộ trang web để đọc ngoại tuyến.

Bạn có thể thay thế URL của trang web tại đây bằng URL của bất kỳ trang web nào bạn muốn tải xuống. Ví dụ: nếu bạn muốn tải xuống toàn bộ Bách khoa toàn thư Britannica, bạn sẽ phải điều chỉnh lệnh của mình thành:

httrack https://www.britannica.com/

Tải xuống: HTTrack cho Windows và Linux | Android (Miễn phí)

3. SiteSucker

Nếu bạn đang sử dụng máy Mac, lựa chọn tốt nhất của bạn là SiteSucker . Công cụ đơn giản này sao chép toàn bộ trang web, duy trì cùng một cấu trúc và cũng bao gồm tất cả các tệp phương tiện có liên quan (ví dụ: hình ảnh, PDF, biểu định kiểu).

Nó có giao diện sạch sẽ và dễ sử dụng — bạn thực sự dán URL của trang web và nhấn Vào .

Một tính năng tiện lợi là khả năng lưu tải xuống vào một tệp, sau đó sử dụng tệp đó để tải xuống các tệp tương tự và cấu trúc lại trong tương lai (hoặc trên một máy khác). Tính năng này cũng là thứ cho phép SiteSucker tạm dừng và tiếp tục tải xuống.

SiteSucker có giá khoảng $ 5 và không đi kèm với phiên bản miễn phí hoặc bản dùng thử miễn phí, đó là nhược điểm lớn nhất của nó. Phiên bản mới nhất yêu cầu macOS 11 Big Sur trở lên. Phiên bản cũ của SiteSucker có sẵn cho các hệ thống Mac cũ hơn, nhưng một số tính năng có thể bị thiếu.

Tải xuống : SiteSucker cho ios | Mac ($ 4,99)

Bốn. Quên

Wget là một tiện ích dòng lệnh có thể truy xuất tất cả các loại tệp qua giao thức HTTP và FTP. Vì các trang web được cung cấp thông qua HTTP và hầu hết các tệp phương tiện web đều có thể truy cập được thông qua HTTP hoặc FTP, điều này làm cho Wget trở thành một công cụ tuyệt vời để tải xuống toàn bộ trang web.

Có liên quan: Cách tải xuống sách từ Google Sách

Wget đi kèm với hầu hết các hệ thống dựa trên Unix. Mặc dù Wget thường được sử dụng để tải xuống các tệp đơn lẻ, nhưng nó cũng có thể được sử dụng để tải xuống đệ quy tất cả các trang và tệp được tìm thấy thông qua một trang ban đầu:

cách chỉnh sửa trên video star
wget -r -p https://www.makeuseof.com

Tùy thuộc vào kích thước, có thể mất một lúc để tải trang web hoàn chỉnh.

Tuy nhiên, một số trang web có thể phát hiện và ngăn chặn những gì bạn đang cố gắng thực hiện vì việc trích xuất một trang web có thể khiến chúng tiêu tốn rất nhiều băng thông. Để giải quyết vấn đề này, bạn có thể ngụy trang thành một trình duyệt web với chuỗi tác nhân người dùng:

wget -r -p -U Mozilla https://www.thegeekstuff.com

Nếu bạn muốn lịch sự, bạn cũng nên giới hạn tốc độ tải xuống của mình (để bạn không làm tiêu tốn băng thông của máy chủ web) và tạm dừng giữa mỗi lần tải xuống (để bạn không làm máy chủ web bị choáng ngợp với quá nhiều yêu cầu):

wget -r -p -U Mozilla --wait=10 --limit-rate=35K https://www.thegeekstuff.com

Cách sử dụng Wget trên máy Mac

Trên máy Mac, bạn có thể cài đặt Wget bằng một lệnh Homebrew: pha chế cài đặt wget .

  1. Nếu bạn chưa cài đặt Homebrew, hãy tải xuống bằng lệnh sau: /usr/bin/ruby -e '$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)'
  2. Tiếp theo, cài đặt Wget bằng lệnh này: brew install wget
  3. Sau khi cài đặt xong Wget, bạn có thể tải trang web bằng lệnh sau: wget path/to/local.copy http://www.brainpickings.org/

Trên Windows, bạn sẽ cần sử dụng phiên bản đã chuyển này thay thế. Tải xuống và cài đặt ứng dụng, đồng thời làm theo hướng dẫn để hoàn tất quá trình tải xuống trang web.

Dễ dàng tải xuống toàn bộ trang web

Bây giờ bạn đã biết cách tải xuống toàn bộ trang web, bạn sẽ không bao giờ bị bắt mà không có thứ gì đó để đọc, ngay cả khi bạn không có truy cập internet. Nhưng hãy nhớ rằng: trang web càng lớn thì lượt tải xuống càng lớn. Chúng tôi không khuyên bạn nên tải xuống các trang web lớn như MUO vì bạn sẽ cần hàng nghìn MB để lưu trữ tất cả các tệp phương tiện mà chúng tôi sử dụng.

Đăng lại Đăng lại tiếng riu ríu E-mail Cách tải xuống trang web hoàn chỉnh để đọc ngoại tuyến

Sử dụng các phương pháp này để lưu các trang web để đọc ngoại tuyến và giữ các trang web yêu thích của bạn luôn sẵn sàng khi bạn cần chúng nhất.

Đọc tiếp
Chủ đề liên quan
  • Internet
  • Sao lưu dữ liệu
  • Duyệt ngoại tuyến
  • Mẹo tải xuống
Giới thiệu về tác giả Mỏ Shaant(58 bài báo đã xuất bản)

Shaant là Nhân viên viết thư tại MUO. Tốt nghiệp ngành Ứng dụng Máy tính, anh ấy sử dụng niềm đam mê viết lách của mình để giải thích những thứ phức tạp bằng tiếng Anh đơn giản. Khi không nghiên cứu hay viết lách, anh ấy có thể thấy thích một cuốn sách hay, chạy bộ hoặc đi chơi với bạn bè.

Xem thêm từ Shaant Minhas

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký