Tôi đang chạy một trang wordpress trên máy chủ LEMP dựa trên Ubuntu 20.04.
Tôi đã bật plugin tốc độ trang và để buộc nó lưu vào bộ đệm trang web của mình, tôi đang sử dụng wget từ một hộp khác để phản chiếu trang web. Tuy nhiên, khi sử dụng wget từ hộp thứ 2, Nó dừng tải xuống ở trang đầu tiên (index.html), với lỗi
thuộc tính nofollow được tìm thấy trong /tmp/ramdisk/www.example.com/index.html. Sẽ
không theo bất kỳ liên kết nào trên trang này
Dưới đây là lệnh wget tôi đang sử dụng và kết quả trả về:
wget -m -p -E -k -P /tmp/ramdisk/ https://www.example.com
--2022-05-17 16:41:40-- https://www.example.com/
Đang giải quyết www.example.com (www.example.com)... 1**.2*.1**.*
Đang kết nối với www.example.com (www.example.com)|1**.2*.1**.*|:443... đã kết nối.
Đã gửi yêu cầu HTTP, đang chờ phản hồi... 200 OK
Độ dài: không xác định [text/html]
Đang lưu vào: â/tmp/ramdisk/www.example.com/index.htmlâ
www.example.com/index.html [ <=> ] 130,71K 210KB/giây trong 0,6 giây
Thiếu tiêu đề được sửa đổi lần cuối -- dấu thời gian đã tắt.
17-05-2022 16:41:42 (210 KB/giây) - â/tmp/ramdisk/www.example.com/index.htmlâ đã lưu [133848]
thuộc tính nofollow được tìm thấy trong /tmp/ramdisk/www.example.com/index.html. Sẽ không theo bất kỳ liên kết nào trên trang này
HOÀN THÀNH --2022-05-17 16:41:42--
Tổng thời gian đồng hồ treo tường: 2.0s
Đã tải xuống: 1 tệp, 131K trong 0,6 giây (210 KB/s)
Chuyển đổi liên kết trong /tmp/ramdisk/www.example.com/index.html... 135.
42-93
Chuyển đổi liên kết trong 1 tệp trong 0,004 giây.
Làm cách nào tôi có thể tìm các thuộc tính nofollow và xóa chúng để wget tải xuống hoàn toàn trang web của tôi?