Điểm:0

Đang cố gắng sao chép trang web của tôi bằng wget, nhưng không tìm thấy thuộc tính nofollow và tôi không thể tải xuống bất cứ thứ gì ngoài index.html

lá cờ mx

Tôi đang chạy một trang wordpress trên máy chủ LEMP dựa trên Ubuntu 20.04. Tôi đã bật plugin tốc độ trang và để buộc nó lưu vào bộ đệm trang web của mình, tôi đang sử dụng wget từ một hộp khác để phản chiếu trang web. Tuy nhiên, khi sử dụng wget từ hộp thứ 2, Nó dừng tải xuống ở trang đầu tiên (index.html), với lỗi

thuộc tính nofollow được tìm thấy trong /tmp/ramdisk/www.example.com/index.html. Sẽ không theo bất kỳ liên kết nào trên trang này Dưới đây là lệnh wget tôi đang sử dụng và kết quả trả về:

wget -m -p -E -k -P /tmp/ramdisk/ https://www.example.com
--2022-05-17 16:41:40-- https://www.example.com/
Đang giải quyết www.example.com (www.example.com)... 1**.2*.1**.*
Đang kết nối với www.example.com (www.example.com)|1**.2*.1**.*|:443... đã kết nối.
Đã gửi yêu cầu HTTP, đang chờ phản hồi... 200 OK
Độ dài: không xác định [text/html]
Đang lưu vào: â/tmp/ramdisk/www.example.com/index.htmlâ

www.example.com/index.html [ <=> ] 130,71K 210KB/giây trong 0,6 giây

Thiếu tiêu đề được sửa đổi lần cuối -- dấu thời gian đã tắt.
17-05-2022 16:41:42 (210 KB/giây) - â/tmp/ramdisk/www.example.com/index.htmlâ đã lưu [133848]

thuộc tính nofollow được tìm thấy trong /tmp/ramdisk/www.example.com/index.html. Sẽ không theo bất kỳ liên kết nào trên trang này
HOÀN THÀNH --2022-05-17 16:41:42--
Tổng thời gian đồng hồ treo tường: 2.0s
Đã tải xuống: 1 tệp, 131K trong 0,6 giây (210 KB/s)
Chuyển đổi liên kết trong /tmp/ramdisk/www.example.com/index.html... 135.
42-93
Chuyển đổi liên kết trong 1 tệp trong 0,004 giây.

Làm cách nào tôi có thể tìm các thuộc tính nofollow và xóa chúng để wget tải xuống hoàn toàn trang web của tôi?

Điểm:1
lá cờ in

Như tài liệu ở đây bạn có thể yêu cầu wget bỏ qua thuộc tính no-follow bằng cách thêm tham số -e rô-bốt=tắt

DanRan avatar
lá cờ mx
Nhưng một vài ngày trước, tôi không phải thực hiện điều này trong wget. Vì vậy, tôi đã thay đổi điều gì trên máy chủ của mình để tạo ra các liên kết không theo dõi?
lá cờ in
Làm thế nào chúng ta có thể biết?
DanRan avatar
lá cờ mx
đó chính xác là những gì tôi đang hỏi. làm thế nào chúng ta biết thực sự đảo ngược? có cách nào để tìm kiếm các liên kết đó trong thư mục wordpress của tôi hay không?
Điểm:0
lá cờ mx

Tôi đã tìm ra điều này.

Tôi đã phải đăng nhập vào cài đặt wordpress của mình qua giao diện web và truy cập Cài đặt>Đọc>Hiển thị công cụ tìm kiếm, sau đó trên trang đó tôi phải bỏ chọn

Không khuyến khích các công cụ tìm kiếm lập chỉ mục trang web này Tùy thuộc vào tìm kiếm động cơ để tôn trọng yêu cầu này.

Tùy chọn. Sau khi tôi bỏ chọn nó, tôi có thể sao chép thành công trang web của mình bằng lệnh wget wget -m -p -E -k -P /tmp/ramdisk/ https://www.example.com.

Xem ảnh chụp màn hình bên dưới để biết thêm thông tin. Wordpress - Khả năng hiển thị của Công cụ Tìm kiếm - Không khuyến khích Công cụ Tìm kiếm Lập chỉ mục trang web này

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.