Điểm:0

Tạo máy chủ web để ngăn phân tích cú pháp các phần tử HTML nhất định

lá cờ gb

Hệ thống quản lý nội dung MediaWiki tạo ra nhiều liên kết mà tôi muốn các trang web của họ không bị trình thu thập thông tin của công cụ tìm kiếm phát hiện.

Không chỉ là tôi không muốn họ lập chỉ mục và hơn thế nữa không chỉ là tôi không muốn chúng , nhưng tôi thậm chí không muốn chúng đã phát hiện !

Về lý thuyết, tôi có thể thử tùy chỉnh giao diện (chủ đề/mẫu) của trang web MediaWiki của mình để xóa các phần tử HTML liên kết đến các trang web này nhưng làm như vậy một cách lành mạnh đòi hỏi phải học hỏi rất nhiều về kiến ​​trúc MediaWiki mà tôi không muốn làm nếu có nhiều giải pháp đơn giản hơn.

  • CSS không trưng bày sẽ không hữu ích vì đánh dấu sẽ hiển thị trong DOM
  • JavaScript document.querySelector("#x").remove(); sẽ không hữu ích vì cho đến khi nó chạy, trình thu thập thông tin có thể phát hiện ra phần tử liên kết
  • Tôi không thể sử dụng PHP 8.1.3 để bỏ qua các lệnh trước đó của chính nó vì thời điểm bất kỳ đánh dấu nào có liên kết như vậy được xử lý, nó sẽ được cung cấp cho người dùng.
  • Mặc dù vậy, tôi có thể sử dụng robots.txt để cố gắng ngăn việc thu thập dữ liệu (nếu không lập chỉ mục) các trang này, nhưng vì các URL trang web của tôi là đa ngôn ngữ và có nhiều mẫu nên đây có thể là một nhiệm vụ khó khăn.

Thủ thuật duy nhất có thể còn lại để giúp tôi là bằng cách nào đó yêu cầu máy chủ không phục vụ bất kỳ đánh dấu nào như vậy theo ID hoặc lớp CSS.

Như vũ phu như nó có thể được, nó có thể làm việc? Nếu không, tôi còn lựa chọn nào khác?

Mat avatar
lá cờ cn
Mat
Nếu bạn không muốn nội dung bị phát hiện, đừng đưa nó lên web công cộng. Giữ nội dung riêng tư của bạn sau xác thực bắt buộc.
lá cờ us
Nếu MediaWiki không hỗ trợ các yêu cầu của bạn, bạn nên xem xét phần mềm khác với mục đích hỗ trợ các yêu cầu đó. Đó là cách duy nhất hợp lý và có thể duy trì để đạt được mục tiêu của bạn. Tất cả các phương pháp khác đòi hỏi nhiều nỗ lực và có thể có nhiều tác dụng phụ không mong muốn.
lá cờ gb
@TeroKilkanen Tôi hoàn toàn đồng ý, tôi sẽ chuyển sang Drupal nhưng nó đã có 2400 trang web và chuyển nội dung theo cách thủ công có thể mất khoảng 4 tháng và sẽ rất khó và tôi cũng rất thích cú pháp MediaWiki.
lá cờ gb
Mặc dù vậy, tôi có thể sử dụng **robots.txt** để cố gắng ngăn việc thu thập thông tin (nếu không lập chỉ mục) của các trang này, nhưng vì các URL trang web của tôi là đa ngôn ngữ và có nhiều mẫu nên đây có thể là một nhiệm vụ khó khăn. Tuy nhiên, dễ dàng hơn nhiều so với việc chuyển sang Drupal.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.