Hệ thống quản lý nội dung MediaWiki tạo ra nhiều liên kết mà tôi muốn các trang web của họ không bị trình thu thập thông tin của công cụ tìm kiếm phát hiện.
Không chỉ là tôi không muốn họ lập chỉ mục và hơn thế nữa không chỉ là tôi không muốn chúng bò, nhưng tôi thậm chí không muốn chúng đã phát hiện !
Về lý thuyết, tôi có thể thử tùy chỉnh giao diện (chủ đề/mẫu) của trang web MediaWiki của mình để xóa các phần tử HTML liên kết đến các trang web này nhưng làm như vậy một cách lành mạnh đòi hỏi phải học hỏi rất nhiều về kiến trúc MediaWiki mà tôi không muốn làm nếu có nhiều giải pháp đơn giản hơn.
- CSS
không trưng bày
sẽ không hữu ích vì đánh dấu sẽ hiển thị trong DOM
- JavaScript
document.querySelector("#x").remove();
sẽ không hữu ích vì cho đến khi nó chạy, trình thu thập thông tin có thể phát hiện ra phần tử liên kết
- Tôi không thể sử dụng PHP 8.1.3 để bỏ qua các lệnh trước đó của chính nó vì thời điểm bất kỳ đánh dấu nào có liên kết như vậy được xử lý, nó sẽ được cung cấp cho người dùng.
- Mặc dù vậy, tôi có thể sử dụng robots.txt để cố gắng ngăn việc thu thập dữ liệu (nếu không lập chỉ mục) các trang này, nhưng vì các URL trang web của tôi là đa ngôn ngữ và có nhiều mẫu nên đây có thể là một nhiệm vụ khó khăn.
Thủ thuật duy nhất có thể còn lại để giúp tôi là bằng cách nào đó yêu cầu máy chủ không phục vụ bất kỳ đánh dấu nào như vậy theo ID hoặc lớp CSS.
Như vũ phu như nó có thể được, nó có thể làm việc? Nếu không, tôi còn lựa chọn nào khác?