Trang web của tôi có một khu vực giới hạn cho những người dùng đăng ký bằng email hợp lệ. Tôi đã nhận được yêu cầu từ các email không có thật và tôi muốn tránh gửi email đến các địa chỉ không tồn tại vì sợ chúng làm tăng tỷ lệ thoát và ảnh hưởng đến danh tiếng gửi thư của tôi.
Các email là:
[email protected]
[email protected]
kWQcHVzn%40ypEcDvh.NwB
Cái cuối cùng có %40
, thực thể HTML cho @
. Các email là phần cắt ngắn của cùng một chuỗi ký tự.
Kiểm tra địa chỉ IP của các yêu cầu bằng DNS ngược, cả ba yêu cầu đều đến từ cache.google.com
. Nếu các yêu cầu đến từ trình thu thập thông tin của Google, thì tôi mong rằng những địa chỉ email này sẽ được ghi lại, nhưng tôi không thể tìm thấy bất kỳ tài liệu tham khảo nào.
Trong trường hợp đó là trình thu thập thông tin của Google, tôi muốn nó lập chỉ mục trang web đồng thời tránh gửi địa chỉ email đến địa chỉ không có thật. Tôi đã thực hiện lọc trên địa chỉ tìm kiếm chuỗi ký tự đó.
Có danh sách các địa chỉ không có thật mà trình thu thập dữ liệu web sâu sử dụng để truy cập và lập chỉ mục các trang ẩn không?
Cập nhật
Sau câu trả lời và bình luận chỉ vào xác minh rằng Googlebot là trình thu thập thông tin, tôi xác nhận là không phải:
máy chủ $ 212.113.167.197
Con trỏ tên miền 197.167.113.212.in-addr.arpa cache.google.com.
$ lưu trữ cache.google.com
Không tìm thấy máy chủ cache.google.com: 3(NXDOMAIN)
Vì vậy, có vẻ như đó là một người dùng ác ý, điều này giải thích tại sao địa chỉ email đó không được ghi nhận là đến từ Google.