Điểm:0

Các hàng trùng lặp của dữ liệu thanh toán trên đám mây của Google

lá cờ cn

Tôi đã trích xuất dữ liệu thanh toán GCP thông qua BigQuery. Tôi đã thực hiện các truy vấn để truy xuất dữ liệu trong khoảng thời gian cụ thể và sau đó tôi tìm thấy hai loại dữ liệu trùng lặp:

  1. dữ liệu trùng lặp do bỏ lồng cột nhãn

  2. kết quả dữ liệu trùng lặp từ các hàng truy vấn thông thường (Giống như bên dưới) có giá trị hoàn toàn giống nhau cho tất cả các cột.

      id thanh toán_account_id dưới dạng AS,
      dịch vụ.id AS ServiceId,
      dịch vụ.mô tả AS Mô tả dịch vụ,
      sku.id NHƯ SkuId,
      sku.description AS SkuDescription,
      thời gian sử dụng_start_time,
      thời gian sử dụng_end_time,
      project.id NHƯ ProjectId,
      project.number AS ProjectNumber,
      project.name AS Tên dự án,
      project.labels là ProjectLabels,
      project.ancestry_numbers AS ProjectAncestryNumbers,
      nhãn AS Nhãn,
      system_labels NHƯ Nhãn hệ thống,
      vị trí.vị trí AS Vị trí,
      vị trí.quốc gia AS Quốc gia,
      vị trí.khu vực Vùng AS,
      location.zone Vùng AS,
      SUBSTRING(cast(export_time as string), 1, 19) AS ExportTime,
      chi phí AS chi phí,
      tiền tệ AS Tiền tệ,
      currency_conversion_rate AS Tỷ lệ chuyển đổi tiền tệ,
      cách sử dụng. số tiền NHƯ Số lượng sử dụng,
      cách sử dụng.đơn vị AS Đơn vị sử dụng,
      cách sử dụng.amount_in_pricing_units AS Cách sử dụngAmountInPricingUnits,
      đơn vị sử dụng.pricing_unit AS Đơn vị sử dụng giá,
      tín dụng AS Tín dụng,
      hóa đơn.tháng AS InvoiceMonth,
      cost_type AS Loại chi phí,
      điều chỉnh_info.id AS điều chỉnhInfoId,
      điều chỉnh_info.description AS điều chỉnhInfoDes mô tả,
      điều chỉnh_info.mode AS điều chỉnhInfoMode,
      điều chỉnh_info.type AS điều chỉnhInfoType
    TỪ 
    'TÊN BẢNG' 
    Ở ĐÂU NGÀY(_PARTITIONTIME) GIỮA DỮA SubtFromTime(utcnow()),60,'Day','yyyy-MM-dd')AND formatDateTime(utcnow(),'yyyy-MM-dd')```


**Tôi muốn biết tại sao có dữ liệu trùng lặp? Chúng có thể được xử lý như thế nào và làm cách nào để đảm bảo rằng việc tính toán chi phí không bị ảnh hưởng bởi dữ liệu trùng lặp?**

Đánh giá cao nó nếu có ai có thể giúp tôi.


tốt nhất,
Shokoufeh
Điểm:1
lá cờ pk

1. Tại sao các hàng bị trùng lặp khi bỏ lồng trường nhãn?

Khi bạn bỏ lồng một trường loại lặp lại như nhãn, dự kiến ​​sẽ có sự trùng lặp của các hàng. Nói chính xác, mỗi hàng được nhân đôi dựa trên độ dài của hàng đó nhãn mảng.

Số lượng không ổn định so với tổng số nhãn

2. Tại sao có các hàng trùng lặp ngay cả trước khi bỏ lồng nhau?

Nếu bạn tạo 2 máy ảo Compute Engine có cấu hình và vị trí chính xác, thì các hàng sử dụng không hoạt động trong quá trình xuất thanh toán của 2 máy ảo đó sẽ hoàn toàn giống nhau trừ khi được gắn nhãn. Bảng xuất không có khóa chính được hiển thị rõ ràng.

Mức độ chi tiết của bảng xuất chỉ cho đến dịch vụ & SKU chứ không phải cho mỗi tài nguyên. Điều này dẫn đến dữ liệu tìm kiếm trùng lặp nhưng chúng là những cách sử dụng thực tế hợp lệ.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.