DBT กับภาพนิ่งจำนวนมากไม่ใช่ยูนีคบันทึกอยู่ในแหล่งข่าว

0

คำถาม

ผมอยากรู้ว่าถ้ามีใครบางคนที่นี่เคยผ่านมาเป็นสถานการณ์ไหนที่แหล่งข่าวไม่ออกเสมยูนีคตอนที่กำลังเจอกับภาพนิ่งจำนวนมากใน DBT.
ฉันมีข้อมูลของริมทะเลสาปอยู่ไหนข้อมูลมาถึงการเพิ่มเดียวที่ศึกษาขั้นพื้นฐาน ทุกครั้งแหล่งข้อมูลใหม่ได้ถูกบันทึกนี้จะถูกสร้างขึ้น respective โต๊ะในข้อมูลลงทะเลสาบ
หลังจากนั้นคน DBT แก้ปัญหาก็คือวิ่แหล่งข่าวของฉันอาจจะมีมากกว่า 1 แถวกับความเป็นเอกลักษณ์หมายเลขเป็นข้อมูลเปลี่ยนแปลงไปมากกว่าหนึ่งครั้งตั้งแต่เมื่อวิ่งหนี
เข้าท่าดีนิเราจะทำทุกอย่างที่เราทำฉันอยากจะปรับปรุงที่ respective dbt_valid_to สดมภ์จากภาพที่จับได้ปัจจุบันโดยเลือกโต๊ะกับ earliest updated_at บันทึกจากแหล่งข่าวและ subsequently เพิ่มใหม่ของบันทึกต้องภาพที่จับได้ปัจจุบันโดยเลือกโต๊ะทำล่าสุด updated_at บันทึกปัจจุบันหนึ่ง ฉันรู้ว่าจะประสบความสำเร็จในส่วนนี้ใช้หน้าต่างฟังก์ชันแต่ไม่แน่ใจว่าจะรับมือกับสถานการณ์เช่นนี้กับ dbt. ฉันสงสัยจังว่าถ้ามีใครเจอแบบนี้เหมือนกันปัญหามาก่อน

Snapshot Table

| **id** |   **some_attribute** |   **valid_from**      |   **valid_to**          |
|  123   |      ABCD            |   2021-01-01 00:00:00 |    2021-06-30 00:00:00  | 
|  123   |      ZABC            |   2021-06-30 00:00:00 |      null               |

Source Table

|**id**|**some_attribute**|   **updated_at**    |
| 123  |   ABCD           | 2021-01-01 00:00:00 |-> already been loaded to snapshot
| 123  |   ZABC           | 2021-06-30 00:00:00 |-> already been loaded to snapshot
 -------------------------------------------
| 123  |   ZZAB           | 2021-11-21 00:10:00 |
| 123  |   FXAB           | 2021-11-21 15:11:00 |

Snapshot Desired Result

| **id** |   **some_attribute** |   **valid_from**      |   **valid_to**          |
|  123   |      ABCD            |   2021-01-01 00:00:00 |    2021-06-30 00:00:00  | 
|  123   |      ZABC            |   2021-06-30 00:00:00 |    2021-11-21 00:10:00  |
|  123   |      ZZAB            |   2021-11-21 00:10:00 |    2021-11-21 15:11:00  | 
|  123   |      FXAB            |   2021-11-21 15:11:00 |    null                 | 
dbt google-bigquery
2021-11-24 00:37:24
2

คำตอบที่ดีที่สุด

0

มาตรฐานภาพนิ่งจำนวนมากทำงานภายใต้สมมติฐานที่ว่าแหล่งที่โต๊ะเรา snapshotting กำลังถูกเปลี่ยนไปโดยไม่จัดเก็บประวัติศาสตร์ นี่เป็นศัตรูกันไปพฤติกรรมเราต้องอยู่ที่นี่(เป็นแหล่งที่โต๊ะเรา snapshotting นไม่มีอะไรมากกว่าเป็นรูปลักษณ์เดียวที่ปูมบันทึกของเหตุการณ์)-ซึ่งหมายความว่าเราอาจออกไปกับเพียงการใช้เป็นเก่าน่าเบื่อ incremental นางแบบที่จะประสบความสำเร็จในส่วนที่เดียวกัน SCD2 ผลที่ออกภาพนิ่งจำนวนมากให้พวกเรา

ฉันต้องมีตัวอย่างรหัสอยู่ที่นี่ตรงที่ผมทำอย่างนั้นนั้น อาจจะ เป็นของความช่วยเหลือ https://gist.github.com/jeremyyeo/3a23f3fbcb72f10a17fc4d31b8a47854

2021-11-30 22:19:55
-1

ฉันเห็นด้วยมันจะสะดวกถ้า dbt ภาพนิ่งจำนวนมากมีเป็นกลยุทธที่สามารถเกี่ยวข้องกั deduplication แต่มันไม่ใช่การรองรับวันนี้

ที่ง่ายที่สุดทำงานอยู่จะเป็นขั้นมุมมอง downstream ของแหล่งข่าวว่ามีหน้าต่างงานคุณอธิบาย. งั้นคุณภาพที่จับได้ปัจจุบันโดยเลือนั่นมุมมอง

อย่างไรก็ตามฉันเห็นศักยภาพสำหรับใหม่ภาพที่จับได้ปัจจุบันโดยเลือกลยุทธที่ดูแลต่อไปยังท้ายเพียงแหล่งข้อมูลอยู่ บางทีคุณอาจจะอยากได้อ่านที่ dbt ภาพที่จับได้ปัจจุบันโดยเลือ docs และ strategies ด้วยรหัสต้นทางของ อยู่ที่มีอยู่ strategies ต้องเห็นถ้าคุณอยากจะทำให้ใหม่!

2021-11-24 01:37:58

ในภาษาอื่นๆ

หน้านี้อยู่ในภาษาอื่นๆ

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

ดังอยู่ในนี้หมวดหมู่

ดังคำถามอยู่ในนี้หมวดหมู่