[DE Design Pattern]05-5. Distributed Aggregator
2025-03-14
Exchange hashpartitioning이 보이면 shuffle이 발생하는 것입니다.
952 words
|
5 minutes
[DE Design Pattern]05-8. Stateful Sessionizer
2025-03-14
Stateful Sessionizer는 스트리밍 파이프라인에서 세션을 생성하는 패턴입니다. Incremental Sessionizer의 “pending sessions 저장소” 역할을 State Store가 대신합니다.
1211 words
|
6 minutes
[DE Design Pattern]05-9. Data Ordering
2025-03-14
-> 순서를 깨지 않는 범위에서 레코드를 batch로 묶어서 처리하기
1771 words
|
9 minutes
[DE Design Pattern]05-7. Incremental Sessionizer
2025-03-14
핵심 도전: 하나의 세션이 여러 파티션에 걸쳐 존재할 수 있습니다. 예를 들어 시간당 파티션에서 한 사용자의 세션이 3시간 지속되면, 3개 파티션에 레코드가 분산됩니다. 이를 증분 처리로 해결합니다.
1318 words
|
7 minutes
[DE Design Pattern]04-1. Idempotency 멱등성 기초
2025-03-06
멱등한 파이프라인이란 결국 두 가지 중 하나를 보장하는 것
639 words
|
3 minutes
[DE Design Pattern]04-2. Overwriting 패턴들
2025-02-28
메타데이터 한계 — 여러 파이프라인에서 이 패턴을 쓰면 한계에 빠르게 도달. freezing 스텝을 따로 두어서, 변경이 없는 오래된 주간 테이블을 월간/연간 테이블로 병합 가능
1796 words
|
9 minutes