[DE Design Pattern]09-01 Audit-Write-Audit-Publish
이 코드에서 첫 번째 함수는 파일 크기, 라인 수, JSON 유효성 같은 메타데이터 수준 검증을 수행하고, 두 번째 함수는 pandas로 실제 데이터를 읽어 필수 컬럼의 NULL 여부를 검증
1150 words
|
6 minutes
[DE Design Pattern]09-03 Schema Coompatibility Enforcer
1) External Service/Library 모드 — Schema Registry 같은 외부 서비스가 스키마를 버전 관리하고, producer가 데이터를 쓰기 전에 스키마를 검증한다. 호환성 규칙을 명시적으로 설정
1317 words
|
7 minutes
[DE Design Pattern]09-02 Constraint Enforcer
Type Constraint — 특정 컬럼의 모든 값이 항상 같은 타입임을 보장.
1166 words
|
6 minutes
[DE Design Pattern]08-03. Bucket
Bucket 패턴은 고카디널리티(high-cardinality) 컬럼에 대해 데이터 접근을 최적화하는 패턴.
1847 words
|
9 minutes
[DE Design Pattern]08-04. Sorter
데이터를 특정 컬럼 기준으로 정렬하여 저장함으로써, 쿼리 시 불필요한 데이터 블록을 건너뛸 수 있게 하는 패턴
1371 words
|
7 minutes
[DE Design Pattern]08-05. Metadata Enhancer
Metadata Enhancer는 데이터 파일에 통계 정보(min, max, null count 등)를 메타데이터로 저장하여, 쿼리 시 데이터를 읽기 전에 불필요한 파일/블록을 스킵하는 패턴
1474 words
|
7 minutes
[DE Design Pattern]08-06. Dataset Materializer
비싼 쿼리의 결과를 물리적으로 저장해두고, 이후 소비자는 저장된 결과만 읽게 하는 패턴
874 words
|
4 minutes