CClaude Code Catalog
전체 패턴

데이터 파이프라인 구조

폴더 구조중급

데이터 파이프라인 프로젝트는 추출, 변환, 적재, 분석 등 여러 단계를 포함합니다. 명확한 구조가 없으면 Claude Code는 데이터 소스 커넥터와 변환 함수를 구분할 수 없습니다. 이 패턴은 파이프라인 단계를 일관된 이름 규칙의 별도 폴더로 분리하여, Claude가 새 데이터 소스, 변환기, 출력 대상을 추가하는 것을 간단하게 만듭니다.

데이터ETL파이프라인Python분석폴더 구조

패턴 코드

data-pipeline/ ├── CLAUDE.md # Pipeline conventions ├── config/ │ ├── sources.yaml # Data source definitions │ ├── destinations.yaml # Output target configs │ └── schedules.yaml # Cron/scheduling config ├── src/ │ ├── extractors/ # Stage 1: Data extraction │ │ ├── base.py # Abstract extractor class │ │ ├── api_extractor.py # REST API sources │ │ ├── db_extractor.py # Database sources │ │ ├── csv_extractor.py # File-based sources │ │ └── __init__.py │ ├── transformers/ # Stage 2: Data transformation │ │ ├── base.py # Abstract transformer │ │ ├── clean.py # Data cleaning rules │ │ ├── enrich.py # Data enrichment │ │ ├── aggregate.py # Aggregation logic │ │ └── __init__.py │ ├── loaders/ # Stage 3: Data loading │ │ ├── base.py # Abstract loader │ │ ├── postgres_loader.py # PostgreSQL output │ │ ├── bigquery_loader.py # BigQuery output │ │ ├── csv_loader.py # CSV file output │ │ └── __init__.py │ ├── pipelines/ # Orchestration │ │ ├── daily_sales.py # Full pipeline definitions │ │ ├── weekly_report.py │ │ └── __init__.py │ ├── validators/ # Data quality checks │ │ ├── schema_validator.py │ │ └── quality_checks.py │ └── utils/ │ ├── logging.py │ └── metrics.py ├── tests/ │ ├── fixtures/ # Sample data for tests │ │ ├── sample_sales.csv │ │ └── sample_api_response.json │ ├── test_extractors/ │ ├── test_transformers/ │ └── test_loaders/ ├── data/ # Local data (gitignored) │ ├── raw/ # Extracted raw data │ ├── processed/ # Transformed data │ └── output/ # Final output ├── requirements.txt └── pyproject.toml # CLAUDE.md excerpt: # - Each stage (extract/transform/load) inherits from base.py. # - New data source = new extractor + config in sources.yaml + test. # - Transformers are composable — chain them in pipelines/. # - data/ folder is gitignored. Use tests/fixtures/ for test data. # - All extractors/loaders must handle connection retries. # - Validators run between transform and load stages.

이 패턴을 프로젝트 설정에 복사하여 적용하세요.

실행 미리보기

데이터 파이프라인 구조

데이터 파이프라인 구조에 대해

Claude Code 패턴은 복잡한 개발 시나리오를 효과적으로 다루기 위한 검증된 아키텍처 설계와 워크플로우 구조입니다. 데이터 파이프라인 구조은(는) 중급 수준의 폴더 구조 패턴으로, 프로젝트에 맞게 응용할 수 있는 테스트된 반복 가능한 접근 방식을 제공하여 더 효율적이고 일관된 결과를 만들어 냅니다.

관련 패턴