Quando aplicamos
múltiplas fontes (ERP/CRM/e-commerce), dados dispersos, necessidade de análises confiáveis e escaláveis.
Arquitetura (Medallion/Lakehouse)
Ingestão: conectores batch e stream (CDC).
Bronze/Raw → Silver/Staging → Gold/Marts (dimensional/estrela).
Camada semântica: métricas padronizadas para BI.
Boas práticas
versionamento (Git), data tests e freshness, lineage, SLAs/alertas, custo/performance, segurança/PII.
Linguagens & Tech
SQL, Python, Bash, Terraform | dbt, Airflow/Prefect, Spark/Databricks, Fivetran/Kafka, BigQuery/Snowflake/Redshift, S3/GCS, Great Expectations, Power BI/Looker.
Entregáveis
repositório dbt documentado, DAGs de orquestração, catálogo e dicionário de dados, painéis executivos, SLAs.
Métricas de sucesso
freshness < X h, taxa de sucesso de jobs > 99%, latência fim-a-fim, custo por consulta, aderência ao dicionário.
Benefícios
dados auditáveis e consistentes, redução do time-to-insight, base pronta para produtos de dados e IA.

