Módulo 1.
Data Engineer People Skills
64H/A
Encontro com a coordenação
- Workshop de abertura
- Dinâmica de Integração e boas-vindas
Creative Thinking
- Criatividade, colaboração e experimentação
- Liderança criativa
- Construção coletiva do conhecimento
Agile Database Project
- Métodos ágeis e suas etapas
- Planejamento e execução de projetos
- Colaboração e comunicação em times ágeis
- Gestão de riscos
Data Governance Platform
- Database Operations Management (Lifecycle)
- Data Quality Management
- Data Security Management (Data Privacy)
- AI Ethics & Responsible AI
Cloud Strategy
- Cloud-first x Cloud-smart x Edge computing
- Otimização de Custos e FinOps
- AI-driven cloud management
Módulo 2.
Data Platforms & Engineering Foundations
108H/A
Distributed Data Processing & Storage
- Estrutura de Dados - HDFS e Apache Spark
- SQL Engines - Impala, Hive e Presto/Trino
- Common patterns - particionamento, sharding, data shuffles, data skews
Cloud Engineering
- Fundamentos de Serverless Computing: AWS Lambda
- Armazenamento, Segurança e Databases
- Arquitetura Lambda e Ciclo de Vida do Ambiente de Execução
- Arquiteturas modernas de mensagens
- Infrastructure as Code (IaC): Terraform e CloudFormation
Data Integration e Pipelines
- ETL/ELT: Airflow, DBT, Talend
- Data Wrangling e Qualidade de Dados em Pipelines
- Data orchestration: backfilling, back-pressure e handling stale data
- Directed Acyclic Graph (DAGs): Apache Nifi, Airflow, Dagster, Databrics
Stream Processing Pipelines
- Arquiteturas event-driven para análise em tempo real: Kafka Streams, Apache Pulsar ou Flink Stateful Functions
- CI/CD: Continuous Integration / Continuous Delivery
- Apache Spark, Amazon Kinesis, Azure Stream Analytics e Google Cloud Dataflow
Relational Database e Advanced SQL
- Arquitetura lógica e organização dos componentes
- Tipos de índices: B-Tree, Hash, GIN, BRIN
- Estratégias de Particionamento e Sharding
- Agregação, subqueries, Common Table Expressions (CTEs) e Recursive CTEs
NoSQL Documental e Buscas Textuais
- MongoDB - Atlas e Aggregation Framework
- Tokenização, stemming e stopwords
- Técnicas de ranking e scoring de relevância (TF-IDF, BM25)
Colunar e TimeSeries Databases
- Cassandra e CQL
- Scylla Data Model
- InfluxDB
Módulo 3.
Intelligence Data Plataforms
96H/A
Data Warehouse, Lakehouse e Data Mesh
- Modern Data Stack
- Cloud Data Warehouses - Snowflake e/ou Databrics
- Uso de APIs de GenAI em plataformas analíticas - Google BigQuery ML, AWS Bedrock
Data Science for Data Engineer
- Fundamentos das técnicas aplicadas em Data Science
- Pré-processamento de dados
- Conexão entre pipelines de dados e modelos ML
Agents & Agentic AI
- Arquitetura no Stack de Dados
- Frameworks e Tecnologias para construção
- Patterns para Desenvolvimento
Knowledge Graph
- Graph Databases
- Graph Data Science
- Ontologias e inferências semânticas
- LLMs e geração de grafos enriquecidos
Generative AI
- Conceitos básicos: LLMs, diffusion models
- Principais frameworks e APIs: OpenAI, Hugging Face, Google Vertex AI
- Visão geral das plataformas: Azure OpenAI, Anthropic, Databricks com Dolly
- GPUs e otimizações para treinamento
GenAI & Databases
- Vector Database e Vector Index
- Prompt Engineering e Few Shot Learning
- Text Embedding e Vector Search
- Vetorização para recuperação de informações (RAG)
Data Product Management
- Design de Data Products
- Observabilidade
- Linhagem e Testes de dados
- Data Product Lifecycle
Módulo 4.
Data Engineer Technical Skills
72H/A
Advanced Data Modeling
- Modelos Relacional e Dimensional
- Modelo de Document: Embedded x Referenced Documents
- Modelo de Grafos
Data Engineering Programming
- Python, Scala, Jupyter Notebook, Rust ou Go
- Spark Dataframe APIs: PySpark e Spark SQL
- Automação de Codificação e Debugging com GenAI
- Geração e Documentação Automática de Código
- Criação de Testes Automatizados com GenAI
DataOps
- Orquestração: AirFlow
- Ciclo operacional em Data Analytics: qualidade e testes automatizados
- Feature Store
- Alta disponibilidade e automação: Cluster Swarm e Kubernetes
- AIOPS: IA para Operações de TI
Microservices, APIs e Webhooks
- Queuing Systems - Data producers e data consumers
- Virtualização, Containers e Docker, Kubernetes
- Apache Kafka (kSQL), RabbitMQ e Saga Pattern
- Observabilidade, Tracing
Módulo 5.
Startup One
30H/A
- Ecossistema Empreendedor
- Intraempreendedorismo
- Inovação
- Open Innovation
- Ideias e Oportunidades
- Business Canvas – BMG
- Prototipação e Design Thinking
- Análise Financeira
- Economia Criativa
- Técnicas de Pitch
- Cases de Sucesso do Cenário Nacional e Global
Módulo 6.
Advanced Skills Certification
60H/A
AI & Strategic Management
- Use sistemas inteligentes para criar planejamentos estratégicos com insights valiosos e decisões precisas. Aprenda a aplicar ferramentas que evoluem com o mercado, potencializando resultados e criando vantagem competitiva real.
AI for Project Management
- Integre inteligência artificial e agilidade para otimizar processos, antecipar riscos e elevar a performance dos seus times. Tenha uma experiência prática com ferramentas que tornam a gestão mais eficiente e os resultados mais previsíveis.
Idea to Enterprise: Business Design
- Aprenda metodologias de Business Design para desenvolver modelos de negócio adaptáveis e sustentáveis. Uma experiência prática para construir o novo, com competências exclusivas e visão de futuro.
Leadership Communication & Corporate Negotiation
- Desenvolva uma presença estratégica, poder de influência e técnicas avançadas para negociações complexas. Uma transformação na sua forma de liderar, com habilidades alinhadas aos desafios corporativos atuais.
Módulo 7.
Extensão internacional (opcional)
--H/A