Investigação técnica¶
Os relatórios são publicados em ordem cronológica de execução. Cada um introduz uma decisão metodológica ou expõe um achado intermediário. Para a narrativa principal e os produtos finais, vá para Tour ou Produtos. Esta página é a sala de máquinas — útil para auditar, replicar ou citar relatórios específicos.
Inventário do acervo (01–05)¶
Mapeamento empírico do Grupo Educação do data.rio: 186 itens, 127 Excels, 35 PDFs. Onde estão, o que tem dentro, o que presta para análise.
| # | Relatório | Em uma frase |
|---|---|---|
| 01 | EDA do manifest | 186 itens, 127 Excels, distribuição por tipo / ano / tag. |
| 02 | Probe da API | 5 endpoints testados; 170 itens "sem URL" no manifest não estão quebrados. |
| 03 | Catálogo dos Excels | 12.3 MiB total, 126/127 são .xls legacy (não xlsx); 1991–2024. |
| 04 | Auditoria do shortlist | 8 candidatos USE / 3 NEEDS_CLEANING / 1 SKIP. |
| 05 | Corpus dos PDFs | 35 publicações IPP; 25 com texto extraível, 10 escaneadas. |
HEX-EDU profundo (06–10)¶
Theil base, robustez, mapa estático, mapa interativo, replicação metodológica.
| # | Relatório | Em uma frase |
|---|---|---|
| 06 | Theil sobre IDEB por bairro | 60–70% within-RA em todos os 9 anos; achado-base do HEX-EDU. |
| 06b | Theil ponderado por matrícula | Robustez: ponderação reduz T_total ~44%, share_within continua > 50%. |
| 07 | HEX-EDU estático | Painel 4 anos × 2 colunas (RA vs H3); argumento visual. |
| 08 | HEX-EDU interativo | Mapa Folium com seletor de ano. Versão pública: Mapa. |
| 09 | IDEB séries finais (9º) | Mesma metodologia em ANOS_FINAIS — within-share 70%. |
| 10 | Replicação metodológica | Theil sobre Aprovação, SAEB, IDEB separadamente — 64–70% within. |
Outros produtos do MVP-1 (11–13)¶
| # | Relatório | Em uma frase |
|---|---|---|
| 11 | THESHA-Rio (3-level) | Decomposição AP / RA-em-AP / bairro-em-RA = 8% / 26% / 67%. |
| 12 | FUN-Rio (pseudocoortes) | 768 transições 5º→9º; 87% pioram, slope −0.53 vs IDEB inicial. |
| 13 | PM-12 (lei de escala) | β = 0.77 sublinear (R² 0.80); SAMI mapeia déficit infra-estrutural. |
Recursos auxiliares¶
- API do data.rio — endpoints validados pelo probe.
- Glossário — IDEB, Theil, AP, RA, bairro, H3, SAMI, etc.
- Reproduzir — quickstart técnico.
Ler na ordem cronológica¶
Se quiser seguir como o lab foi se construindo: 01 → 02 → 03 → 04 → 05 → 06 → 06b → 07 → 08 → 09 → 10 → 11 → 12 → 13. Cada relatório foi mergeado em PR separado, então o histórico de commits também conta a história.