Validação

Fase 3 — Capítulo 4 (Sterman cap. 21)

A pergunta operacional

Quando um modelo SD é “bom o suficiente”? Sterman (2000) (cap. 21) responde com taxonomia em duas frentes: testes estruturais (independem do comportamento simulado) e testes comportamentais (comparam saída a dados).

Testes estruturais

Verificação de limites: o modelo se comporta razoavelmente em condições extremas (estoque nulo, fluxo infinito)?
Verificação dimensional: unidades são consistentes em toda equação?
Robustez a parâmetros: pequenas variações causam grandes saltos?
Adequação às fronteiras: variáveis críticas são endógenas, não exógenas?

Testes comportamentais

Replicação histórica: modelo reproduz dados passados?
Robustez a perturbações: padrões qualitativos sobrevivem a ruído nos parâmetros?
Sensibilidade: que parâmetros mais afetam saídas relevantes?
Família de modos: o modelo gera os quatro modos canônicos do sistema observado?

Crítica à tradição preditiva

Alves; Schwaninger (2025) e a apresentação ASC 2024 de Juliana enfatizam: validação para governança não é validação preditiva. O modelo é bom se ampliou \(H(R)\) do tomador de decisão, não se previu o futuro. Esta é leitura distinta da tradição Sterman — destacada por Espejo na mesa-redonda subsequente — e abre espaço para validação por critérios cibernéticos: o modelo aumenta variedade requisita do regulador? aumenta horizonte de S4? expõe lacunas em S2 antes invisíveis?

Métricas quantitativas

Quando comparação numérica é apropriada: MSE, RMSE, MAPE, Theil’s \(U\). Para sistemas onde “padrão” importa mais que valor exato: comparação de modos via análise espectral.

Conexão com Ashby/Beer

Validação em VSM tem dupla camada: (i) o modelo é internamente consistente (testes Sterman); (ii) o modelo amplia variedade do regulador real (testes Conant-Ashby). Ambas as camadas são necessárias — a primeira garante que o modelo não é absurdo; a segunda garante que ele é útil.

Pergunta de verificação

Para um modelo SD próprio (escolha um da literatura ou construa simples): aplique três testes estruturais e dois comportamentais. Em linguagem cibernética: o modelo amplia \(H(R)\)? De quem?

Dica

Para Joana: validar modelo SD da coordenação de curso (replicação histórica de matrícula 2010–2024) é estruturalmente análogo a validar JPEG por PSNR. Use as duas métricas em paralelo.

Referências

ALVES, Juliana Mariano; SCHWANINGER, Markus. Model-based Governance: A Cybernetic Approach to Water Allocation Control. Environmental Management, v. 75, p. 3344–3363, 2025.

STERMAN, John D. Business Dynamics: Systems Thinking and Modeling for a Complex World. [S.l.]: Irwin/McGraw-Hill, 2000.