Metodologia Atlasu Dotacji

Celem jest maksymalna kompletnosc i wiarygodnosc. Ponizej opisujemy proces pozyskiwania danych, kontroli jakosci oraz monitoringu luk.

Open Data First

  • Kazde zrodlo ma przypisana licencje i warunki ponownego wykorzystania.
  • Priorytet maja oficjalne API, CSV i harmonogramy instytucjonalne.
  • Dla zrodel bez API utrzymujemy monitoring HTML/PDF/XLS.

Pipeline Jakosci

  • Ingest -> normalizacja -> deduplikacja -> scoring pewnosci.
  • Kazdy rekord przechowuje URL zrodla i znacznik ostatniej weryfikacji.
  • Niski confidence trafia do kolejki recznej walidacji.

Kompletnosc Pokrycia

  • Monitorujemy matrix: instytucja x program x region.
  • Dashboard luk pokazuje brakujace obszary i opoznienia aktualizacji.
  • SLA aktualizacji jest rozdzielone na konektory P0 i long-tail.

Transparentnosc

  • Publikujemy metryki freshness, parse success i duplicate rate.
  • Wskazujemy ograniczenia danych dla kazdego zrodla.
  • Ulatwiamy zglaszanie bledow przez formularz korekty rekordu.