Metodologia Atlasu Dotacji
Celem jest maksymalna kompletnosc i wiarygodnosc. Ponizej opisujemy proces pozyskiwania danych, kontroli jakosci oraz monitoringu luk.
Open Data First
- Kazde zrodlo ma przypisana licencje i warunki ponownego wykorzystania.
- Priorytet maja oficjalne API, CSV i harmonogramy instytucjonalne.
- Dla zrodel bez API utrzymujemy monitoring HTML/PDF/XLS.
Pipeline Jakosci
- Ingest -> normalizacja -> deduplikacja -> scoring pewnosci.
- Kazdy rekord przechowuje URL zrodla i znacznik ostatniej weryfikacji.
- Niski confidence trafia do kolejki recznej walidacji.
Kompletnosc Pokrycia
- Monitorujemy matrix: instytucja x program x region.
- Dashboard luk pokazuje brakujace obszary i opoznienia aktualizacji.
- SLA aktualizacji jest rozdzielone na konektory P0 i long-tail.
Transparentnosc
- Publikujemy metryki freshness, parse success i duplicate rate.
- Wskazujemy ograniczenia danych dla kazdego zrodla.
- Ulatwiamy zglaszanie bledow przez formularz korekty rekordu.