Przetwarzanie danych przestrzennych

W projekcie HSC Siechnice szczególnie istotną rolę przyjmują dane przestrzenne, rozumiane jako zbiory danych które oprócz typowych atrybutów, przechowujących wartości tekstowe, liczbowe czy np. daty, zawierają również atrybuty przestrzenne, przechowujące dane dotyczące lokalizacji. W najprostszym przypadku, atrybuty te zawierają współrzędne pojedynczego punktu, choć w ogólnej definicji przyjmuje się, że atrybuty przestrzenne zawierają pewien kształt, a precyzyjnie rzecz ujmując – prymityw geometryczny.

Należy tu jednak zauważyć, że definicja ta dotyczy danych wektorowych, jako że stanowią one zdecydowaną większość zbiorów spotykanych w praktyce. Do danych przestrzennych zaliczamy jednak również dane rastrowe.

Rozwój tzw. inteligentnych miast czy „internetu rzeczy’’ zaowocował możliwością rejestracji różnorodnych danych sensorycznych, które najczęściej mają charakter szeregów czasowych. Dane te rejestrowane są jednak często w określonych lokalizacjach, co sprawia, że mamy do czynienia ze zbiorami danych czasoprzestrzennych (ang. spatial-temporal data).

Oprócz wyzwań związanych typowo z zadaniami analizy danych (określenie semantyki atrybutów, ich jednostek, weryfikacja kompletności zbiorów i ich czyszczenie), przetwarzanie danych przestrzennych rodzi nowe, związane stricte z tym rodzajem danych. Należą do nich identyfikacja i unifikacja układów odniesienia, weryfikacja kompatybilności przestrzennej danych (eliminacja niedokładności, przesunięć), czy analiza związków przestrzennych pomiędzy obiektami w różnych zbiorach. Niezwykle istotnym elementem jest także wizualizacja, która tu zyskuje szczególne znaczenie – człowiek jest w stanie analizować bez wykresu dane tabelaryczne (np. statystyczne), lecz zestawienie ze sobą kształtów wyrażanych jako pary (lub trójki) współrzędnych jest niezwykle trudne.