Geodatenquellen¶
Geospatiale Daten können für verschiedene Zwecke aus verschiedenen Quellen abgerufen werden. Hier sind einige von ihnen:
Geographical, atlas-style map data werden von naturalearthdata
.com (z.B. die ~230 MB Natural Earth quick start kitgebündelt mit vorgefertigten QGIS-Projekten) bereitgestellt. DEMs, ozeanographische und mehr wasserbezogene Karten sind in den USA erhältlich NOAA Geo-platform und dessen TDS Catalog
OpenStreetMap data extractions are available at https://
download .geofabrik .de/ Satellitenbilder sind verfügbar bei
das ESA’s Copernicus Data Space Ecosystem (Sentinel-1/2/3/5P; dies ersetzte den ehemaligen Copernicus Open Access Hub / SciHub, der am 2. November 2023 stillgelegt wurde)
planet.com (commercial)
LiDAR-Daten finden Sie unter opentopography.org.
Climatologische Daten werden von NASA Earth Observations (NEO).
Meteorologische (z.B. Temperatur oder Niederschlag) und Echtzeit-Satellitendaten stehen unter wunderground.com und dessen wundermap.
Klima- und meteorologische Daten und Prognosen sind unter cds
.climate .copernicus .eu, einschließlich z.B. ERA5 monatlich gemittelte Temperaturdaten Daten zur Landnutzung (einschließlich Baldachinabdeckung), sozioökonomische Merkmale und globaler Wandel sind auf dem FAO Map Catalog (GeoNetwork) oder dem archivierten ISCGM Global Map Portal (go to their GitHub archive) verfügbar.
Topographical data (1 to 5-m resolution) from the state of Bavaria, Germany, can be found at https://
www .ldbv .bayern .de. Topographical data from EU countries can be found at https://
www .mapsforeurope .org.
Visualisierung¶
GIS-Software wird benötigt, um geospatiale Daten anzuzeigen und viele Werkzeuge existieren. Diese Website bietet in erster Linie Beispiele mit QGIS. Da die Verwendung von GIS-Software, insbesondere QGIS, für mehrere Abschnitte in diesem eBook erforderlich ist, sind bereits Erläuterungen zur Installation von QGIS in der Software für Geografik enthalten.
Geodatenbasis¶
Eine Geodatenbasis (auch bekannt als spatiale Datenbank) kann speichern, abfragen (z.B. mit Structured Query Language SQL) oder Daten mit geographischen Referenzen modifizieren (geospatial data). Geospatiale Daten bestehen in erster Linie aus Vektordaten (siehe Formdateien), können aber auch Rasterdaten implementiert werden. Eine Geodatenbank verknüpft diese Daten mit Attributtabellen und geographischen Koordinaten. Eine Besonderheit der Geodatenbanken besteht darin, dass sie über einen (Web- oder lokale) GIS-Server (geografisches Informationssystem) visualisiert und manipuliert werden können. So können beispielsweise Software wie QGIS (oder ArcGIS Pro) Karten erstellen und Abfragen auf einem lokalen Server unter Verwendung von lokal gespeicherten Geodaten vornehmen. Das typische Geodatenbasisformat ist .gdb, das als Verzeichnis in QGIS oder ArcGIS fungiert, und die maximale Größe einer .gdbDatei beträgt 1 Terabyte.

Das funktionale Skelett einer Geodatenbank.
Vector Data¶
Vektordaten sind optisch glatt und effizient für Overlay-Operationen, insbesondere in Bezug auf formgetriebene Geoinformationen wie Straßen oder Oberflächendelineationen. Vektordaten zeichnen sich dadurch aus, dass sie wenig speicherintensive, einfach skaliert und mit relationalen Umgebungen kompatibel sind. Gemeinsame Formate sind .shp, JSON oder TIN.
The shapefile format was invented by Esri in the early 1990s (the original shapefile technical description (PDF) remains the authoritative reference) and information contained in a shapefile can be:
Polygone (Flächen),
Punkte mit x-y-z-Koordinaten und ein m-Feld mit Punktdaten und
(Poly) Linien aus Linien, die durch Startpunkte und Endpunkte definiert sind.
Formblatt¶
Eine Shapefile besteht aus mehreren Dateien auf der Festplatte mit folgenden wesentlichen Teilen:
eine
.shp-Datei, in der Geometrien gespeichert sind,eine
.shx-Datei, in der Indizes der Geometrien gespeichert sind,eine
.prj-Datei, die die Projektion speichert, undeine
.dbf-Datei mit Attributinformationen (entspricht der Attributtabelle).
These files need to be in the same folder - otherwise, the shapefile is incomplete and does not work (correctly). A couple of other files may occur when we manipulate a shapefile (e.g., .atx, .sb*, .shp.xml, .cpg, .mxs, .ai*, or .fb*), but we can ignore those files.
Shapefile Vektordaten haben typischerweise eine Attributtabelle (genau wie jede andere Geodatenbank), in der jedem Polygon, Zeile oder Punktobjekt ein Attributwert zugewiesen werden kann. Attribute werden durch Spalten zusammen mit ihren Namen (Spaltenköpfe) definiert und können numerisch (z.B. float, double, int oder long), Text (string) oder Datum/Zeit (z.B. yyyymmd oder HH:MM:SS) Formate haben.

Abbildung von Punkt (rot), (Poly) Linie (grün), und Polygon (blau) Formdatei Features.
Shapefile versus Geodatabase¶
Eine Formdatei kann als konkurrierendes Format einer Geodatenbank verstanden werden. Welches Dateiformat ist besser? Streng genommen können sowohl eine Geodatenbank als auch eine Formdatei ähnliche Operationen ausführen, aber eine Formdatei benötigt mehr Speicherplatz, um ähnliche Inhalte zu speichern, kann keine kombinierten Datums- und Zeitfelder speichern und unterstützt keine Rasterdaten oder Null (not-a-number) Werte. Shapefiles sind auch auf 2 GB pro Komponentendatei, Attributnamen von 10 Zeichen oder weniger und Textfelder von 255 Zeichen oder weniger beschränkt. So haben Geodatenbasen (und das tragbarere GeoPackage Format) einen technischen Vorteil gegenüber Formdateien, aber die Verwendung von Formdateien ist immer noch beliebt und viele ältere geospatiale Workflows konzentrieren sich auf Shapefile Manipulationen.
Triangulated Unegular Network (TIN)¶
A triangulated irregular network (TIN) represents a surface composed of multiple triangles. In hydraulic engineering and water resources research, one of the most important uses of a TIN is the generation of computational meshes for numerical models (read more in the ABSCHNITT tutorial, for example). In such models, a TIN consists of lines and nodes forming georeferenced, three-dimensionally sloped triangles of the surface, which represent a digital elevation model (DEM). TIN nodes have georeferenced coordinates and potentially more attribute information such as node IDs and elevation. The advantage of a TIN DEM over a raster (see below) DEM is that it requires less storage space. However, manipulating a TIN is not as straightforward as manipulating a raster. The below figure shows an example TIN created with matplotlib.tri.TriAnalyzer, and based on a showcase from the matplotlib docs. The file ending of a TIN is .tin.

Illustration einer TIN.
GeoJSON¶
GeoJSON ist ein offenes Format für die Darstellung geografischer Daten mit einfachen Funktionszugriffsstandards, wobei JSON JavaScript Object Notation (weitere Informationen zu JSONDateimanipulation in den Python-Grundlagen) bedeutet. GeoJSON ist standardisiert als RFC 7946. Der GeoJSON-Dateiname ist .geojson und eine Datei hat typischerweise die folgende Struktur:
{
"type": "FeatureCollection",
"features": [
{
"type": "Feature",
"geometry": {
"type": "Point",
"coordinates": [9.104028940200806, 48.74417005744522]
},
"properties": {
"name": "IWS"
}
}
]
}Während GeoJSON-Metadaten Höheninformationen (z-Werte) als properties-Wert bereitstellen können, gibt es einen geeigneteren Nachwuchs, um geospatiale Topologie in Form des TopoJSON-Formats zu kodieren. Um GeoJSON-Dateien mit Python zu manipulieren, gehen Sie auf den Abschnitt Geodäsie. Um eine angepasste GeoJSON-Datei zu erstellen, besuchen Sie geojson.io.
GeoPackage (GPKG)¶
GeoPackage (.gpkg) ist ein offenes, plattformunabhängiges, standardbasiertes Geospatial-Datenformat, das vom Open Geospatial Consortium (OGC) (OGC Standard 12-128r19) veröffentlicht wird. Technisch ist ein GeoPackage eine einzige SQLite3 Datenbankdatei, die der GeoPackage-Spezifikation folgt, was bedeutet, dass es neben GIS-Software wie QGIS mit jedem SQLite-Aware-Tool geöffnet, abgefragt und modifiziert werden kann.
Im Gegensatz zu einer shapefile (die wirklich ein kleines Paket von Sidecar-Dateien ist), ist eine GeoPackage * eine einzelne Datei*, die gleichzeitig enthalten kann:
Mehrere vector Schichten (Punkte, Linien, Polygone, Mischgeometrie) in einem Behälter,
Raster* Fliesenpyramiden (z.B. GeoTIFF-Stil-Bilder oder DEMs),
*Beitragstabellen ohne Geometrie,
*Spatial Indizes (R-tree) für schnelle räumliche Abfragen,
Metadata und Styles.
Warum ein GeoPackage anstelle einer Formdatei verwenden?¶
Im Vergleich zur Legacy Shapefile entfernt das GeoPackage-Format die meisten bekannten Einschränkungen der Shapefile:
Objekt | Shapefile | GeoPackage |
|----------
| Anzahl der Dateien pro Datensatz | Mindestens 3 (.shp, .shx,.dbf, plus.prj,.cpg, ...) | 1 (.gpkg) |
| Anzahl der Schichten pro Datei | 1 | Viele (Vektor und Raster gemischt) |
| Maximale Größe | 2 GB pro Komponente Datei | ~140 TB (SQLite Limit) |
| Feldname Länge | ≤ 10 Zeichen | Unbegrenzt (praktisch) |
| Textfeldlänge | ≤ 255 Zeichen | Unbegrenzt (TEXT) |
| Zeichencodierung | Code-Seite abhängig (.cpg) | UTF-8 (vollständiger Unicode) |
Datums-/Zeitdatentyp | Datum nur | VollständigDATETIME |
| Null / NaN Werte | Nicht unterstützt | Unterstützt |
| Spatial index | External (.sbn/.sbx) | Eingebauter R-Tree |
| Raster-Unterstützung | Nein | Ja (gekippt) |
| Standardisierung | De-facto (Esri Whitepaper) | Open OGC Standard |
Lesen und Schreiben eines GeoPackage mit Python¶
GeoPackage wird von GDAL/OGR, Fiona, geopandas, und rasterio. Eine typische Rundreise mit geopandas sieht aus wie:
import geopandas as gpd
# Read a specific layer from a GeoPackage
gdf = gpd.read_file("rivers.gpkg", layer="centerlines")
# Write (or append) another layer into the same .gpkg
gdf.to_file("rivers.gpkg", layer="centerlines_buffered", driver="GPKG")Zur Auflistung aller in einem GeoPackage enthaltenen Schichten:
import fiona
print(fiona.listlayers("rivers.gpkg"))Da eine GeoPackage eine SQLite-Datenbank ist, können Attributabfragen auch direkt über SQL ausgegeben werden:
import sqlite3
con = sqlite3.connect("rivers.gpkg")
for row in con.execute("SELECT name, length_m FROM centerlines WHERE length_m > 1000"):
print(row)Gridded Cell (Raster) Daten¶
Raster datasets store pixel values (cells), which require large storage space, but have a simple structure. Another big advantage of rasters is the possibility to perform geospatial algebra and statistical analyses. Common raster dataset formats are, among others, .tif (GeoTIFF), GRID (a folder with BND, HDR, STA, VAT, and other files), .flt (floating points), ASCII (American Standard Code for Information Interchange), and many more image-like file types.

Abbildung des NE1 50M SR W.tif-Rasters, der auf Nepal gezoomt wurde, mit Punkt- und Linienformdateien, die größere Städte bzw. Ländergrenzen angeben. Beachten Sie das fliesenartige Erscheinungsbild des Rasters, bei dem jede Kachel einer 50m-x-50m Rasterzelle entspricht.
Lidar und Unterwasser Digitale Aufzugsmodelle (Bathymetrien)¶
Terrain-Erhebungsdaten werden oft in Form eines x-y-z-Punkt-Datensatzes zusammen mit Punktatparametern geliefert. Dreidimensionale Datensätze der bloßen Erdoberfläche werden als Digital Elevation Model bezeichnet (lesen Sie mehr über DEM Terminologie im Glossar), das die Basis für jede physikalische Analyse eines Flussökosystems darstellt. Die Unterwassertopographie wird als *Badymetrie eines Flusses oder eines anderen Wasserkörpers bezeichnet. Heutzutage stammen x-y-z-Punktwolken zur Generierung einer Digitales Oberflächenmodell (DOM) meist aus Lidar, kombiniert mit Echo sounder-Umfragen. Ältere Ansätze verlassen sich auf manuelle Vermessung (z.B. mit einer Gesamtstation) von Querschnitts-Flussprofilen und interpolieren das Gelände zwischen den Profilen. Die neuere Lidar-Technik verwendet Lichtquellen und liefert Badedaten bis zu 2-m tiefes Wasser in Form von *.las oder das Reißverschlussformular *.laz-Dateien. Tiefere Gewässer werden mit einem Echo sounder kartiert und die zusammengeführten Lidar- und Echo-Sounding-Datensätze produzieren nahtlose Punktwolken von Flussökosystemen, die in verschiedenen Dateitypen gespeichert werden können.
Lidar erzeugt massive Punktwolken, die auch leistungsstarke Computer schnell überladen. Deshalb müssen in der Praxis Lidar-Daten in kleinere Zonen von weniger als 106-Punkten aufgegliedert werden. Besondere Lidar Verarbeitungssoftware (z.B. LAStools) ist dabei hilfreich.
Projekte und Koordinatensysteme¶
Bei georäumlichen Datenanalysen stellt eine Projektion einen Ansatz dar, um den Globus (ein Teil) zu flachen. In diesem Abflachungsprozess werden auf die Koordinaten einer zweidimensionalen (2d) Karte latitudinale (Nord/Süd) und longitudinale (West/Ost) Koordinaten eines Ortes auf der Welt (dreidimensional - 3d) projiziert. Werden 3d-Koordinaten auf 2d-Koordinaten projiziert, treten Verzerrungen auf und in geospatialen Analysen werden unterschiedliche Projektionssysteme eingesetzt. In der Praxis bedeutet dies, dass, wenn wir geospatiale Datendateien mit unterschiedlichen Projektionen verwenden, sich ein Verzerrungseffekt in alle nachfolgenden Berechnungen ausbreitet. Es ist entscheidend, solche Verzerrungseffekte zu vermeiden, indem sichergestellt wird, dass das gleiche Projektions- und Koordinatenreferenzsystem (Koordinatenreferenzsystem) konsequent auf alle geospatialen Daten angewendet wird. Dies beginnt mit der Schaffung einer neuen geospatialen Schicht (z.B. einer Punktvektorformdatei oder GeoPackage) in QGIS (get installation instructions) und sollte konsequent in allen Programmcodes verwendet werden. Um ein Koordinatenreferenzsystem anzugeben; z.B. in QGIS (tutorial in the next section), klicken Sie auf Projekt* > Properties** Koordinatenreferenzsystem-Tab und wählen Sie eine COORDINATE_SYSTEM. Ein geeignetes Koordinatensystem für Mitteleuropa ist z.B. ESRI:31493 (weitere Informationen finden Sie in der QGIS docs). Die projizierten Systeme variieren mit der Region (lokale Koordinatensysteme), die beispielsweise unter epsg.io oder spatialreference
In shapefiles werden Informationen über die Projektion in einer .prj-Datei gespeichert (Recall-Definitionen in der shapefile section), die eine einfache Textdatei ist. Das Open Geospatial Consortium (OGC) und Esri verwenden Well-Known Text (*WKT)-Dateien für Standardbeschreibungen von Koordinatensystemen und eine WKT-formatierte .prj-Datei wird im folgenden Codeblock angezeigt. Die in der WKT-formatierten .prj-Datei definierten Einheiten und Maßnahmen bestimmen auch die Einheiten von WKB** (Well-Known Binary) Definitionen von Geometrien wie Linienlänge (z.B. in Metern, Füße oder vieles mehr) oder Polygonfläche (Quadratmeter, Quadratkilometer, Acres und vieles mehr).
PROJCS["unknown",GEOGCS["GCS_unknown",
DATUM["D_Unknown_based_on_GRS80_ellipsoid",SPHEROID["GRS_1980",6378137.0,298.257222101]],
PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]],
PROJECTION["Lambert_Conformal_Conic"], PARAMETER["False_Easting",6561666.66666667],
..., UNIT["US survey foot",0.304800609601219]]In GeoJSON-Dateien ist das Standard-Koordinaten-Referenzsystem WGS 84 (Länge/Länge, EPSG:4326), wie es von RFC 7946 §4.