Konferenz 2006/Massenhaltung von Rasterdaten in Open-Source Datenbanken - ein Erfahrungsbericht

Aus FOSSGIS Wiki
Zur Navigation springenZur Suche springen

Nicht erst seit der Popularität von GoogleEarth ist klar, dass Rasterdaten in der Orchestrierung von Geo-Webdiensten künftig ihren festen Patz haben werden. Dabei stellen EO-Daten nur die Spitze des Eisbergs dar - zu weiteren relevanten Datenstrukturen gehören unter anderem auch 3D-Daten aus der Geophysik (x/y/z), 3D-Satellitenbild-Zeitreihen (x/y/t) sowie 4D-Klimasimulationen (x/y/z/t). Heutige Speicher- und CPU-Technologie erlaubt durchaus die Online-Bereitstellung der anfallenden grossen Datenvolumina. Softwareseitig werden in der Regel dateibasierte Implementierungen eingesetzt; die Ablage der grossvolumigen Rasterdaten in Datenbanken ist noch die Ausnahme, unterstützt von wenigen Herstellern und bisher für kommerzielle Datenbanken.

Können auch Open-Source Datenbanken Multi-Terabyte Rasterobjekte verwalten? Falls ja, ergäbe sich offenbar eine kostenattraktive Variante zu den kommerziellen Produkten.

In unseren Arbeiten zu datenbankbasierten Raster-Diensten haben wir in den letzten zwei Jahren untersucht, inwieweit PostgreSQL den diesbezüglichen Anforderungen gerecht werden kann. Die Systemarchitektur besteht einheitlich aus PostgreSQL als Datenmanagement-Komponente auf einem preiswerten Linux-PC, darauf die Rasterserver-Middleware rasdaman, welche eine Raster-Anfragesprache bereitstellt; Java-Servlets zur Umsetzung von WMS- und WCS-Requests in diese Anfragesprache; und schließlich einem Web-Browser als Frontend.

Im Vortrag berichten wir über unsere Erfahrungen mit PostgreSQL als Raster-Datenbank im Vergleich zu kommerzieller Software hinsichtlich Programmieraufwand, Stabilität und Laufzeitverhalten. Grundlage bilden mehrere kommerzielle und wissenschaftliche Projekte, in denen PostgreSQL als Rasterdatenbank eingesetzt wird. Das französische Luftbild (Gesamtvolumen: 8 TB) wird vom Nationalen Geographischen Institut in Paris derzeit aufgebaut. Im OGC Interoperability Experiment GALEON werden 4-D Klimamodelldaten in PostgreSQL verwaltet und über OGC-Webdienste (u.a. WCS) angeboten. Weitere Projekte werden zum Vortragstermin präsentiert werden können, ggf. mit Live-Demo. Abschließend bewerten wir die Gesamttauglichkeit von PostgreSQL für den operativen Einsatz als Rasterserver.