2014-04-08, Protokoll
Protokoll 2014-04-08, 10:00 - 12:30 Uhr Thema: Flora von Bayern; Umsetzung des Datenflusses von DWB zu FIS-Natur (FIN-View) und Einbindung der Taxonomischen Referenzliste (Taxref) in die Codepläne des LfU Ort: Botanische Staatssammlung München/ SNSB IT-Zentrum (http://www.snsb.info/) Anwesend: W. Ahlmer (AH; SNSB), J. Ewald (EW; Hochschule Weihenstephan-Triesdorf), T. Feist (FE; GUC), I. Langensiepen (LS; LfU), D. Neubacher (NE; SNSB), S. Socher (SO; LfU), D. Triebel (TR; SNSB), M. Weiss (WE; SNSB), A. Zacher (ZA; GUC) Einführung von TR: - Primäre Datenhaltung „Master-Datenbanken“ der Flora von Bayern-Daten (BFL-Daten) erfolgt z. T. in der Diversity Workbench (DWB) mit 5-6 datendomänen-spezifischen relationalen Datenbanken und z. T. in FIS-Natur (ASK-Nachweise). - DWB = Plattform aus relationalen Datenbanken; MS SQL Server 2008; ER-Diagramm der wichtigsten Komponente im BFL-Kontext, nämlich DiversityCollection (DC) unter http://diversityworkbench.net/Portal/CollectionModel_v2.05.17 - Daten werden möglichst vollständig in FIS-Natur (FIN-View) überführt. - Dies betrifft Beobachtungs-, Herbar-, Literaturdaten, aber auch die Taxref. - Taxref mit LfU-Code-Nummern und weiteren für den amtlichen Naturschutz wichtigen Informationen ist komplex und wird unregelmäßig aktualisiert; ER-Diagramm von DiversityTaxonNames (DTN) unter http://diversityworkbench.net/Portal/TaxonNamesModel_v2.4 - Vorgesehen: monatlicher Transfer der Beobachtungsdaten; gelegentlicher Transfer der TaxRef. - Datenbanken in Virtueller Maschine, MS-SQL-Server-Umgebung, Systemadministration, Virtualisierung, Archivierung, Datenflüsse, Linux betreut von NB. - Software-Entwicklung, C#: WE.
Vorschlag zum Datentransfer: NE: - Datenbereitstellung: jeden Tag eine Sicherung von MS SQL Server, ? Über FTP-Server bereitstellen? - Datenbank-Export als Backup in csv-Datei (inkl. Beschreibung und Inhalt)? - Datenfluss für Wissenschaftsportale MS SQL-Datenbank PostgreSQL: 5-6 Tabellen, ständig abrufbar (nur Kerndaten). ZA: - Größe des Datenpaketes spielt eine Rolle. - Einbindung der komplex strukturierten DWB-Daten in Strukturen des FIN-View ist möglich. - Der Export von Teilen der Datenbestände z.B. für Gutachterbüros und Untere Naturschutzbehörden (UNB) erfolgt vereinfacht je nach Anforderung: z.B. nur Fundorte und Artbeschreibung: als SQLite-Datenbank oder MS Access-Ausspielung oder verschlüsselt zur Darstellung im FIN-View. - Eine FIS-Natur-interne Datenhaltung (relationales Datenbanksystem) ist möglich. - Die GUC hält verschiedene Datenbanken z.B. für die Artenschutzkartierung und die Biotopkartierungen. Daraus werden Daten in vereinfachter Struktur für Anwender exportiert. Eine Herausforderung der Kooperation zwischen GUC und SNSB IT-Zentrum wird die Absprache der Datenübergabe, -dokumentation, Schnittstellenabsprache und-entwicklung sein. LS: - Themen im Fokus: doppelte Daten, Import, Export der ASK-Daten, Rückimport der korrigierten bayerischen Daten im Deutschlandatlas. TR: - Die Daten im Deutschlandatlas wurden vergröbert, oft keine eindeutige Möglichkeit der Zuordnung zu Originaldaten, so dass umfangreiche manuelle Arbeiten nötig werden. - Masterdatenbanken der ASK liegen bei der GUC, so dass dafür ein eigenes “Projekt“ in der DWB mit Zugriff, am besten nur über Leserechte, eingerichtet wird. ZA: Die DWB-Daten zur BFL können nicht in die ASK-Datenbank importiert werden, sondern sollen als separate Datenbank geführt werden (mit DWB-Identifiers). Die ASK-Daten haben eine GUID (global unique identifier), der beim Import in die DWB mitgeführt werden soll. Kuration der Taxref Gefäßpflanzen Bayern Diskussion um langfristige Pflege der Liste und der Einbindung neuer Sippen und Informationen in die LfU-Codepläne. AH: baut aktuell die in den letzten Jahren angefallenen Änderungen in der Taxref ein, die Zahl der erfassten Namen wird um ca. 30% steigen. Konkrete Fragen werden Herr Ahlmer und Herr Enzinger (GUC) direkt klären. Die GUC übermittelt zwei FIN-View Lizenzen für das Projekt, darin enthalten sind auch die aktuellen Codepläne. TR: Die Datenbank DiversityTaxonNames kann Taxonomien, Klassifikationen, unterschiedliche Taxonomie-Konzepte, auch sog. Konzept-Namen wie Taraxacum officinale agg. etc. verwalten. Daneben kann man auch Zusatzinformationen wie den Rote-Liste-Status, Gefährdungsgrad, FHH-Status und deutsche Namen verwalten. ZA: Der FFH-Status einzelner Sippen darf nicht durch Änderungen im Codeplan verloren gehen. AH: Im Einzelfall muss ein Abgleich zwischen an verschiedenen Stellen verwalteten Informationen zu den Codeplänen und der BFL-Taxref erfolgen. LS: Nach Import der Taxref in DTN und Bereitstellung der Liste für das LfU soll ein Konzept für zukünftige Taxref-Bearbeitungen entwickelt werden. Dabei sollte festgelegt werden: welche Informationen wo und von wem gepflegt werden, ob ein jährlicher Abgleich zwischen den Beständen organisiert werden kann und beide Seiten Teile der Taxref bearbeiten. AH: Durch die Neuauflage von Rothmaler und durch den Deutschlandatlas gibt es viele Änderungen in der Taxref. TR: Änderungen müssen nachvollziehbar sein, recht komplexe Bearbeitung. In ca. 8 Wochen soll der aktuelle Stand der Taxref vorliegen und dann in DTN importiert werden. ZA: Der Abgleich zwischen Fachdaten und der Taxref erfolgt in ASK-Datenbank automatisch. Es gibt aber auch dezentral vorgehaltene Datenbestände. Die Codepläne werden daher weitergeben z.B. an die Bayerische Landesanstalt für Wald und Forstwirtschaft (LWF). Auch pflegen die Kartierer ihre PC-ASK-Dateien dezentral selber, d.h. die GUC muss neue Namenszuordnungen in allen Datenbeständen verarbeiten können. DT: Die BFL-Taxref soll, sobald inhaltlich überarbeitet und in DTN vorliegend, auf einen eigenen Webserver gelegt werden, um auch anderen DWB-Installationen einen Zugriff darauf zu ermöglichen, z.B. im GBOL-Kontext oder im DiversityMobile-Kontext. Auch soll für den Bereich taxonomische Standardlisten für Deutschland ein Webservice eingerichtet werden, der dann auch die BFL-Taxref mit Kerndaten als open data-Dienst zugänglich macht. Pflege der BFL-Beobachtungsdaten: DT: Es sollten klare Konzepte zum langfristigen Management der Daten entwickelt werden. Diese können je nach Datenbestand/-paket verschieden sein. AH: Bei Eingang von aktualisierten Datenbeständen z. B. aus der Flora von Bad Kissingen wird derzeit das komplette Datenpaket ausgetauscht. Korrekturen, die zwischenzeitlich z. B. in der DWB erfolgt sein könnten, können z. T. halbautomatisch oder müssen manuell eingearbeitet werden. ZA: Für Datenänderungen auf Seiten der Kartierer und der Datenzentrale (seien es durch Regionalkoordinatoren oder durch Datenkuratoren am SNSB IT-Zentrum) muss ein Konzept erarbeitet werden. Grundprinzipien müssen definiert werden. Eindeutige Identifiers müssen vorhanden sein, sowohl was die Beobachtung angeht, als auch was die Taxref-Nummern angeht. Die Kartierer sollten nicht ermuntert werden, in Excel einzugeben. Bei einer Eingabe in FlorEin sollte auf die Eingabe eines Identifiers gedrängt werden. AH: FlorEin hat kein Identifier-Feld d.h. ein anderes Feld müsste für diesen Zweck umgewidmet werden. TR: DWB führt auch Fremd-Identifier mit. Die aktuellen im Rahmen der BFL verwendeten IT-Werkzeuge zur Dateneingabe werden im Wiki der Bayernflora vorgestellt unter http://wiki.bayernflora.de/web/Datenbank-Anwendungssoftware_zur_Eingabe_von_BFL-Daten und unter http://wiki.bayernflora.de/web/Excel-Dateien_zur_Eingabe_von_BFL-Daten. Mehrere neue Excel-Vorlagen zur optimierten Datenerhebung im DWB-Kontext sollen noch erstellt werden. Wie weit die einzelnen Managementsysteme und Werkzeuge zur Datenerhebung verbreitet sind, könnte ein Fragebogen klären. EW: Arno Wörz (Flora von Baden-Württemberg) macht konkrete Vorgaben, was nacheditiert werden darf, z.B. werden nur Verbesserungen der Fundortdaten angenommen. ALLE: Es erscheint nicht möglich, allen Kartierern einheitliche Werkzeuge zur Datenerhebung vorzuschreiben. (Empfehlenswert wäre eine direkte Eingabe in Standard-Werkzeuge wie in Recorder 6 D, PC-ASK und DC). DT: FlorEin wird wohl aktuell von keinem Entwickler-Team neu programmiert und kann daher nicht empfohlen werden. Persönlich würde DT DiversityMobile als Werkzeug zur Dateneingabe im Feld empfehlen (=WindowsPhone mit TK 25 Karten). Die Taxref wird als Auswahlliste hinterlegt, direkte Synchronisation mit DC am SNSB IT Center. AH und LS: Sobald Daten in der DWB sind, erfolgt ein Export an GUC (z.B. Bad Kissingen, 500.000 Artangaben, 4.000 Fundorte). WE: gleichbleibende Datenbankstruktur, aktuell SQL 2008, in ein paar Wochen/Monaten SQL 2012, voraussichtlich lassen wir SQL-Server 2012 aus uns gehen direkt zu SQL-Server 2014. ZA: Das GUC gibt Codetabellen an W. Ahlmer zum Abgleich und 2 Lizenzen für FIN-View-Installation an SNSB (Verbändeversion; AH, W. Reichert), SO schickt einen ASK print-Auszug „Pflanzen“ an AH, M. Weiss. ZA: In welchem Datenformat sollen die Daten der Artenschutzkartierung, (erhoben mit PC-ASK) der DWB zum Import bereitgestellt werden? WE: als tab-separierte txt-Tabelle, flache Tabelle oder MS Access-Datenbank. Darstellung der Verbreitungskarten: TR: Zuerst soll – wie vereinbart – die Datengrundlage geschaffen werden, dann evtl. mit Hilfe von A. Plank (= Wiki-Programmierer) Karten-Darstellung im Wiki evaluiert werden, ähnliche Darstellung wie im BIB, mit zusätzlichen Angaben. EW: Umzug des BIB ins Wiki zur Flora von Bayern: Die Angaben zu Vereinen etc. sind bereits übernommen, stark überarbeitet und aktualisiert. Die Steckbriefe und Karten stehen noch auf der Agenda. DT: Ziel für 2014 sind die Datenimporte nach DWB, eine finalisierte Version der Taxref und der Aufbau eines ersten Datenflusses zur GUC. AH: Deutschlandatlas-Daten sollen im BIB dargestellt werden. Biotopkartierung: TR: Ziel des laufenden Projektes ist es, ein Konzept für die Integration der Daten aus der Biotopkartierung (BK) zu entwickeln. Der eigentliche Import in die DWB mag sich als zeitintensiv erweisen und soll erst nach den erfolgreichen Importen aus den anderen Quellen und der Übernahme des Managements der Daten in der DWB durch SO und AH vorgenommen werden. LS: Ende 2014 soll ein Treffen organisiert werden, um die Qualität der BK-Daten zu evaluieren. Sowohl auf fachlicher als auch auf technischer Ebene soll ein Workflow für diese Daten erarbeitet werden. Eine Herausforderung stellt die Darstellung der biotop-bezogenen Daten auf Quadrantenebene dar. AH: Hinsichtlich fachbezogener Fragen zur BK sollte J. Klotz einbezogen werden. EW: Ein Prozess zur Qualitätsprüfung auf mehreren Ebenen sollte erarbeitet werden. Einbindung der Regionalkoordinatoren in das laufende BFL-Projekt: TR: Im Herbst sollen vor allem die Regionalkoordinatoren zu einem DWB-Workshop eingeladen werden. Eine wichtige Aufgabe der Regionalkoordinatoren ist die Qualitätskontrolle. Sie haben eine zentrale Rolle innerhalb des BFL-Datenflusses und sind die Schaltstelle zum Management der BFL-Daten in den nachhaltigen DWB-Strukturen am SNSB IT-Zentrum. AH: Altdaten werden des Öfteren über die Regionalkoordinatoren oder auch direkt an AH in aktualisierter Form neu geliefert. Diese Updates sollen in Zukunft am besten durch die Regionalkoordinatoren selbst mit Zugriff auf ihre Flora von Bayern-Datenpakete bzw. „Projekte“ in die DWB importiert werden (Stichwort „Import-Wizard“). Als Mediatoren und Datenkuratoren können derzeit SO und AH fungieren, derzeit eingeführt durch Frau Weibulat und Frau Sanz am SNSB IT-Zentrum. LS: Die DWB-Schulung muss anwenderorientiert sein, am besten unter Verwendung von Flora von Bayern-Daten, erhoben von den Kartierern. TR: Der DWB-Workshop für die Flora von Bayern-Kartierer im Herbst soll daher vor allem von SO, Frau Leininger und AH betreut werden. Daneben sollen natürlich WE, Frau Weibulat, Herr Reichert Einführungen geben. Datenübergabevertrag: EW: Datenrechte mit Regionalkoordinatoren besprechen, Treffen von Herrn Meierott im Herbst 2014 angedacht; siehe auch früheres Treffen im Naturkundemuseum Nürnberg. LS: Einverständnis mit der Datenweitergabe an das LfU durch Regnitzflora im Rahmen des Datenankaufs war unproblematisch. Kommunikation am Floristentag: Übergabevertrag in Arbeit.
Allgemeines:
TR: Das Projekt BFL in DWB ist ein auf Langfristigkeit angelegtes Projekt, d. h. wir müssen uns um eine Anschlussfinanzierung kümmern. EW: Alle Projektbeteiligten sollten sich engagieren, das Ehrenamt zu motivieren, eine bessere Beteiligung bei der Wissensgenerierung und des Datenmanagements zu erreichen, und die Ausbildung sowohl in fachwissenschaftlicher als auch in datenkuratorischer Hinsicht zu verbessern. Regionalkoordinatoren und Kartierer müssen geschult werden in allen Bereichen. Protokoll: S. Socher, 13.05.2014