Mehr

Auflösen von Ploygons in QGIS oder Grass in neue Polygone mit definierten Populationsgrößen?

Auflösen von Ploygons in QGIS oder Grass in neue Polygone mit definierten Populationsgrößen?


Ich habe ein Shapefile mit 3800 Polygonen, die die kleinsten Verwaltungsgebiete in Irland darstellen. Viele von ihnen haben in ländlichen Gebieten eine winzige Bevölkerung von weniger als 100 Personen. In städtischen Gebieten hätten alle eine ausreichende Bevölkerung.

Für jedes Gebiet habe ich eine Bevölkerungszahl und verschiedene andere Attribute, die alle intelligent summiert werden können, um gültige Ergebnisse für Gebiete zu erhalten, die durch Kombinieren der kleineren Gebiete erzeugt werden.

Ich muss die Gebiete zusammenführen, um 500 oder 600 Gebiete mit vernünftiger Bevölkerung zu erhalten. Ich muss die größeren (in der Bevölkerung) Gebiete in Ruhe lassen, wo es möglich ist. Am liebsten würde ich das automatisch machen. Dies ist in erster Linie für die Modellanpassung erforderlich.

Ich habe mir hier eine Reihe von Auflösungsfragen angesehen:

  • 'Batch Dissolve Polygons based on Attributes in QGIS or FWTools' Ich denke, ich müsste wissen, welche Bereiche zusammengeführt werden sollen, wenn dies das ist, was ich berechnen muss.
  • 'Praktische Methode zur Verwaltung von Polygonen und deren Vereinigungen' und 'Wie löst man Polygone aus Shapefiles mit Open-Source-Tools auf?' habe das gleiche Problem.

Irgendwelche Vorschläge?


Was Sie versuchen, wird als Zonendesign bezeichnet. Die maßgeblichen Arbeiten zu diesem Thema wurden Ende der 80er und Anfang der 90er Jahre von Stan Openshaw durchgeführt. Siehe die zdes-Homepage, leider wird Ihnen dieser Code wahrscheinlich nicht helfen, da er in AML geschrieben ist und Arc/Info 7 zum Ausführen benötigt. Aber die am Ende der Seite verlinkten Papiere sollten Ihnen helfen, den Algorithmus selbst zu implementieren.

Eine verwandte Methode wurde von Dave Martin von der Southampton University verwendet, um die Ausgabebereiche der britischen Volkszählungen von 2001 und 2011 zu entwickeln, aber ich denke, dieser Algorithmus wurde nie veröffentlicht.


Es sieht so aus, als ob der Vorschlag von @iant genau richtig ist. Southampton hat Software veröffentlicht, die wahrscheinlich genau das tut, was ich tun muss. Details finden Sie unter:- http://www.geodata.soton.ac.uk/software/AZTool/


In GRASS GIS gibt es v.clean mit dem Werkzeug „rmarea: kleine Flächen entfernen, die längste Grenze mit angrenzender Fläche wird entfernt“. Sie können es über das neue Sextante-Plugin verwenden.


Das Auflösungswerkzeug in QGIS verfügt über ein Kontrollkästchen, mit dem Sie das Werkzeug "nur auf ausgewählten Features" ausführen können.

Um die Features auszuwählen, die Sie zusammenführen möchten, führen Sie einfach eine Abfrage für Ihren Layer aus (Layer->Abfrage) und wählen Sie dann die Ergebnisse aus.


Auflösen von Ploygons in QGIS oder Grass in neue Polygone mit definierten Populationsgrößen? - Geografisches Informationssystem

Alle von MDPI veröffentlichten Artikel werden sofort weltweit unter einer Open-Access-Lizenz verfügbar gemacht. Für die Wiederverwendung des gesamten oder eines Teils des von MDPI veröffentlichten Artikels, einschließlich Abbildungen und Tabellen, ist keine besondere Genehmigung erforderlich. Bei Artikeln, die unter einer Open-Access-Creative Common CC BY-Lizenz veröffentlicht wurden, darf jeder Teil des Artikels ohne Genehmigung wiederverwendet werden, sofern der Originalartikel eindeutig zitiert wird.

Feature Papers stellen die fortschrittlichste Forschung mit erheblichem Potenzial für eine große Wirkung auf diesem Gebiet dar. Feature Papers werden auf individuelle Einladung oder Empfehlung der wissenschaftlichen Herausgeber eingereicht und vor der Veröffentlichung einem Peer Review unterzogen.

Das Feature Paper kann entweder ein origineller Forschungsartikel, eine umfangreiche neue Forschungsstudie sein, die oft mehrere Techniken oder Ansätze umfasst, oder ein umfassendes Übersichtspapier mit prägnanten und präzisen Updates zu den neuesten Fortschritten auf diesem Gebiet, das die aufregendsten Fortschritte in der Wissenschaft systematisch überprüft Literatur. Diese Art von Papier gibt einen Ausblick auf zukünftige Forschungsrichtungen oder mögliche Anwendungen.

Editor’s Choice-Artikel basieren auf Empfehlungen der wissenschaftlichen Herausgeber von MDPI-Zeitschriften aus der ganzen Welt. Die Herausgeber wählen eine kleine Anzahl von kürzlich in der Zeitschrift veröffentlichten Artikeln aus, die ihrer Meinung nach für Autoren besonders interessant oder in diesem Bereich wichtig sind. Ziel ist es, eine Momentaufnahme einiger der spannendsten Arbeiten zu geben, die in den verschiedenen Forschungsbereichen der Zeitschrift veröffentlicht wurden.


13.2 Fallbeispiel: Fahrradgeschäfte in Deutschland

Stellen Sie sich vor, Sie gründen eine Fahrradladenkette in Deutschland. Die Stores sollen in urbanen Räumen mit möglichst vielen potenziellen Kunden platziert werden. Darüber hinaus legt eine hypothetische Umfrage (erfunden für dieses Kapitel, nicht für den kommerziellen Gebrauch!) nahe, dass alleinstehende junge Männer (im Alter von 20 bis 40 Jahren) Ihre Produkte am wahrscheinlichsten kaufen: Dies ist die Zielgruppe. Sie sind in der glücklichen Lage, über genügend Kapital zu verfügen, um eine Reihe von Geschäften zu eröffnen. Aber wo sollen sie platziert werden? Beratungsunternehmen (die Geomarketing-Analysten beschäftigen) würden gerne hohe Gebühren für die Beantwortung solcher Fragen verlangen. Glücklicherweise können wir dies mit Hilfe von Open Data und Open Source Software selbst tun. Die folgenden Abschnitte zeigen, wie die in den ersten Kapiteln des Buches erlernten Techniken angewendet werden können, um die folgenden Schritte durchzuführen:

  • Ordnen Sie die Eingabedaten der deutschen Volkszählung (Abschnitt 13.3).
  • Konvertieren Sie die tabellarischen Volkszählungsdaten in Rasterobjekte (Abschnitt 13.4).
  • Identifizieren Sie Ballungsräume mit hoher Bevölkerungsdichte (Abschnitt 13.5).
  • Detaillierte geografische Daten herunterladen (von OpenStreetMap, mit osmdata) für diese Bereiche (Abschnitt 13.6).
  • Erstellen Sie Raster zum Bewerten der relativen Erwünschtheit verschiedener Standorte mithilfe von Kartenalgebra (Abschnitt 13.7).

Obwohl wir diese Schritte auf eine bestimmte Fallstudie angewendet haben, könnten sie auf viele Szenarien des Standorts oder der Bereitstellung öffentlicher Dienstleistungen verallgemeinert werden.


Auflösen von Ploygons in QGIS oder Grass in neue Polygone mit definierten Populationsgrößen? - Geografisches Informationssystem

Fotografie von luftgestützten Plattformen.

Eine Art von Datensuchanweisung, die die Operatoren "and," "or" und "nicht" verwendet. Sie kann zur Auswahl bestimmter Datengruppen verwendet werden, wie z. B. alle Daten, die in einer bestimmten Provinz enthalten sind, oder alle Daten für Frauen im gebärfähigen Alter.

Ein Gebiet, das durch Angeben einer Entfernung von einem Punkt, einer Linie oder einem Polygon auf einer Karte erstellt wurde. Kann verwendet werden, um geografische Merkmale zu identifizieren, die innerhalb oder außerhalb einer bestimmten Entfernung von einem anderen Merkmal vorkommen.

Erstellt Pufferpolygone in einem angegebenen Abstand um die Eingabe-Features. Eine optionale Auflösung kann durchgeführt werden, um überlappende Puffer in einem GIS-System zu entfernen. (Quelle: Environmental Systems Research Institute [ESRI])

Einzugsgebiet ist das Gebiet, aus dem eine Gesundheitseinrichtung Patienten anzieht. Ein einfaches Mittel zur Schätzung eines Einzugsgebiets besteht darin, einen Radius zu definieren, über den Einzelpersonen wahrscheinlich nicht auf die in dieser Einrichtung angebotenen Dienstleistungen zugreifen werden.

Eine Karte, die Farben oder Schattierungen verwendet, um Attributdaten für geografische Gebiete und nicht für Punkte anzuzeigen. Um Werte anzuzeigen, die die Größenunterschiede der geografischen Gebiete berücksichtigen, sollten die Daten zunächst normalisiert werden (z. B. durch Berechnung der Bevölkerungsdichte, z. Choroplethenkarten sind visuell am informativsten, wenn sie zwischen zwei und sieben Datenklassen mit Farben oder Schattierungen anzeigen, die mit steigenden Werten allmählich dunkler werden.

Bei der Datenerhebung durch Demografische und Gesundheitserhebungen (DHS) wird der geografische Standort auf der Grundlage des sogenannten „Clusters“ erfasst. DHS-Cluster sind in der Regel Zensus-Aufzählungsgebiete – manchmal Dörfer in ländlichen Gebieten oder Stadtblöcke in städtischen Gebieten – die die ausgewählten Haushalte enthalten zur Umfrage. Im Zentrum des Siedlungsgebietes des Clusters wird ein einzelner GPS-Standort aufgezeichnet. Das Sammeln von nur einem Punkt für den Cluster verringert die Wahrscheinlichkeit einer Gefährdung der Vertraulichkeit der Befragten erheblich, ist jedoch ausreichend, um die Integration mehrerer Datensätze zur weiteren Analyse zu ermöglichen. (Quelle: MEASURE DHS)

Das Ergebnis, das durch den Schutz von Daten und Informationen erreicht wird, die Einzelpersonen auf eine Weise identifizieren könnten, die Schaden anrichten oder anderweitig mit ihnen getroffene Vereinbarungen verletzen könnte. Weitere Informationen finden Sie in der MEASURE Evaluation-Publikation "Overview of Issues Concerning Confidentiality and Spatial Data": http://www.cpc.unc.edu/measure/resources/publications/wp-08-106 .

Vereinbarung zwischen einer Organisation des öffentlichen Gesundheitswesens und einer Person über den Schutz und die Geheimhaltung personenbezogener Daten.

Ein Koordinatensystem ist ein Referenzsystem, das verwendet wird, um die Standorte von geografischen Merkmalen, Bildern und Beobachtungen wie GPS-Standorten innerhalb eines gemeinsamen geografischen Rahmens darzustellen. (Quelle: ESRI)

CSV (kommagetrennte Werte)

Eine Art von Tabellenkalkulationsdateierweiterung, die häufig von Open-Source-Software verwendet wird. Daten in Zeilen und Spalten können in diesem Format aus Excel exportiert und in QGIS importiert werden.

Nachfrage und Nutzung von Daten zur Verbesserung der evidenzbasierten Entscheidungsfindung für die öffentliche Gesundheit. Aktivitäten zur Förderung der Datennachfrage und -nutzung (DDU) beinhalten einen systematischen Ansatz, der bewährte, wirksame Best Practices und geeignete Instrumente anwendet, um die Nachfrage nach Gesundheitssystemdaten zu erhöhen und sicherzustellen, dass die Informationen in einem evidenzbasierten Entscheidungsprozess verwendet werden. (Quelle: MEASURE-Auswertung)

Ein Data Dictionary ist eine textbasierte Beschreibung von Tabellen und Feldern in einer Datenbank. Es bietet eine solide Grundlage für das Schreiben von Datenbereinigungsprogrammen und eine gemeinsame Sprache zur Erleichterung der Kommunikation zwischen Managern und Analysten. (Quelle: U.S. Centers for Disease Control and Prevention [CDC])

Ein Datenschema ist eine Beschreibung, wie Daten in einer Computerdatenbank in Tabellen und Feldern organisiert sind. Es identifiziert akzeptable Werte für einzelne Felder. Eine gängige Methode zum Erfassen eines Datenschemas ist ein Datenwörterbuch. Ein geeignetes Datenschema stellt sicher, dass die Daten standardisiert und vollständig sind und dass sie zur Erstellung genauer Karten verwendet werden können.

Eine Reihe von Kontrollpunkten, bei denen es sich um Punkte auf der Erdoberfläche mit bekannten Positionen handelt, und ein entsprechendes mathematisches Modell, das verwendet wird, um die Form der Erde anzunähern und die Position eines beliebigen gegebenen Punktes auf dieser Form zu berechnen. Das für das Global Positioning System verwendete Datum ist als World Geodetic System 1984 oder WGS 84 bekannt.

Ein numerisches Format zum Speichern von Breiten- und Längengrad, das den Import von Koordinaten in ein GIS und die Durchführung standortbasierter Berechnungen erleichtert. Ein Vergleich der Breiten- und Längengradformate für den Standort der Bibliothek von Alexandria in Ägypten lautet beispielsweise wie folgt:

Grad, Minuten, Sekunden: 31°12'31.93"N, 29°54'33.62"E

Dezimalgrad: 31.208870, 29.909339

Eine Karte, die Punkte verwendet, um Daten auf einer Karte anzuzeigen. Jeder Punkt steht im Allgemeinen für eine bestimmte Menge eines bestimmten Vorkommens (nicht unbedingt eines), z. B. 10 Personen pro Punkt.

Institut für Umweltsystemforschung (ESRI)

Der führende Anbieter von kommerzieller GIS-Software und -Diensten. Sitz in Redlands, Kalifornien (www.esri.com).

Eine Methode zur Datenklassifizierung, die häufig besser für kontinuierliche Daten funktioniert, d. h. nicht stark verzerrt. Jeder resultierende Wertebereich (Intervall) ist ungefähr gleich, aber es kann eine sehr unterschiedliche Anzahl von Beobachtungen pro Klasse geben. Die Aufmerksamkeit wird stärker auf Ausreißer gerichtet. Die aus dieser Methode der Datenklassifizierung resultierende Karte hebt alle Daten mit besonders hohen oder niedrigen Werten hervor und kann eine ungleichmäßige Farbverteilung aufweisen.

Eine imaginäre Linie, die die Erde umgibt, in gleichem Abstand von den Polen, die null Breitengrade abgrenzt. Der Nullmeridian teilt die Erde in eine nördliche und eine südliche Hemisphäre.

Eine Entfernung, die mithilfe einer geraden Linie berechnet wird, um den Anfangs- und Endpunkt zu verbinden.

Eine Softwareplattform der Microsoft Corporation, die es Benutzern ermöglicht, Daten in Zeilen und Spalten (eine Kalkulationstabelle) zu organisieren und Berechnungen mit den Daten durchzuführen. Es ist Teil von Microsofts berühmtem „Office“-Softwarepaket. Dateien, die mit dieser Software erstellt wurden, haben normalerweise die Namenserweiterung „.xls“ oder „.xlsx“.

Explorative räumliche Datenanalyse

Explorative Geodatenanalyse (ESDA) wendet statistische Werkzeuge zur Auswertung von Geodaten an. Eine grundlegende Technik für ESDA besteht darin, Beobachtungen in einem Histogramm, einem Boxplot und einer Karte zu verknüpfen, um räumliche Muster wie Ausreißer zu erkennen (Quelle: Anselin, 2005). Ein Boxplot ist eine grafische Zusammenfassung der folgenden statistischen Maße: Median, oberes und unteres Quartil sowie minimale und maximale Datenwerte (Quelle: NETMBA). Ein großartiges kostenloses Tool für ESDA ist GeoDa ( http://geodacenter.asu.edu/ ).

Der Prozess der Verwendung eines Algorithmus zum Dekomprimieren einer „gezippten“ Datei, damit sie in einem Programm verwendet werden kann. Dies muss erfolgen, bevor auf eine gezippte Datei vollständig zugegriffen werden kann. Es ist am besten, in einen neuen Ordner zu extrahieren, da mehr als eine Datei zusammengezippt werden kann und sie beim Extrahieren an einem überschaubaren Ort abgelegt werden.

Der Prozess des Speicherns, Benennens und Organisierens von Dateien in einem Computersystem.

Codierte Variablen in einer Tabelle mit geografischen Daten, die die Position entweder an einem Punkt oder in einem Gebiet angeben. Dies können Codes sein, die Breiten-/Längenkoordinaten oder Verwaltungsgebiete angeben. Dies ist eine codierte Version einer geografischen Kennung.

Eine neuere Art der geografischen Datenspeicherung, die Anfang der 2000er Jahre von ESRI erfunden wurde. Eine Geodatabase sieht in Windows wie ein mit vielen Dateien gefüllter Ordner aus und kann daher leicht verschoben oder kopiert werden. Es kann verschiedene Arten von geografischen Datensätzen umfassen, die bestimmten Regeln folgen, was für die Bearbeitung der Daten und die Durchführung erweiterter Analysen nützlich sein kann. Es handelt sich um den derzeit hauptsächlich in ArcGIS verwendeten Datentyp, und sein Inhalt kann mithilfe eines ESRI-Dateiverwaltungssystems namens ArcCatalog erstellt und angezeigt werden.

Geographisches Koordinatensystem (GCS)

Ein Koordinatensystem basierend auf einer dreidimensionalen, kugelförmigen Oberfläche. Aufgrund der Definition in Bezug auf die natürlichere, dreidimensionale Oberfläche eines Globus wird ein GCS eher als "nicht projiziert" denn als "projiziert" betrachtet

Informationen, die den Standort und die Eigenschaften von Dingen beschreiben, einschließlich ihrer Formen und Darstellung. (Quelle: ESRI [ArcGIS-Dokumentation])

Eine geografische Kennung ist eine beliebige Information, die die geografische oder räumliche Position von Merkmalen in der Landschaft angibt, z. B. Breiten- und Längengrad, Straßenadresse oder Name der Verwaltungseinheit (d. Gemeinsame geografische Kennungen spielen eine entscheidende Rolle beim Zusammenführen von Daten aus verschiedenen Quellen.

Geographisches Informationssystem(e) (GIS)

Ein computergestütztes System zum Sammeln, Speichern, Verwalten, Analysieren, Anzeigen und Verteilen geographischer Daten (Punkte, Linien und Polygone mit Bezug auf die Erdoberfläche) und ihrer Attribute (z. B. eindeutige Kennung, Name, Typ, Datum) gesammelt usw.). (Quelle: MEASURE-Auswertung)

Eine grafische Darstellung eines Standorts: z. B. ein Punkt zur Darstellung der Position eines Schornsteins oder ein Polygon zur Darstellung der Position einer Giftfahne.

Geographie ist das Studium der Muster auf der Erdoberfläche und der Ursachen dieser Muster. Die Muster können das Ergebnis von Naturgewalten oder menschlicher Aktivität sein. Dieser Glossareintrag ist eine Synthese von Definitionen aus mehreren Quellen, da viele Definitionen von Geographie Teilbereiche der Geographie betonen und zu eng gefasst sein können. (Quelle: MEASURE-Auswertung)

Einem geografischen Standort zugewiesen.

Globales Positionsbestimmungssystem (GPS)

Satellitenbasiertes System, das ursprünglich vom US-Verteidigungsministerium entwickelt wurde, um sowohl militärischen als auch zivilen Benutzern genaue Positions-, Geschwindigkeits- und Zeitdaten bereitzustellen. Koordinaten werden im Allgemeinen in digitalen Graden relativ zum Äquator und Nullmeridian angegeben.

Ein virtueller Globus von Google (www.google.com). Es verfügt über die größte derzeit verfügbare Nutzerbasis und Satellitenbildbibliothek und kann von http://earth.google.com heruntergeladen werden.

GPS steht für „Global Positioning System“ (siehe separater Eintrag oben). Ein GPS-Empfänger ist ein tragbares Gerät, das Signale von Satelliten, aus denen das GPS besteht, erkennen, damit den Standort des Betrachters auf der Erdoberfläche bestimmen und diese Informationen für die spätere Verwendung speichern kann.

Eine Dateierweiterung, die das GPS-Austauschformat bezeichnet. Dies ist ein spezielles Schema, das von vielen GPS-Geräten verwendet wird, um Wegpunktdaten zu speichern. Diese Dateien können kopiert oder geteilt werden, um eine Reihe von Orten auf der Erdoberfläche zu kennzeichnen. Sie können auch von QGIS gelesen werden.

Informationen zu einem Merkmal auf der Erdoberfläche, die im Feld gesammelt werden. In der Fernerkundung wird der Vorgang des Erfassens von Ground-Truth-Daten als "Ground Truthing" bezeichnet

Gesundheitsmanagement-Informationssystem(e) (HMIS)

Ein geplantes System zur Sammlung, Verarbeitung, Speicherung, Verbreitung und Nutzung gesundheitsbezogener Informationen zur Wahrnehmung von Verwaltungsfunktionen. Es besteht aus Personen, Werkzeugen (papierbasiert und elektronisch) und Verfahren zum Sammeln, Sortieren und Verteilen zeitnaher, genauer Informationen an Entscheidungsträger. (Quelle: Kotler und Keller, 2006)

Ein Histogramm ist eine grafische Zusammenfassung, die die Anzahl der Datenpunkte zeigt, die in verschiedene Bereiche fallen. Es liefert eine grobe Annäherung an die Häufigkeitsverteilung der Daten. (Quelle: NETMBA)

Der IKONOS-Satellit ist ein hochauflösender Satellit, der von GeoEye (www.geoeye.com) betrieben wird.

Bilder oder grafische Darstellungen. Der Begriff wird in der Fernerkundung und GIS verwendet, um digitale Darstellungen der Erdoberfläche zu beschreiben. (Quelle: FWIE)

Eine Karte, die Höhenlinien verwendet, um Änderungen in einer kontinuierlichen Variablen über der Landoberfläche anzuzeigen, z. B. Temperatur, Niederschlag oder Höhe.

Schätzung der Kerneldichte (KDE)

Eine geographische Technik, die diskrete Phänomene über einen kontinuierlichen Raum verteilt, ohne die Zwänge von Verwaltungsgrenzen. Es bietet eine realistischere Darstellung der Verbreitung von Menschen und Dienstleistungen in einer Landschaft. (Quelle: Spencer und Angeles 2007)

KML, das ursprünglich für Keyhole Markup Language stand, ist ein XML-basiertes Dateiformat, das beschreibenden Text, Bildlinks und geographische Informationen zu Punkten, Linien und Polygonen enthalten kann. Es handelt sich um einen offenen Standard, der offiziell als OpenGIS® KML Encoding Standard (OGC KML) bezeichnet wird. KML-Dateien können von Google Earth und mehreren Kartensoftwarepaketen gelesen werden. (Quelle: Open Geospatial)

Was aus der Ferne zu sehen ist, aus Satellitendaten oder Luftbildern. Aktuelle Kartierungstechniken der Landbedeckung wären heute ohne Meilensteine ​​wie James Andersons Veröffentlichung von 1976, A Land Cover Classification System for Use with Remote Sensor Data, nicht möglich. (Quelle: CPC und USGS)

Winkel zwischen einer Linie, die den Erdmittelpunkt mit dem Äquator verbindet, und einer Linie, die den Erdmittelpunkt mit einem Punkt auf der Erdoberfläche auf, nördlich oder südlich des Äquators entlang eines Längengrades verbindet. Der Breitengrad reicht von 0 Grad am Äquator bis 90 Grad an den Polen. Der Breitengrad ist positiv nördlich des Äquators (0 bis 90 Grad) und negativ darunter (0 bis -90 Grad).Linien konstanter Breite können als Kreise visualisiert werden, die horizontal parallel zum Äquator um die Erde gezogen werden.

Winkel zwischen (a) einer Linie, die den Erdmittelpunkt mit dem Äquator an einem Nullmeridian verbindet, wie dem Meridian, der von Pol zu Pol durch Greenwich, England, verläuft (auch bekannt als Nullmeridian oder Greenwich-Meridian) und (b ) eine Linie, die den Erdmittelpunkt mit dem Äquator an seinem Schnittpunkt mit einem Meridian verbindet, der durch den Point of Interest verläuft. Der Längengrad reicht von 0 Grad am Nullmeridian bis 180 Grad entlang des Meridians auf der gegenüberliegenden Seite der Erde. Der 180. Meridian verläuft ungefähr parallel zur Internationalen Datumsgrenze, bei der sich das Datum ändert, wenn Reisende nach Osten oder Westen überqueren. Linien konstanter Länge können als Halbkreise dargestellt werden, die senkrecht von Pol zu Pol auf der Erdoberfläche gezeichnet werden.

Die medizinische Geographie wendet die Disziplin der Geographie auf das Studium der Muster der öffentlichen oder menschlichen Gesundheit an. (Quelle: Meade und Emch, 2010)

Daten über Daten. Metadaten enthalten in der Regel Informationen darüber, wann und von wem ein Datensatz erhoben oder erstellt wurde. Geodaten enthalten auch Informationen zu Projektion und Datum. Manchmal werden Metadaten als Teil der Hauptdatendatei gespeichert, sie können sich aber auch in einer eigenen separaten Datei befinden. Als bewährtes Verfahren sollten Metadaten mit jedem geografischen Datensatz bereitgestellt werden. Internationale Standards für geografische Metadaten sind als ISO 19115 verfügbar.

Zwei oder mehr Bilder gleichzeitig aufgenommen, aber jedes Bild wurde in einem anderen Teil des elektromagnetischen Spektrums aufgenommen. Das elektromagnetische Spektrum ist der gesamte Wellenlängen- oder Frequenzbereich elektromagnetischer Strahlung, der sich von den längsten Radiowellen bis zu den kürzesten bekannten kosmischen Strahlen erstreckt. Ein Teil des elektromagnetischen Spektrums entspricht Licht, das mit bloßem Auge sichtbar ist. (Quelle: CCRS)

Nationale Dateninfrastruktur

Die nationale Dateninfrastruktur besteht aus allen Daten, die den Entscheidungsträgern auf nationaler Ebene zur Verfügung stehen, sowie den Personen, Richtlinien und Systemen, die erforderlich sind, um die Daten zu Entscheidungszwecken zu sammeln, zu speichern, zu verwalten, zu analysieren und zu verbreiten. (Quelle: MEASURE-Auswertung)

Nationale Kartierungsagentur (NMA)

Nationale Organisation, die für die Erstellung und Pflege von Kartenreihen und zugehörigen Daten für ein Land verantwortlich ist. Eine gute Quelle für NMA-Kontakte ist die Website der zweiten Verwaltungsebene der Vereinten Nationen (UN SALB) (www.unsalb.org).

Nationale Geodateninfrastruktur (NSDI)

Die "Technologien, Richtlinien und Personen, die erforderlich sind, um den Austausch von Geodaten auf allen Regierungsebenen, im privaten und gemeinnützigen Sektor sowie in der akademischen Gemeinschaft zu fördern. Ziel dieser Infrastruktur ist es, Doppelarbeit zwischen den Behörden zu reduzieren, die Qualität und Kosten im Zusammenhang mit geografischen Informationen zu verbessern, geografische Daten der Öffentlichkeit besser zugänglich zu machen, den Nutzen der Nutzung verfügbarer Daten zu erhöhen und wichtige Partnerschaften mit [ Stakeholder], um die Datenverfügbarkeit zu erhöhen.“ (Quelle: FGDC)

Eine Methode zur Datenklassifizierung, die Daten Klassen so zuweist, dass die Varianz innerhalb von Klassen minimiert wird, während die Varianz zwischen den Klassen maximiert wird. Der Hauptvorteil dieser Methode besteht darin, dass sie die natürliche Verteilung der Daten berücksichtigt, bevor Beobachtungen Klassen zugeordnet werden. Ein Nachteil ist, dass die Pausen zwischen den Klassen unregelmäßig und daher nicht intuitiv sein können

Eine Methode der geografischen Analyse, die Messungen entlang eines Netzwerks von Einheiten wie Straßen, Eisenbahnen oder Flüssen berechnet. Es kann verwendet werden, um die Zugänglichkeit von Gesundheitsdiensten zu untersuchen.

"Bildelement" ist die Grundfläche, die einem einzelnen Element eines digitalen Bilddatensatzes entspricht. (Quelle: CCRS)

Jede Art von hinzugefügten (oft von Drittanbietern) Funktionen in QGIS. Dies sind kleinere, separate Programme, die verwendet werden können, um die grundlegenden Funktionen von QGIS zu verbessern. Es gibt ein QGIS „Plugin Repository“, in das diese Programme hochgeladen werden können und wo sie von einer Gruppe überprüft werden, die die QGIS-Software selbst verwaltet.

Der Grad, zu dem der Standort eines Benutzers genau bestimmt werden kann. Die Ergebnisse der GPS-Daten können je nach Anordnung der Satelliten über dem Kopf variieren.

Eine imaginäre Linie, die durch Greenwich, England, verläuft und den Nullgrad der Länge abgrenzt. Der Nullmeridian teilt die Erde in eine östliche und eine westliche Hemisphäre.

Projiziertes Koordinatensystem

Ein Koordinatensystem, in dem Orte auf der dreidimensionalen Oberfläche der Erde zur Anzeige, Messung oder anderen Analyse auf eine flache, zweidimensionale Oberfläche transformiert oder "projiziert" werden.

Ein Prozess, bei dem Orte auf der dreidimensionalen Erdoberfläche zur Anzeige, Messung oder anderen Analyse auf eine flache, zweidimensionale Oberfläche transformiert werden. Jede Projektionsmethode wird in irgendeiner Weise letztendlich entweder Entfernung, Richtung oder Form beeinträchtigen, ist jedoch ein notwendiger Schritt, wenn während der räumlichen Analyse geradlinige Entfernungen oder 2D-Flächen (flach) berechnet werden sollen. Eine gängige Projektionsart ist UTM (Universal Transverse Mercator), bei der Entfernungen in Metern gemessen werden können.

Eine Karte, die unterschiedliche Symbolgrößen (oft Kreise) verwendet, um Attributdaten für geografische Gebiete oder Punkte anzuzeigen.

Ein kostenloses Open-Source-Softwareprogramm (FOSS), das geografische Daten lesen und auf einer Karte anzeigen kann. Sowohl Vektor- als auch Rasterdaten können von QGIS gelesen werden. Es ist ein leistungsstarkes, aber benutzerfreundliches Programm mit einem wachsenden Kundenstamm. Es hat viele Funktionen mit dem ArcGIS-Programm von ESRI gemeinsam und eignet sich auch gut für die Analyse räumlicher Daten.

Eine Methode zur Datenklassifizierung, die versucht, jeder Klasse eine gleiche Anzahl von Werten zuzuordnen. Wenn beispielsweise 50 Beobachtungen mit jeweils unterschiedlichen Werten vorliegen, sodass bei der Datenklassifizierung keine Duplikate aufgetreten sind, würde eine Gruppierung in fünf Klassen (auch als Quintile bezeichnet) zu 10 Beobachtungen pro Klasse führen. Quantile sind nützlich, um ordinale Daten (Rangfolge) zu klassifizieren und um Karten mit derselben Anzahl von Klassen zu vergleichen. Ausreißerwerte werden weniger sichtbar und die Aufmerksamkeit wird auf relative Rankings gelenkt. Die aus dieser Methode der Datenklassifizierung resultierende Karte erzeugt tendenziell eine gleichmäßige Verteilung der Kartenfarben. Achtung: Wenn die Daten stark verzerrt sind, ordnet die Quantilklassifizierungsmethode die Daten dennoch in die angegebene Anzahl von Klassen ein. Dieses Zwingen ungleich verteilter Daten in Klassen mit gleicher Anzahl von Beobachtungen könnte den falschen Eindruck erwecken, dass die Daten normalverteilt sind.

Das 1., 2. und 3. Quartil sind das 25., 50. bzw. 75. Perzentil. (Quelle: Statistics.com)

In einem Computer gespeicherte räumliche Daten als eine Reihe von Werten in einem Rastermuster (Pixel). Diese Art von Daten erfordert im Allgemeinen viel mehr Computerspeicherplatz als Vektordaten. Größere Pixelzahlen über einen kleineren Bereich bieten eine größere räumliche Auflösung, benötigen jedoch viel mehr Speicher. Diese Art von Daten kann kontinuierliche Veränderungen über einer Oberfläche zeigen, wie z. B. die Landbedeckung. Satelliten sammeln Daten in diesem Format.

Die Wissenschaft, Technologie und Kunst, Informationen über Objekte oder Phänomene aus der Ferne zu erhalten (d. h. ohne physischen Kontakt mit ihnen zu haben). (Quelle: CCRS)

Die Erde ist zu groß, um auf einer Karte zu zeichnen, ohne ihre Größe zu verringern. Diese Verkleinerung wird als Kartenmaßstab ausgedrückt, der das Verhältnis der Entfernung auf einer Karte zur tatsächlichen Entfernung auf der Erdoberfläche ist. Infolgedessen zeigt eine Karte mit kleinem Maßstab nur wenige Details an, deckt jedoch einen großen geografischen Bereich ab. Eine Karte im großen Maßstab zeigt viele Details, aber für einen kleinen Bereich. Der Maßstab kann grafisch als Maßstabsbalken oder schriftlich unter Verwendung von Text oder numerischen Formen ausgedrückt werden: (i) Text: 1 Zoll = 24.000 Zoll ODER 1 Zoll = 2.000 Fuß oder (ii) Numerisch: 1:24.000.

Ein Geodatenformat, das ursprünglich von ESRI entwickelt wurde und heute weit verbreitet ist. Ein Shapefile ist eigentlich eine Sammlung von mindestens drei Dateien: (i) Hauptdatei (Dateiname.shp), die auf Datensatz-für-Datensatz-Basis geometrische Informationen für die interessierenden Merkmale enthält. (ii) Indexdatei (Dateiname.shx), die den Positionsversatz jedes Datensatzes in der Hauptdatei vom Anfang der Hauptdatei angibt. (iii) dBASE-Datei (Dateiname.dbf), die eine Tabelle mit Attributdaten für jedes in der Hauptdatei beschriebene geometrische Merkmal enthält. Ein Shapefile kann auch eine Projektionsdatei (Dateiname.prj) enthalten, um das Koordinatensystem und das Datum anzugeben. Obwohl eine Projektionsdatei in Bezug auf die technische Spezifikation des Shapefiles optional ist, ist sie für eine genaue geografische Analyse unerlässlich.

Daten, die die geografische Form und Position von Einheiten in Bezug auf den von der Erdoberfläche definierten physischen Raum beschreiben. Hinsichtlich der Form können räumliche Daten die Form von Punkten, Linien oder Polygonen annehmen. In Bezug auf den Standort werden räumliche Daten nach Koordinatensystemen und Datumsangaben organisiert und angezeigt.

Eindeutige geografische Kennung

Ein Name oder Code, der eine geografische Einheit eindeutig identifiziert. Beispiele hierfür sind der Name einer Provinz oder eines Distrikts für eine Wegpunkt-ID einer Verwaltungsregion und eine Kombination aus Breitengrad/Längengrad für einen GPS-Punkt-P-Code (Ortscode) des Büros der Vereinten Nationen für die Koordinierung humanitärer Angelegenheiten (UN OCHA). Eindeutige geografische Kennungen sind unerlässlich, um zwischen einzelnen geografischen Einheiten zu unterscheiden und die Genauigkeit der Attributdaten für diese Einheiten sicherzustellen, da nicht eindeutige Kennungen in allen Phasen der Datennutzung zu Verwirrung und Fehlern führen können. (Quelle: MEASURE-Auswertung)

Die am weitesten verbreitete Standard-Hardwareverbindung zum Anschließen externer Geräte wie Festplatten, Flash-Laufwerke, Kameras oder Telefone an einen Computer.

In einem Computer gespeicherte räumliche Daten als Punkte, Linien und Polygone. Bei einer geraden Linie werden die Koordinaten eines Punktes, die Entfernung und Richtung zu einem zweiten Punkt sowie die Koordinaten des zweiten Punktes gespeichert. Dies ist normalerweise die effektivste Methode zur Speicherung von Geodaten.

Eine 3D-Darstellung der Erde, die die Möglichkeit bietet, in einer Vielzahl von Maßstäben hinein- und herauszuzoomen und den Blickwinkel zu ändern. Virtuelle Globen kombinieren oft Satellitenbilder, die in unterschiedlichen Detailstufen gesammelt wurden, mit tatsächlicher Luft- oder sogar Straßenfotografie. Sie ermöglichen oft auch zusätzliche Überlagerungen wie Punkte, Karten oder Bilder.

Ein einzelner Punkt auf der Erdoberfläche, angegeben mit einem x/y-Koordinatenpaar. Diese Punkte können auf einer GPS-Empfängereinheit gespeichert werden.

XML, die Abkürzung für eXtensible Markup Language, ist ein einfaches, flexibles Textformat, das beim Datenaustausch im Web eine immer wichtigere Rolle spielt. (Quelle: w3)

Der Prozess des Komprimierens einer Datei (oder einer Gruppe von Dateien) unter Verwendung eines Algorithmus, um Daten effizienter zu speichern. Eine „gezippte“ Datei ist im Allgemeinen kleiner als eine entpackte und bietet eine gute Möglichkeit, Dateien in einem Paket zu gruppieren, um sie an einen Kollegen zu senden.


2. Materialien und Methoden

2.1 Auswahl von Untersuchungsgebieten und Waldübergangstheorie

Bei der Auswahl der Untersuchungsgebiete haben wir uns zum Ziel gesetzt, drei Länder einzubeziehen, die hinsichtlich ihrer FZ- und Entwaldungsraten, aber auch unter Berücksichtigung ihrer biophysikalischen, geografischen, sozioökonomischen und demografischen Bedingungen eine möglichst große pantropische Variabilität berücksichtigten. Ein Schlüsselfaktor für diesen Auswahlprozess war die Situation jedes Landes innerhalb der Waldübergangskurve [20] auf nationaler Ebene (siehe S1 Abb.). Auf dieser Grundlage haben wir die drei folgenden Länder ausgewählt:

  1. Sambia ist ein Binnenplateau im südlichen Zentralafrika, das sich 2010 noch in der Vor-/Frühphase des Waldübergangs [11] mit einer hohen FC (65,4%) und moderaten Entwaldungsraten (-0,3% · yr .) befand -1 ) [41]. Sambia hat eine relativ niedrige Bevölkerungsdichte, Lebenserwartung bei der Geburt, BIP pro Kopf und HDI [42–44]. Laut Global Forest Watch sind die Entwaldungsraten in Sambia in den letzten zehn Jahren deutlich gestiegen und beschleunigt [1]. Während das Land im Zeitraum 2001-2009 850 kha Baumbedeckung mit einer Baumkronengröße von mehr als 10 % verlor, hat sich dieser Verlust im Zeitraum 2010-2018 auf 1,96 Mha mehr als verdoppelt. Diese beschleunigte Entwaldung könnte darauf hindeuten, dass Sambia bereits in seinen frühen Übergang eingetreten ist und seine Gesamt-FZ 2015 auf 62 % reduziert hat [45]. Nach Curtis et al. [12], der größte Teil dieser Entwaldung war auf die Verlagerung der Landwirtschaft zurückzuführen. Andere identifizierte relevante Treiber der Entwaldung (und Degradation) in Sambia sind Bergbau und Infrastrukturentwicklung, Holzgewinnung, Holzkohleproduktion und Waldbrände [46].
  2. Ecuador ist ein Hotspot der Mega-Vielfalt, der die Anden und das Amazonasbecken auf der pazifischen Seite des nordwestlichen Südamerikas schützt. Ecuador hat die FZ auf etwa 50 % reduziert, aber die Entwaldung wird seit Ende der 90er Jahre mit relativ hohen Raten (-0,6 % · Jahr -1 ) fortgesetzt [41,47]. Der Waldkontext im Land kann somit ein klares Beispiel für ein „Grenzgebiet“ sein ([17]). Ecuador hat mit einem Anteil von 63 % der städtischen Bevölkerung die doppelte Bevölkerungsdichte von Sambia und ein relativ hohes BIP und HDI [42–44]. Der Hauptgrund für die Entwaldung in Ecuador ist erneut die Verlagerung der Landwirtschaft [12], zusammen mit der kleinbäuerlichen Viehzucht und, auf lokalere Weise, der Rohstoffproduktion wie Palmöl [48].
  3. Die Philippinen sind ein Archipel in Südostasien, das aus über 7.000 Inseln besteht. Dieses Land soll zwischen 1990 und 2015 einen Netto-FZ-Zuwachs von 0,8% · Jahr -1 erreicht haben, wobei 2015 weniger als 30% der FZ übrig blieben [41]. Die Philippinen sind sehr dicht besiedelt, weisen die höchste Straßendichte unter den drei Ländern und einen Anteil von 41 % der landwirtschaftlichen Nutzfläche auf [42–44]. Laut Global Forest Watch und Curtis et al. [1,12] ist der Verlust von Baumbedeckung auf den Philippinen hauptsächlich rohstoffbedingt und steht im Zusammenhang mit der Expansion der Landwirtschaft. Forstwirtschaft und Urbanisierung spielen bei der Entwaldung ebenfalls eine größere Rolle als in Sambia und Ecuador. Die Waldsituation auf den Philippinen ist somit auf nationaler Ebene ein Beispiel für ein klares „forst-agricultural Mosaik“ bzw.

2.2 Beobachtungseinheiten und Analyseebenen

Wir haben jedes der ausgewählten Länder in drei verschachtelte räumliche Analyseebenen (Makro-, Meso- und Mikroebene) unterteilt, die sich auf ihre hierarchische rechtliche Verwaltungsstruktur beziehen (Abb. 1). Jede dieser drei Analyseebenen entspricht einem bestehenden de jure Governance-Struktur mit vergleichbaren Kompetenzen in Bezug auf die Gestaltung und Umsetzung der Forstpolitik in den drei Ländern [49,50].

Die Länder werden im gleichen Maßstab mit proportionalen Größen angezeigt.

Für Sambia umfassen 9 Provinzen die Makroebene und 71 Distrikte die Mesoebene. Wir haben die georeferenzierten Daten für beide Ebenen aus der GADM-Datenbank heruntergeladen [51]. Die dritte Ebene (Mikro-) stellt Annäherungen von 1.358 Gemeinde- und Wahlkreisgrenzen dar, basierend auf gedruckten Informationen der Wahlkommission von Sambia (ECZ), für die eine von Eubank (2014) [52] erstellte Polygondatei verwendet wurde. Die wichtigste Institution für die Bewirtschaftung der Waldressourcen in Sambia ist die Forstabteilung des Ministeriums für Land, natürliche Ressourcen und Umweltschutz (MLNREP). Sambia erlebt einen nationalen Dezentralisierungsprozess, der darauf abzielt, die Macht und Verpflichtungen der Distrikte (Meso-Ebene) zu erhöhen, um die Qualität der Leistungserbringung auf subnationaler Ebene zu verbessern [53–56]. In dieser Hinsicht haben sich in den letzten zehn Jahren einige Änderungen bezüglich des nationalen Rechtsrahmens für den Forstsektor ergeben, wie die Einbeziehung lokaler Forstvorschriften und anderer Formen der lokalen Waldbewirtschaftung: z.B. Joint Forest Management (JFM) oder Community Forestry [57–60].

Im Falle Ecuadors sind die für die Makroebene gewählten Verwaltungseinheiten die 24 Provinzen plus die drei nicht abgegrenzten Zonen als eine einzige Einheit. Die Mesoebene umfasst 224 Landkreise und die Mikroebene 1.024 Gemeinden. Wir haben die Daten zu diesen Grenzen aus der Datenbank des National Institute of Statistics and Census [51,61] heruntergeladen. Obwohl die wichtigsten Maßnahmen zur Forstpolitik und -bewirtschaftung in Ecuador im Wesentlichen auf nationaler Ebene vom Umweltministerium (MAE) geplant und koordiniert werden [62], sind diese drei Ebenen der territorialen Organisation (Provinzen, Landkreise, Gemeinden), deren gesetzgeberisch-politische Rolle in der aktuellen ecuadorianischen Verfassung [63] und dem Organic Code of Territorial Organization, Autonomy and Dezentralisierung [64] anerkannt ist, aktiv an der Umsetzung von MAEs-Politiken oder anderen Waldbewirtschaftungsprogrammen im Einklang mit den nationalen Gesetzen teilnehmen.

Für die Philippinen umfassen die drei Analyseebenen der Gerichtsbarkeit 17 Regionen (Makroebene), 81 Provinzen (Mesoebene) und 1.652 Gemeinden (Mikroebene). Die geographischen Datensätze wurden der GADM-Datenbank [51] entnommen und basieren auf offiziellen Grenzen der NAMRIA (National Mapping and Resource Information Authority), die beim Philippine Geoportal System [65] erworben werden können. Auf nationaler Ebene ist das Forest Management Bureau (FMB), das zum Department of Environment and Natural Resources (DENR) gehört, die wichtigste Regierungsbehörde, die sich mit der Planung der Forstwirtschaft auf den Philippinen befasst. DENR hat Büros in allen Verwaltungsregionen (Makroebene) und einige Büros, die in den meisten Provinzen (PENROs, auf Mesoebene) und in einigen Städten oder Gemeinden (CENROs, auf Mikroebene) tätig sind [66,67 ].

2.3 Variablenauswahl: Aufbau einer räumlichen Datenbank

Wir haben eine Geodatenbank mit Unterstützung von Geographic Information System (GIS) Software und Tools aufgebaut: QGIS 3.4. [68]. Diese Geodatenbank (siehe S1-Datei) umfasste die heruntergeladenen räumlich expliziten Grenzen für die drei Gerichtsbarkeitsebenen in den drei Ländern. In den nächsten Schritten haben wir für jede dieser Einheiten und Analyseebenen die Informationen über FC und relevante Treiber der Abholzung und Wiederaufforstung (Antwort und erklärende Variablen) aufgenommen, wie in den folgenden Unterkapiteln beschrieben.

2.3.1 Antwortvariable: Waldbedeckung (FC).

Wir haben die FZ-Informationen für jede Verwaltungseinheit (drei Länder und drei Ebenen) aus der aktuellsten nationalen Landbedeckungskarte extrahiert, die zum Zeitpunkt der Durchführung dieser Studie verfügbar war [47,69,70] (Tabelle 1). Daher führten wir eine Querschnittsanalyse durch, die davon ausging, dass Muster der FZ-Entwicklung von der zeitlichen Skala losgelöst werden können, da sie von der sozioökonomischen Entwicklung abhängig sind [20,21,71]. Nationale Landbedeckungskarten boten im Gegensatz zu globalen Datensätzen wie [1,72,73] Vorteile wie höhere Auflösung und Genauigkeit für die interessierenden Regionen unter Berücksichtigung der besonderen Landbedeckungsmerkmale jedes tropischen Kontexts.

Daher haben wir die Wald- und Landbedeckungsdefinitionen nachklassifiziert und harmonisiert, indem wir vorhandene Baum- und FZ-Klassen in nur drei Hauptarten der Landbedeckung zusammengefasst haben: Waldfläche (FA), potenzielle Waldvegetationsfläche (FApot) und nicht potenzielle Waldvegetationsfläche (Nicht-FApot). Wir erhielten die abhängige Variable FC, indem wir die Waldfläche (FA) als Bruchteil der potentiellen Waldfläche einer Einheit (FApot) normalisierten (Tabelle 2). Die FZ ist daher ein Anteil der gesamten Waldfläche jeder Gerichtsbarkeitseinheit auf ihrer potenziell bewaldeten Fläche und nicht auf ihrer Gesamtfläche. Das in dieser Studie interpretierte Konzept der potenziell bewaldeten Fläche zielt darauf ab, die maximal erreichbare Waldfläche in einem begrenzten Zeitraum abzuschätzen, ähnlich dem Ansatz von Köthke et al. (2013) [26]. Wir haben dies berechnet, indem wir alle relevanten Vegetationsarten der Landbedeckung aggregiert haben, während Klassen, die nicht für Waldvegetation geeignet sind, folglich ausgeschlossen wurden (z. B. Gewässer, Gletscher oder kahlen Flächen). Bebaute und künstliche Infrastrukturen wurden ebenfalls nicht in dieses Aggregat einbezogen, da davon ausgegangen wird, dass in städtischen Gebieten eine schnelle Landbedeckungsdynamik eher unwahrscheinlich ist [74,75]. Dadurch kann der Bereich für die abhängige Variable zwischen 0 und 100 % variieren.

2.3.2 Erklärende Variablen: Treiber der Veränderung der Waldbedeckung.

Wir wählten sieben erklärende Variablen aus, die Elemente im Zusammenhang mit physio-geografischen, demografischen und sozioökonomischen Aspekten enthielten, von denen wir erwarteten, dass sie die FZ beeinflussen (Tabelle 2). Diese Variablen wurden von früheren Autoren oft als überwiegend einflussreich und einheitlich in tropischen Ländern identifiziert und diskutiert (siehe beispielsweise [10,13]).

Wir haben den Einfluss der Gesamtfläche (AKNIRPS), da unterschiedliche Größen von Verwaltungseinheiten unterschiedlichen Flächendruck, politischen Prozessen sowie Handels- und Kooperationsmöglichkeiten unterliegen können [26]. Wir haben die Gesamtausdehnung jeder Verwaltungseinheit aus den räumlichen Grenzen extrahiert, die zur Definition der Analyseeinheiten der Studie verwendet wurden. Wir haben jede Berechnung von Flächen oder Neigungsgraden (siehe Parameter FL) durchgeführt, nachdem die räumlichen Quelldateien erneut in das entsprechende projizierte Koordinatensystem von Universal Transverse Mercator (UTM) konvertiert wurden. Wir haben die UTM-Zonen 35S, 17S und 51N für Sambia, Ecuador bzw. die Philippinen verwendet.

Die potenzielle Vegetationsfläche (PVA) beschreibt den Anteil der potenziell bewaldeten Fläche (FATOPF) bezogen auf die Gesamtfläche (AKNIRPS) der analysierten Verwaltungseinheit. Die PVA kann von 0 bis 100 % reichen und hohe Werte bedeuten ein Potenzial für eine größere Waldfläche in der Einheit, aber nicht unbedingt deren Existenz [26]. Zum Beispiel würde eine große Region im Amazonas mit einem großen Teil ihres Flächenanteils von einheimischen Wäldern einen hohen PVA-Wert einnehmen. Gleichzeitig würde eine kleinere Region in einer ländlichen Provinz, die vor Jahrhunderten abgeholzt wurde und heute hauptsächlich Weide- und Ackerland umfasst, auch in der PVA einen hohen Stellenwert einnehmen. Daher, und da FC in dieser Studie als Anteil am PVA definiert ist, wird erwartet, dass hohe PVA-Werte FC verringern. Einheiten mit hohem PVA werden im Allgemeinen mehr Möglichkeiten haben, produktive Standorte für landwirtschaftliche Flächen zu errichten, und es wird erwartet, dass sie innerhalb der Grenzen der Region einen erhöhten Bedarf für die Nahrungsmittelproduktion haben werden.

Ein wesentlicher Treiber der Entwaldung ist die Rolle der Bevölkerungsdichte und der demografischen Entwicklung [13,87,88]. Wir gehen davon aus, dass eine höhere Bevölkerungsdichte zu einer höheren Nachfrage nach Land und Ressourcen führt, wobei verwandte Phänomene direkten Druck auf den Wald selbst ausüben, wie z.B. landwirtschaftliche Expansion und Wanderfeldbau, Errichtung von Siedlungen, Straßen und anderen Infrastrukturen, Brennholzsammlung und Rohstoffgewinnung. Wir haben die Gesamtbevölkerung (PKNIRPS) für jede Verwaltungseinheit durch Extrahieren der zugehörigen demografischen Daten von worldpop.org.uk [76–79]. Wir taten dies für das Jahr, das der entsprechenden Landbedeckungskarte jedes Landes am nächsten kam (Tabelle 2). Wir berechneten die Dichte (Druck) auf der verbleibenden Gesamtwaldfläche (PPFA) durch Division der Gesamtbevölkerung durch die Waldfläche (FA).

Ähnlich wie der Bevölkerungsdruck werden auch Indikatoren für die Erreichbarkeit wie Straßendichte oder Straßenentfernung als Maß für Umweltbelastung und wirtschaftliche Entwicklung verwendet [89–92]. Das Vorhandensein von Straßen kann zu einer Reihe von Belastungen für Wälder und die natürliche Umwelt im Allgemeinen beitragen [13] und daher erwarten wir, dass eine hohe Straßendichte die FZ wahrscheinlich negativ beeinflusst. Wir haben die Gesamtstraßenlänge heruntergeladen und berechnet (RKNIRPS) in jeder bewerteten Gerichtsbarkeitseinheit (einschließlich Autobahnen, Straßen, Wege und Eisenbahnen) von openstreetmap.org und geofabrik.de [80]. Die Gesamtstraßenlänge in km (RKNIRPS) wurde durch die Gesamtfläche (AKNIRPS) der jeweiligen Verwaltungseinheit (in km 2 ), um die Straßendichte (RD) zu berechnen.

Die Neigung bei einer Auflösung von 90 m wurde aus der 4.1-Version des SRTM DEM (Shuttle Radar Topographic Mission Digital Elevation Model) berechnet, das von der NASA (National Aeronautics and Space Administration) und CGIAR (Consultative Group for International Agricultural Research) erstellt wurde [81]. Für jede analysierte Verwaltungseinheit haben wir die Gesamtfläche unterhalb von 16 % Steigung (FLKNIRPS) durch seine Gesamtfläche (AKNIRPS), wodurch ein Ebenheitsindikator erzeugt wird: FL. Wir wählten Land mit einer Steilheit von weniger als 16% basierend auf der FAO-Definition von nicht (0–8%) oder leicht (8–16%) eingeschränktem regengespeisten Land ([82]). Wir gehen daher davon aus, dass Regionen mit einem höheren Flachheitsanteil besser für die Rodung neuer landwirtschaftlicher Flächen geeignet sind, eine geringere FZ aufweisen [13]. Je nach spezifischer physio-geographischer Bedingung werden auch länder- und niveauübergreifende Unterschiede erwartet.

Wir haben den CSI (Crop Suitability Index) aus den FGGD-Daten (Food Insecurity, Poverty and Environment Global GIS Database) der FAO in Bezug auf die "Eignung der derzeit verfügbaren Landfläche für Regenpflanzen unter Verwendung eines maximierten Pflanzen- und Technologiemixes" geschätzt [82,83] . Dieses Dataset ist ein globaler Raster-Layer, der Werte zwischen 0 (nicht geeignet) und 100 (sehr hoher CSI) anzeigt. Klassen wie interne Gewässer, städtischer, geschlossener Wald, Schutzgebiete oder bewässertes Land haben wir den Wert Null (keine Kulturpflanzeneignung) gegeben. Dies betraf einige spezifische Gebiete wie die Galapagos, den abgelegenen Amazonaswald oder die Metropole Manila auf den Philippinen. Da die Pixelauflösung ziemlich grob war (1/12 Grad) – insbesondere wenn man die Größe einiger Einheiten aus der kleinsten Gerichtsbarkeitsebene betrachtet – haben wir für jede Analyseeinheit den flächengewichteten Mittelwert der Pixelwerte berechnet, die sich innerhalb der Grenzen befinden. CSI stellt das landwirtschaftliche Potenzial des Landes dar und dürfte sich daher negativ auf die FZ auswirken [13].

Schließlich drückt der Getreideflächenertrag (CY) den tatsächlich erzielten Ertrag zu einem Zeitpunkt oder Zeitraum aus. Der CY soll im Laufe der Zeit zunehmen, kurzfristig schwanken und sich in einer Phase hoher Intensivierung möglicherweise sättigen. Der Getreideflächenertrag einer Region ist ein Indikator für die landwirtschaftliche Produktivität und Intensivierung [93,94]. Wir gehen daher davon aus, dass der Druck auf den FC verringert wird. Wir haben zwei Hauptgetreidekategorien ausgewählt, die die wichtigsten Kulturpflanzen in den drei ausgewählten Ländern darstellen, nämlich Mais und Reis. Für fünf der zwölf analysierten Proben erhielten wir zwischen 1987 und 2015 Daten zu den aggregierten Flächenerträgen der Mais- und Reisklassen (MY, RY in Tonnen/ha) aus offiziellen nationalen Quellen [84–86]. Für beide Getreidearten betrachteten wir das arithmetische Mittel der letzten 10 Jahre vor der Erzeugung der jeweiligen Landbedeckung. Wir haben die berechneten Mittelwerte in Kalorienerträge (kcal/ha) umgerechnet, indem wir die allgemeinen Umrechnungsfaktoren von Cassidy et al. (2013) [95]. Für die Verwaltungseinheiten mit Informationen sowohl für Mais als auch für Reis wurde der höchste Kalorienertrag berücksichtigt, unter der Annahme, dass diese Kulturart eher in der jeweiligen Region vorkommt.

2.4 Räumliche ökonometrische Modellierung

Wir führten die räumliche ökonometrische Analyse mit Unterstützung der Statistiksoftware JMP ® 13.1.0 und R 3.5.2 [96,97] und der spdep [98,99], rgdal [100], sp [101], rgeos [102] und RANN [103] Pakete. Das Endprodukt und die für die Analyse verwendeten Dateien (S1-Datei) sowie das zugehörige R-Skript (S2-Datei) finden Sie in den Online-Anhängen dieses Artikels. Wir haben insgesamt zwölf Stichproben definiert: neun Stichproben zeigen die Kombinationen der drei Länder und der drei räumlichen Analyseebenen und drei Stichproben die aggregierten Daten (pantropisch) aller Länder auf den drei räumlichen Ebenen.

Wir haben eine sigmoidale Beziehung zwischen den Treibern der Entwaldung und der abhängigen Variablen angenommen, in Anlehnung an die Ergebnisse anderer Autoren [26,88,104,105]. Diese Beziehung stellt ein Modell der FC-Abnahme mit einer invertierten Wachstumsfunktion dar, die sich 1 als horizontale Asymptote auf der linken Seite und 0 auf der rechten Seite nähert (ähnlich dem in S1 Abb. gezeigten Diagramm). Anschließend musste die abhängige Variable durch logistische Transformation linearisiert werden, um lineare Regressionstechniken zu ermöglichen, und die erklärenden Variablen wurden mit einer Logarithmusfunktion transformiert: (Gl. 1) (Gl. 2) wobei: * bezieht sich auf linearisiert oder transformiert S ist die Probe und x ist ein Vektor der sieben erklärenden Variablen v.

Die Proben mit fehlenden, nicht linearisierbaren Extrem- oder Nullwerten – bei FC, PVA, CSI oder RD – wurden verworfen. Diese bestand im Allgemeinen aus Mikro- oder Meso-Einheiten aus entweder (a) Metropolen ohne registrierte FZ (hauptsächlich einige große urbane Zentren in Copperbelt und Lusaka in Sambia, dicht besiedelte Städte auf den Philippinen und eine kleine Anzahl von Siedlungen der ariden Anden, Quito oder Guayaquil in Ecuador) oder (b) abgelegene Gebiete mit fast keiner menschlichen Präsenz (wie die Galapagos in Ecuador oder die Schildkröteninseln auf den Philippinen). Dies implizierte den Ausschluss von insgesamt 3,92% der Makroeinheiten, 3,99 % der Mesoeinheiten und 24,67% der Mikroeinheiten aus der Originalstichprobe.

Für jede der zwölf Stichproben wurden die bereitgestellten erklärenden Variablen wie folgt einzeln standardisiert, um später ihren relativen Beitrag zum Modell zu vergleichen oder zu schätzen: (Gl. 3) wobei: x ^ v,S ist die standardisierte erklärende Variable v für probe S μ(X * v,S) stellt den Mittelwert in der Probe dar S für die transformierte erklärende Variable v und (X * v,S) ist die Standardabweichung der transformierten erklärenden Variablen v in Probe S.

In einem nächsten Schritt testeten wir die Kollinearität zwischen den sieben erklärenden Variablen für jede Stichprobe. Variablen mit bivariaten Korrelationswerten von mindestens 0,6 wurden als hochkorrelierte Prädiktoren angesehen. Wir führten einfache lineare Regressionen für jede der unabhängigen Variablen durch. Die stark korrelierten Variablen mit den niedrigeren Bestimmtheitsmaßen in ihren jeweiligen linearen Regressionen wurden nicht in die weiteren Berechnungen einbezogen, da sie redundante Informationen lieferten. Dann identifizierten wir die signifikanten erklärenden Variablen pro Stichprobe unter Verwendung des nicht-räumlichen OLS-Modells nach einer automatisierten schrittweisen Rückwärtseliminationsmethode mit dem kleinsten Bayes-Informationskriterium als Stoppregel. Daher wird das OLS-Modell für die multivariate Analyse wie folgt ausgedrückt: (Gl. 4) wobei β sind die jeweiligen Koeffizienten und ε ist der Rest.

Als nächstes entwickelten wir eine räumliche Gewichtungsmatrix (W) für jede der zwölf Proben. Um Modellmängel und eine falsche Anwendung der räumlichen Ökonometrie zu vermeiden [106–108], sollte diese Matrix die Interaktion räumlicher Einheiten und ihren Konnektivitätsgrad widerspiegeln. Für die zwölf Stichproben unserer Studie haben wir eine graphenbasierte – Einflusssphäre (SOI) – Nachbarschaftsmatrix betrachtet (Abb. 2). Eine SOI-Matrix funktioniert „basierend auf euklidischen Abständen zwischen Polygonschwerpunkten, wobei Punkte Nachbarn sind, wenn sich Kreise, die auf den Punkten zentriert sind, mit einem Radius gleich den nächsten Nachbarabständen der Punkte an zwei Stellen schneiden“ [98,109].

a) Sambia b) Ecuador und c) Philippinen.

Wir untersuchten die Ergebnisse jeder OLS-Analyse [98], um die räumliche Abhängigkeit der Modellresiduen zu überprüfen, indem wir sowohl den Moran-Test [110] als auch die räumlichen Beziehungen mit der Lagrange-Multiplikator-Diagnose für Lag- und Fehlermodelle [33,111,112] durchführten. Wir taten dies, um räumliche Autokorrelationen aufzudecken und die Verwendung der vorgeschlagenen ökonometrischen Modelle zu rechtfertigen. Damit wollten wir die räumlichen Verteilungen von Fehlern/Variablen nicht explizit für jeden Kontext oder jede Skala untersuchen oder diskutieren, sondern vielmehr die Existenz räumlicher Abhängigkeiten zwischen den verschiedenen Stichproben (unterschiedliche Kontexte/Skalen) aufzeigen und begründen die Verwendung unserer räumlichen ökonometrischen Modelle.

Um als nächstes das am besten geeignete Regressionsmodell für jede Stichprobe auszuwählen, haben wir die LeSage- und Pace-Methode [32,36] für die lokale Modellspezifikation angewendet. Daher haben wir Likelihood-Ratio-(LHR)-Tests durchgeführt, um das räumliche Modell auszuwählen, das jede der zwölf Stichproben besser erklärt. Diese Methode versucht zu demonstrieren, ob ein Spatial Durbin Error Model (SDEM) auf ein einfacheres verschachteltes Modell beschränkt werden kann, z OLS-Modell:

Räumliches Durbin-Fehlermodell (SDEM): (Gl. 5) wenn θ = 0, (6) ergibt das räumliche Fehlermodell (SEM): (Gl. 6) wenn λ = 0, (6) ergibt räumlich verzögertes X-Modell (SLX): (Gl. 7) wenn beide θ = 0 und λ = 0, (6) ergibt das OLS-Modell: (Gl. 8) wobei: WS,n repräsentiert das zeilenstandardisierte Gewicht des Nachbarn n für eine bestimmte Probe s θv,S sind die Auswirkungen der Nachbarn auf eine bestimmte Variable v und Probe S ln X ^ v,S,n repräsentiert die Werte der Nachbarn für eine bestimmte Variable und Stichprobe WS,nduS repräsentiert den gewichteten räumlichen Restfehler.

Daher ordneten wir jeder Stichprobe ein optimales Regressionsmodell zu, das entweder Nachbareinwirkungen (SLX-Modell), räumlich korrelierte Fehler (SEM-Modell), beide räumliche Effekte (SDEM-Modell) oder keinen von ihnen (OLS-Modell) berücksichtigen könnte. Abb. 3 fasst den analytischen Rahmen dieses Forschungsartikels in Form eines konzeptionellen Diagramms zusammen. Diese Grafik fasst auch zusammen, wie sich die räumlichen Wechselwirkungen und die verschiedenen vorgeschlagenen Modelle in der Spezifikationsmethode aufeinander beziehen.

Um die Spezifikationsmethode zu rechtfertigen, haben wir schließlich verschiedene Leistungsindikatoren oder globale Maßnahmen sowohl für das OLS als auch für die angegebenen räumlichen Modelle quantifiziert und verglichen. Zuerst betrachteten wir die (1) Akaike- und (2) Bayes'schen Informationskriterien (AIC, BIC). Dies sind beides Schätzer der relativen Qualität statistischer Modelle, wobei niedrigere Werte eine bessere Anpassungsgüte anzeigen. Wir berechneten auch (3) unverzerrte Maximum-Likelihood-Schätzer der Fehlervarianz und (4) Standardfehler der Regression. Diese beiden anderen Maße schätzen die Anpassungsgüte in Prozent, und sie neigen dazu, abzunehmen (annähernd Null), wenn die Qualität der Regression zunimmt. Schließlich berechneten wir (5) angepasste Bestimmtheitskoeffizienten (die den Prozentsatz der Varianz der abhängigen Variablen angeben, die durch das Modell erklärt werden) und (6) Log-Likelihoods mit Maximum-Likelihood-Schätzern für die Regressionskoeffizienten. Diese beiden letzten Parameter nehmen mit verbesserter Modellqualität zu. Alle diese Maße wurden nach den von [113] vorgeschlagenen Formeln und Definitionen berechnet.


Bonus: Trajektoriendatenserialisierung

Zusammen mit mobilitydb-sqlalchemy habe ich kürzlich auch Trajektorien-Serialisierungs-/Kompressionsbibliotheken veröffentlicht, die auf dem Encoded Polyline Format Algorithm von Google für Python und Javascript namens trajectory bzw. trajectory.js basieren. Mit diesen Bibliotheken können Sie Flugbahndaten in einem komprimierten Format senden, was zu geringeren Nutzlasten führt, wenn Ihre Daten durch menschenlesbare Serialisierungsformate wie JSON gesendet werden. Bei einigen der internen APIs, die wir bei Adonmo verwenden, haben wir festgestellt, dass dies unsere Antwortgrößen um mehr als die Hälfte (>50%) reduziert hat, manchmal bis zu 90%.

Möchten Sie mehr über mobilitydb-sqlalchemy erfahren? Sehen Sie sich die Schnellstart- und Amp-Dokumentation an.


4. DISKUSSION

Durch eine Kombination aus Langzeitüberwachung und Fernerkundung des Lebensraums von Seegras, Telemetrie von Pflanzenfressern und Feldversuchen mit Käfighaltung fanden wir starke Beweise dafür, dass die Beweidung von Blättern der Grünen Schildkröte die Rate und die räumliche Ausdehnung von invasivem Seegras erhöhen kann H. stipulacea Expansion in der Karibik. Indirekte Auswirkungen der Beweidung auf Arteninvasionen (d. h. scheinbare Konkurrenz) wurden an anderer Stelle berücksichtigt (Enge, Nylund & Pavia, 2013 Orrock, Baskett & Holt, 2010). Diese frühere Arbeit konzentrierte sich hauptsächlich auf kleine Mesograzer. Unsere Arbeit legt daher nahe, dass auch große Pflanzenfresser die Ausbreitung invasiver Arten auslösen können, indem sie einheimische Arten unterdrücken, die zwar schmackhafter, aber wettbewerbsfähiger sind. Große Pflanzenfresser spielen eine wichtige, aber noch weitgehend unerkannte Rolle bei der Invasion aquatischer Ökosysteme, jedoch wird eine angemessene Berücksichtigung ihrer Auswirkungen immer wichtiger (Bakker et al., 2015), insbesondere mit dem erwarteten globalen Wandel bei Arteninvasionen und großen Weiderpopulationen ( B. trophische Herabstufung, Estes et al., 2011 marine Defaunation, McCauley et a., 2015). Unsere Ergebnisse liefern wichtige Erkenntnisse über den Grad der Koexistenz von einheimischem Seegras mit invasivem Seegras und zeigen, dass große Pflanzenfresser eine wichtige Rolle bei der Ausbreitung der invasiven Arten spielen können.

Vor dieser Studie wurde die invasive Seegrasexpansion mit vielen Faktoren in Verbindung gebracht, jedoch nicht mit der Beweidung. Es wurde berichtet, dass die Expansionsraten aufgrund der hohen Produktivität hoch sind (Smulders et al., 2017) und bevorzugt an geschützteren (Steiner & Willette, 2015) und euthrophiten Standorten (van Tussenbroek et al., 2016) auftreten. Viele andere Faktoren können eine Rolle spielen, darunter eine hohe Lebensfähigkeit der Fragmente (>2 Wochen Smulders et al., 2017), eine potenziell hohe Ausbreitungsdistanz der Samen durch Megaherbivoren (<650 km wie bei Halophila spp. Samen in Australien Tol et al., 2017) und der Einfluss von Störungen auf die Fragmentdichte (Weiden verwurzelt Fragmente Smulders et al., 2017). Bislang ist die Samenverbreitung jedoch möglicherweise nicht signifikant, da in der Karibik nur sterile (Willette et al., 2014) oder männliche Pflanzen (Vera, Collado-Vides, Moreno & Tussenbroek, 2014) gefunden wurden. Die schnelle Expansion von H. stipulacea ist kein lokales Phänomen (Willette et al., 2014). Daher ist eine kombinierte Bewertung der vielfältigen Mechanismen und Parametrisierung dieser Faktoren erforderlich, um die zukünftige Ausbreitung dieser Art in der Karibik zu modellieren.

Ein auffallendes Ergebnis war, dass seit 2010, dem Jahr der Einführung des nicht heimischen Seegrases H. stipulacea, die scharfe Grenze von beweideten und nicht beweideten einheimischen Seegrasflecken verlagerte sich in flachere Gebiete.Diese Gebiete enthielten einheimische Seegrasarten, die zuvor nicht beweidet worden waren, und umfassten eine Fläche von 65 Hektar. Die Weidegrenze war aufgrund von Satellitenbildern bis ins Jahr 1970, auch während der Zunahme der Schildkrötenpopulation in den letzten Jahrzehnten, zuvor stabil geblieben. Als das Nahrungsangebot (heimisches Seegras) in anderen Bereichen der Bucht noch hoch war, grasten Schildkröten nicht in den flachen Tiefen dieser Wiesen, vermutlich weil grüne Schildkröten Schwierigkeiten haben, in geringer Tiefe neutralen Auftrieb zu erreichen (Hays, Metcalfe & Walne , 2004). Angesichts der zunehmenden intraspezifischen Konkurrenz um Ressourcen an unserem Studienstandort und angesichts ihrer starken Präferenz für das rückläufige einheimische Seegras gehen wir davon aus, dass Meeresschildkröten über diese Grenze hinaus weiden und ihre Nahrungsgebiete in flache Regionen der Bucht ausdehnten, was zu mehr Platz für die Ansiedlung und Verbreitung von eingeführten Seegrasarten.

Die interaktiven Effekte zwischen Megaherbivoren und invasivem Seegras können die Koexistenz von Seegrasarten und den Artenwettbewerb beeinflussen. Es wird beschrieben, dass Grüne Schildkröten eine Vorliebe für die Nahrungssuche für Seegrasarten mit der höchsten Schmackhaftigkeit und dem höchsten Nährstoffgehalt haben (Bjorndal, 1997), die Eigenschaften schnell wachsender Arten (wie z H. wrightii) gegenüber langsamer wachsenden Arten (wie T. testudinum Christianen, 2013). Das invasive H. stipulacea scheint eine Ausnahme von dieser Regel zu sein. Obwohl es sich um eine schnell wachsende Art handelt, ist der relative Stickstoffgehalt von H. stipulacea (ein Proxy für die Schmackhaftigkeit oder den Nährwert) und der Zuckergehalt ist fast doppelt so niedrig wie bei den langsamer wachsenden einheimischen Arten. Zusammen mit den gemeldeten Weidepräferenzen kann der niedrige Stickstoffgehalt der Blätter helfen zu erklären, warum Grüne Schildkröten die Invasion zu begrenzen scheinen H. stipulacea bisher als Nahrungsquelle. Unsere Ergebnisse folgen der „Feind-Freisetzungs-Hypothese“ (ERH), bei der „invasive Arten viel dominanter werden können, wenn sie Weidetieren entkommen, die nicht angepasst sind, nicht-heimische Arten zu fressen“ (Keane & Crawley, 2002). Daher kann die Weidevorliebe von Schildkröten für nährstoffreichere einheimische Arten die invasive Seegrasexpansion erleichtern.

Obwohl die Nahrungspräferenzen von Pflanzenfressern informativ sind, können sich diese Präferenzen im Laufe der Zeit ändern (Trowbridge, 1995), was sowohl von Pflanzen als auch von Weidetieren induziert wird. Pflanzen können rechtzeitig reagieren, indem sie mehr chemische Abschreckungsmittel zuweisen (Wikstrom, Steinarsdottir, Kautsky & Pavia, 2006). Da bei Seegras nur wenige chemische Abschreckungsmittel beobachtet wurden (Olsen et al., 2016 ), wird erwartet, dass ihr Einfluss auf sich ändernde Präferenzen begrenzt ist. Die Nahrungspräferenzen und das Nahrungssucheverhalten von Schildkröten können sich auch in Zukunft ändern, da an unserem Studienstandort in Bonaire große Veränderungen der Seegrasbedeckung von einheimischen (-20% Bedeckung in 6 Jahren) und invasiven Seegrasarten (+14% Bedeckung) beobachtet wurden. Dies kann zu geringeren Begegnungsraten zwischen Pflanzen und Pflanzenfressern führen (Parker & Hay, 2005 ), was Schildkröten schließlich dazu zwingt, auf nicht-heimische Nahrungsquellen umzusteigen oder in alternative Nahrungsgebiete abzuwandern.

Obwohl H. stipulacea bereits oft als invasiv angesehen wurde, liefern wir erstmals Belege für den Ersatz einheimischer Seegrasarten durch eine invasive Seegrasart, einschließlich einer mechanistischen Erklärung für diese Invasivität. Zusammengenommen unterstützen unsere Ergebnisse die Kennzeichnung H. stipulacea als invasive Art in den karibischen Raum. Im Gegensatz zu früheren Berichten, die nur dichte invasive Seegrasmatten bei hohen Nährstoffkonzentrationen in der Umwelt fanden (van Tussenbroek et al., 2016), fanden wir auch dichte H. stipulacea Matten in nichtneutrophierten Bereichen. Zusammen mit unseren Ergebnissen zu den Auswirkungen von Schildkröten zeigt dies, dass die „Invasivität“ dieser Art nicht nur durch abiotische Umweltbedingungen getrieben wird (z. B. van Tussenbroek et al., 2016). Unsere Experimente und Beobachtungen zeigten eindeutig, dass das invasive Seegras an diesem Standort dem einheimischen wettbewerbsfähig unterlegen ist, wie die begrenzte Ausdehnung in unbeweideten Parzellen zeigt, und erfordert Beweidung oder andere Störungen, um sich zu etablieren und auszubreiten. Die Zeitreihendaten zeigen auch, dass der Eindringling im Einklang mit der Beweidung durch Raum und Zeit vordringt (Abbildungen 1b und 5). Unter ungestörten Bedingungen und über längere Zeiträume ist es jedoch weniger klar, ob H. stipulacea können einheimische Seegrasarten aktiv vertreiben. Bisher flachwurzelnd invasiv H. stipulacea wurde nur berichtet, dass er flachwurzelnd schnell verdrängt S. filiforme und H. decipiens in der Karibik (Steiner & Willette, 2015 Willette & Ambrose, 2009, 2012 Willette et al., 2014). Hier berichten wir, dass invasive Seegrasmatten tiefer verwurzelte ersetzen T. testudinum. Dies kann potenziell die Ökosystemleistungen der Seegraswiese beeinträchtigen. Beispielsweise kann eine Abnahme der Wurzelbiomasse zu einer verminderten Kohlenstoffbindung (Marba et al., 2015) und einer verminderten Stabilisierung des Meeresbodens bei Stürmen und damit zu einem verminderten Küstenschutz führen (Christianen et al., 2013 Vonk, Christianen, Stapel, & O'Brien, 2015).

Die Invasion dieses nicht-einheimischen Seegrases kann nicht nur wichtige Konsequenzen für die Tragfähigkeit von Seegraswiesen für die Populationen der Grünen Schildkröte haben, sondern auch für die Gesundheit und die Wachstumsraten der Grünen Schildkröte. Bei der anhaltenden Verbreitung invasiver Seegräser und dem Ersatz von nahrhafterem einheimischem Seegras durch invasives Seegras benötigen Schildkröten möglicherweise eine größere Futterfläche dieser Nahrungsquelle geringerer Qualität, um ihren täglichen Nährstoffbedarf zu decken. Dies gilt nur, wenn die Fläche des Nahrungshabitats für Seegras begrenzt ist und alternative Nahrungsgründe schwer zu finden sind. Seegraswiesen gehen rasch verloren (Waycott et al., 2009), insbesondere in den stark entwickelten Küstengebieten der Karibik (van Tussenbroek et al., 2016). Wenn sich Schildkröten nicht an die neue Artenzusammensetzung anpassen können, indem sie ihre Strategie zur Nahrungssuche anpassen, könnte dies letztendlich zu insgesamt geringeren Wachstumsraten der Schildkröten (Bjorndal et al., 2017) und der Gesundheit in der Karibikregion führen. Unsere Forschung unterstreicht die Notwendigkeit, angemessene und geeignete Nahrungs- und Bruthabitate zu berücksichtigen, wenn versucht wird, Meeresschildkröten zu erhalten oder zu schützen.


Diskussion

Rasterbasierte Bevölkerungsstichprobenverfahren stehen noch am Anfang. Es wurden verschiedene Ansätze zur Auswahl von Proben in der ersten Phase und zur Feldforschung ausprobiert. Diese Ansätze sind vielversprechend, haben jedoch Grenzen und bedürfen weiterer Forschung. Das Rasterprobe Der R-Algorithmus bietet ein Werkzeug zur Entwicklung und Bewertung neuer gerasterter Populationsstichprobenverfahren.

Problem mit veränderbaren Flächeneinheiten

Die gerasterte Bevölkerungsstichprobe reagiert empfindlich auf das Problem der modifizierbaren Flächeneinheiten (MAUP). Ein MAUP entsteht, wenn eine beliebige räumliche Einheit, wie z Einheiten [60]. Bei gerasterten Bevölkerungsstichproben beeinflussen die Größe und Zone der Rasterzellen wahrscheinlich die Wahrscheinlichkeit des Einschlusses der Stichprobe, insbesondere wenn die Stichprobe der ersten Stufe auf geografisch großen Rasterzellen basiert und/oder die Bevölkerung heterogen verteilt ist.

Vier allgemeine Ansätze für die Stichprobenziehung der ersten Stufe mit gerasterten Bevölkerungsdaten sind in Abb. 5 skizziert. Zunächst umfasst der Segmentierungsansatz die Stichprobenziehung von geografisch großen PSUs mit einer Wahrscheinlichkeit proportional zur geschätzten Bevölkerungsgröße, dann die Segmentierung durch kleinere Gitterzellen [10] oder die manuelle Abgrenzung kleinerer Gebiete mit Satellitenbildern [6,7,8,9,10]. Rasterprobe kann verwendet werden, um große Zellen auszuwählen, indem das eingegebene gerasterte Populations-Dataset aggregiert wird. In Myanmar aggregierten Muñoz und Langeraar (2013) LandScan 1 km × 1 km gerasterte Bevölkerungsschätzungen zu 3 km × 3 km „Super“-Zellen für die Auswahl der Stichprobe der ersten Stufe. Dann gruppierten sie 1 km × 1 km große Rasterzellen innerhalb der ausgewählten PSUs, um einen Mindestbevölkerungsschwellenwert zu erreichen, und nahmen dann in jeder PSU zufällig eine Gruppe von Zellen als sekundäre Stichprobeneinheit (SSU). Schließlich segmentierten sie SSUs anhand von Satellitenbildern manuell in Dutzende von Gebieten mit ungefähr gleicher Bevölkerungszahl und nahmen Stichproben aus einem Segment [10]. Infolgedessen waren die Stichprobengewichte rechnerisch einfach zu berechnen, da sie einem typischen mehrstufigen Stichprobenansatz folgten. Darüber hinaus wiesen die endgültigen Stichprobeneinheiten sinnvolle Grenzen in Bezug auf Merkmale in der realen Welt auf, wodurch Feldarbeiten möglich wurden. Allerdings waren die Stichprobenaufnahmewahrscheinlichkeiten von PSUs und SSUs abhängig von der Größe und Zone der Rasterzellen, die je nach Verteilung der zugrunde liegenden Population eine geglättete oder betonte Populationsdichte aufweisen könnten.

Wahrscheinlichkeitsstichprobenansätze mit gerasterten Bevölkerungsdaten

Ein Punktansatz wurde von Thomson und Kollegen (2012) unter Verwendung von LandScan 1 km × 1 km gerasterten Bevölkerungsdaten in der östlichen DR Kongo verwendet. Für diese Umfrage generierte das Team zufällig angeordnete Punkte innerhalb von Rasterzellen, bei denen die Anzahl der Punkte proportional zur geschätzten Bevölkerung war. Dann wurden nach dem Zufallsprinzip Punkte innerhalb der Schichten abgetastet. Schließlich grenzten sie mithilfe von Satellitenbildern manuell Stichprobeneinheiten um die nächstgelegenen Wohngebäude zu jedem Punkt ab, um sicherzustellen, dass sich die Grenzen der Netzteile innerhalb der Zellengrenzen befanden [6]. Die Stichprobengewichte wurden angepasst, um einem typischen mehrstufigen Stichprobenansatz zu folgen, die endgültigen Grenzen der Stichprobeneinheiten waren sinnvoll, was die Feldarbeit möglich machte, und die Verwendung von Punkten verhinderte jegliche Auswirkungen des MAUP. Allerdings war die manuelle Abgrenzung einer Stichprobeneinheit um jeden Punkt einer menschlichen Voreingenommenheit unterworfen.

Der dritte Ansatz für gerasterte Bevölkerungsstichproben ist der Wachstumsansatz, der einzigartig in der Rasterprobe Werkzeug. Elseyet al. [7] in Kathmandu, Nepal verwendete eine frühe Version von Rasterprobe um Samenzellen aus dem 100 m × 100 m großen Populationsdatensatz von WorldPop auszuwählen und PSUs auf eine minimale Populationsgröße zu züchten. Wachsende PSUs reagieren wahrscheinlich weniger empfindlich auf die Zonen- und Maßstabs-MAUPs als die Segmentierung großer Zellen, da beim Wachstumsansatz der Maßstab der Startgitterzellen in Bezug auf die geografische Größe und die Populationsgröße näher an der endgültigen Stichprobeneinheit liegt. Die korrekte Berechnung der Wahrscheinlichkeitsgewichte für den Stichprobeneinschluss für den Wachstumsansatz ist jedoch unklar. Sollten Stichprobenwahrscheinlichkeitsgewichte aus den Rasterzellendichten oder den Dichten der endgültigen Stichprobeneinheiten berechnet werden? Für beide Ansätze lassen sich Argumente anführen. Bevor wir zwei mögliche Berechnungen der Stichprobengewichtung für den Wachstumsansatz diskutieren, beschreiben wir einen hypothetischen, aber machbaren vierten Ansatz für die gerasterte Bevölkerungsstichprobe.

Der vielleicht idealste gerasterte Populationsstichprobenrahmen würde Gitterzellen vor der ersten Probenahme in „vernünftige“ potenzielle PSUs ähnlicher Populationsgröße gruppieren. Sinnvolle PSU-Grenzen würden in Bezug auf geografische Merkmale wie Straßen, Flüsse, Kämme oder Täler definiert, die im Feld leicht erkannt und navigiert werden könnten. Vernünftige PSUs würden auch ähnliche Bevölkerungstypen gruppieren, beispielsweise nach dem durchschnittlichen Armutsniveau der Rasterzellen. Die Generierung eines sinnvollen Rasters für die Bevölkerungsstichprobe ist erst seit kurzem möglich, da neue Techniken entwickelt werden, um Bevölkerungsmerkmale, wie Armutsniveau oder Krankheitsstatus, in einem Rasterpopulationsformat zu schätzen [54, 61]. Der Einsatz von Quadtree-Methoden zur Aufteilung dichter Populationsgitterquadrate in vier kleinere Zellen kann als rudimentärer erster Schritt zur Entwicklung sinnvoller potenzieller PSUs angesehen werden [62]. Wenn ein gerasterter Bevölkerungsstichprobenrahmen mit sinnvollen potenziellen PSUs vorhanden wäre, würde der Erhebungsfachmann Stichproben mit einer Wahrscheinlichkeit proportional zur geschätzten Größe durchführen und typische Stichprobeneinschlusswahrscheinlichkeitsgewichte berechnen.

Der Wachstumsansatz für gerasterte Bevölkerungsstichproben kann als ein Fall eines vernünftigen Rahmens konzeptualisiert werden, in dem nur die Grenzen der beprobten PSUs bekannt sind und die Grenzen der nicht in die Stichprobe einbezogenen potenziellen PSUs existieren, aber nicht gezogen werden. Aus den endgültigen PSU-Populationsdichten berechnete Stichprobengewichte sind einfach zu berechnen und werden unten angegeben.

Wenn jedoch die Einschlusswahrscheinlichkeiten des Wachstumsansatzes aus den Populationsdichten der Rasterzellen (und nicht der endgültigen PSU) berechnet werden müssen, muss ein komplexes adaptives Stichprobengewicht formuliert werden [63]. Ein adaptives Stichprobengewicht würde die geschätzte Population einer gegebenen Zelle sowie die Wahrscheinlichkeit berücksichtigen, über eine benachbarte Zelle zu einer PSU herangewachsen zu sein. Die Wahrscheinlichkeit, zu einer PSU herangewachsen zu sein, würde abhängen von (a) den geschätzten Populationen benachbarter Zellen, (b) dem Parameter für die maximale geographische Größe der PSU, (c) dem Parameter für die minimale Populationsgröße der PSU und möglicherweise (d) dem Standort von Schichtgrenzen und (e) die Lage der Voronoi-Polygongrenzen zwischen Saatzellen in einer Vielzahl von Stichprobeninstanzen. Die Notwendigkeit einer solch komplexen Formulierung muss bewertet werden, geht jedoch über den Rahmen dieses Papiers hinaus.

Probengewichte

Im Folgenden stellen wir Beispielgewichtsberechnungen für den Wachstumsansatz für die Auswahl von Netzteilen zur Verfügung, der einzigartig in verfügbar ist Rasterprobe. Diese Gewichtungen spiegeln die Einschlusswahrscheinlichkeiten in den endgültigen PSUs und nicht der einzelnen Gitterzellen wider. Stichprobengewichte für die Segmentierungs-, Punkt- und sinnvollen PSU-Ansätze wurden an anderer Stelle beschrieben und sind in Zusatzdatei 1 zusammengefasst. und (3) antwortete [13,14,15,16]. Während Rasterprobe Das Ausgabe-Shapefile enthält Werte, die zum Berechnen der PSU-Auswahlwahrscheinlichkeiten erforderlich sind, der Umfrageimplementierer muss die Anzahl der im Feld in jeder PSU aufgezählten Haushalte und die Antwortquoten der Haushalte verfolgen, um die Stichprobengewichtungen korrekt zu berechnen. Die folgenden Formeln verwenden vier Indizes: 1…k Schichten, 1…ich Netzteile, 1…J Haushalte und 1…Q Einzelpersonen. Das Haushaltsauswahlgewicht (Basisgewicht) für den Wachstumsansatz zur Bildung von PSU – die Wahrscheinlichkeit, dass PSU ich ausgewählt ist, und dann Haushalt J wird ausgewählt – wird gegeben durch:

wo (n_) ist die Anzahl der ausgewählten Netzteileinheiten im Stratum k, (G_) ist die geschätzte Gesamtbevölkerung in Stratum k, (g_) ist die geschätzte Population in PSU ich in Schicht k, (m_) ist die Anzahl der Haushalte in PSU ich und Schicht k während der Feldarbeit und (M_) ist die Gesamtzahl der Haushalte in PSU ich und Schicht k während der Feldarbeit.

Wenn Wachstums-PSUs manuell geteilt und weiter beprobt werden, werden die Gewichtungen auf die gleiche Weise berechnet, außer dass die Wahrscheinlichkeit, in der endgültigen Stichprobeneinheit zu sein (w_) enthält (b_) , der Anteil der Haushalte im manuell gezeichneten Segment, angenähert durch Zählen von Gebäuden in Satellitenbildern:

Das Antwortgewicht des Haushalts – die Wahrscheinlichkeit, dass PSU ich gefunden und beprobt wird, und Haushalt J gefunden und beantwortet wird – ist gegeben durch:

wo (n_) Anzahl ausgewählter Netzteile in Stratum k, (n_ *) ist die Anzahl der gefundenen und untersuchten PSUs in Stratum k, (m_) ist die Anzahl der ausgewählten Haushalte in PSU ich und Schicht k, und M_ *) ist die Anzahl der gefundenen und beantworteten Haushalte in PSU ich und Schicht k. Das individuelle Antwortgewicht – die Wahrscheinlichkeit, dass PSU ich gefunden und beprobt, dann Haushalt J gefunden wird und antwortet, und schließlich dieses Individuum Q ist anwesend und antwortet – wird gegeben durch:

wo (n_) ist die Anzahl der ausgewählten Netzteileinheiten im Stratum k, (n_ *) ist die Anzahl der gefundenen und untersuchten PSUs in Stratum k, (m_) ist die Anzahl der ausgewählten Haushalte in PSU ich und Schicht k, (m_ *) ist die Anzahl der gefundenen und beantworteten Haushalte in PSU ich und Schicht k, und du_) ist die Anzahl der berechtigten Personen im Haushalt J im Netzteil ich und Schicht k, und du_ *) ist die Anzahl der geantworteten Personen im Haushalt J im Netzteil ich und Schicht k. Das Gewicht der Haushaltsstichprobe (w_) setzt sich aus dem Haushaltsauswahlgewicht und dem Haushaltsantwortgewicht zusammen:

Unter der Annahme, dass alle in Frage kommenden Personen (z. B. alle Frauen im Alter von 15–49 Jahren) in den ausgewählten Haushalten befragt werden, beträgt das individuelle Stichprobengewicht (w_) setzt sich aus dem Haushaltsauswahlgewicht und dem individuellen Antwortgewicht zusammen:

Feldarbeit

Für die Feldforschung stehen vier Ansätze zur Verfügung mit Gittermuster Ausgang. Diese vier Ansätze sind in Abb. 6 visualisiert und im Folgenden beschrieben.

Schema der vier Feldimplementierungsoptionen für die gerasterte Bevölkerungsstichprobe

Gegitterte Netzteile

Diese Option verwendet gerasterte Netzteilgrenzen mit eckigen Ecken und ohne Bezug zu geografischen oder administrativen Merkmalen in der realen Welt. Dieser Ansatz wurde in einer zweistufigen Cluster-Befragung von Haushalten in Kathmandu, Nepal verwendet [7]. Das Team nutzte OpenStreetMap™, eine Crowdsourcing-Online-Karte von Straßen, Gebäudestandorten und anderen Funktionen, über eine Android-Anwendung auf Mobiltelefonen, um Haushalte innerhalb von Netzteilen digital abzubilden. Die OpenStreetMap™-Aufzählung wurde dem typischen Stift-und-Papier-Mapping vorgezogen, zum Teil, weil die Hälfte ihrer Netzteile bereits in OpenStreetMap™ abgebildet war. Haushalte (definiert als eine Gruppe von Personen, die sich einen Kochtopf teilen) wurden vollständig gezählt, indem an Türen geklopft und mit Nachbarn gesprochen wurde, um sicherzustellen, dass Haushalte mit niedrigem Einkommen, die eine Wohnung teilten, nicht unterbewertet wurden. Das Team stellte teilweise erhebliche Unterschiede in der Anzahl der Haushalte pro Netzteil fest, als im WorldPop-Stichprobenrahmen erwartet worden war. Daher planten sie, jeden 10. Haushalt unabhängig von der Größe der Netzteile zu befragen, um eine Wahrscheinlichkeitsstichprobe zu erhalten. Als Gründe für die Verwendung dieses Ansatzes nannte das Team die geografische Genauigkeit in Feldkarten, die Durchführbarkeit der Kartierung in dichten, komplexen städtischen Umgebungen, die Nutzung vorhandener Daten und die Fähigkeit, zu einer Crowdsourcing-Ressource beizutragen [7].

Wir unterstützen die Verwendung der OpenStreetMap™-Aufzählung, insbesondere für städtische Umgebungen, in denen wahrscheinlich OpenStreetMap™-Daten vorhanden sind. Wir empfehlen den Implementierern jedoch dringend, eine Methode zur Anonymisierung von Gebäuden zu verwenden, die der Crowdsourcing-Karte hinzugefügt wurden, sodass befragte PSUs nicht identifiziert werden können. In Gebieten, in denen Gebäude bereits in OpenStreetMap™ kartiert wurden, werden durch geringfügige Änderungen keine Netzteilstandorte angezeigt. In Bereichen der Karte ohne Gebäude- und Straßenstandorte sollten Implementierer jedoch eine Kartierung über die Ränder der PSU-Grenzen hinaus in Betracht ziehen, damit gerasterte PSU-Formen nicht auf eine gerasterte Haushaltserhebung hindeuten. Wenn OpenStreetMap™-Daten in der Umfrageregion spärlich sind, sollten die Implementierer darüber hinaus erwägen, eine Reihe von gefälschten PSUs aufzuzählen, um die Anonymität der befragten Communities zu wahren. Spezifische Richtlinien für die OpenStreetMap™-Aufzählung sind noch nicht verfügbar.

Manuell gezeichnete Netzteile

Ein zweiter Ansatz zur Implementierung von gerasterten Bevölkerungsstichproben besteht darin, PSUs manuell um zufällige Punkte innerhalb von Saatzellen zu ziehen oder gerasterte Stichprobeneinheiten manuell unter Verwendung detaillierter Satellitenbilder zu segmentieren. Manuell gezogene PSUs wurden in einer einstufigen Clustererhebung im Osten der D. R. Kongo [6] und einer zweistufigen Clustererhebung in Myanmar [10] verwendet. Ein wesentlicher Vorteil dieses Ansatzes besteht darin, dass Netzteile sinnvollen Grenzen wie Flüssen und Straßen folgen, die sowohl auf Satellitenbildern als auch im Feld leicht zu erkennen sind. Da manuell gezeichnete Netzteile leicht identifizierbar sind, können Außendienstteams flexibel handgezeichnete Stift- und Papierkarten, gedruckte Karten mit Satellitenbildern oder OpenStreetMap™-Funktionen oder digitale Karten für die Feldnavigation und Haushaltszählung verwenden.

Nicht-Wahrscheinlichkeitsproben

Random-Walk- und „Spin-the-pen“-Stichprobenverfahren führen zu Nicht-Wahrscheinlichkeitsstichproben der Bevölkerung und werden daher von Gutachtern nicht empfohlen [64, 56, 66]. Nichtsdestotrotz werden diese und ähnliche Methoden häufig in schnellen oder hochsicheren Feldbewertungen verwendet, da sie billiger und schneller zu implementieren sind als typische zweistufige Clusterproben. Random-Walk- und Spin-the-Pen-Gridded-Sampling-Methoden wurden bei Schnellbewertungen im Irak [8] und in Myanmar [11] verwendet. In beiden Studien wurden gerasterte Populationsdatensätze als genauere Stichprobenrahmen angesehen als andere verfügbare Populationsdaten. Da Random-Walk- und Spin-the-Pen-Methoden nicht zu Wahrscheinlichkeitsstichproben führen, stellen wir keine Stichprobenwahrscheinlichkeitsgewichtungen zur Verfügung.

Einfache Zufallsstichprobe von Haushalten

Forscher führen manchmal einfache Zufallsstichproben von Haushalten in kleinen Untersuchungsgebieten – zum Beispiel einem Flüchtlingslager oder einer einzelnen Stadt – durch, indem sie Wohnortstandorte in einem Satellitenbild digitalisieren und Stichprobenpunkte nach dem Zufallsprinzip auswählen [67,68,69,70,71]. Eine einfache Zufallsstichprobe von Haushalten wurde zwar nicht mit einer gerasterten Bevölkerungsstichprobe durchgeführt, wäre aber einfach zu implementieren. Gitterzellen würden mit einer Wahrscheinlichkeit proportional zur geschätzten Größe abgetastet, und der Wachstumsalgorithmus könnte optional abgeschaltet werden, um Einzelzellen-PSUs zu erzeugen. Dann würde eine einzelne Wohnung innerhalb ausgewählter Zellen zufällig ausgewählt, entweder durch Kartierung aller Wohnungen oder mit einer Methode, wie sie von Galway und Kollegen im Irak beschrieben wurde [8]. In der Irak-Studie überlagerte das Team ein 10 m × 10 m großes Mini-Grid auf Google Earth™-Satellitenbildern innerhalb der Seed-Zelle und wählte dann zufällig eine Mini-Grid-Einheit aus. Wenn die 10 m Mini-Grid-Einheit ein Gebäude bedeckte, wurde das Gebäude für die Stichprobenauswahl ausgewählt, andernfalls wurde der Vorgang wiederholt, bis das erste Gebäude zufällig in den Bildern identifiziert wurde. Wenn das zufällig ausgewählte Gebäude mehrere Haushalte hatte oder kein Wohngebäude war, konnte ein benachbarter Haushalt zufällig ausgewählt werden, wie von Siri und Kollegen in Kenia beschrieben [66]. Eine einfache Zufallsstichprobe von Haushalten würde keine Stichprobengewichte erfordern.

Einschränkungen

In Ländern, in denen die Volkszählungsdaten veraltet oder ungenau sind, werden gerasterte Bevölkerungsdaten zunehmend als alternativer Stichprobenrahmen für Erhebungen verwendet. Anstelle von Volkszählungsdaten können auch gerasterte Bevölkerungsstichprobenrahmen für Erhebungen verwendet werden, die sowohl für die Bevölkerung als auch für den Weltraum repräsentativ sein müssen und bei denen PSUs einer bestimmten Bevölkerungsgröße benötigt werden. Als nächstes besprechen wir sechs Bereiche, in denen Forschung im Gange ist oder benötigt wird, um die Grenzen der gerasterten Bevölkerungsstichprobe anzugehen.

Genauigkeit des gerasterten Populationsstichprobenrahmens

Das erste Hauptproblem bei der Stichprobenziehung der Bevölkerung im Raster ist die Genauigkeit der zugrunde liegenden gerasterten Bevölkerungsdaten. Rasterbasierte Bevölkerungsstichproben wurden von einer Reihe von Umfrageteilnehmern unter Umständen veralteter oder ungenauer Volkszählungsdaten versucht, jedoch ist die Genauigkeit von gerasterten Bevölkerungsdatensätzen unterschiedlich und oft nicht quantifiziert. Die Genauigkeit öffentlich verfügbarer Top-Down-Grid-Bevölkerungsdaten hängt von mehreren Modellkomponenten ab: (1) Genauigkeit der Eingabe-Volkszählungsdaten, (2) geografischer Maßstab der Eingabe-Volkszählungsdaten (z. (3) Alter, Genauigkeit und Typ der Modellkovariatendaten und (4) der Modellalgorithmus selbst. Der geografische Maßstab des Ausgabegitters ist auch für die Messung der Genauigkeit von Bedeutung. Gitterzellenschätzungen in einem gerasterten Bevölkerungsdatensatz von 1 km × 1 km sind fast immer genauer als Gitterzellen in einem gerasterten Bevölkerungsdatensatz von 100 m × 100 m. Modellfehler sind für gerasterte Bevölkerungsdatensätze, die auf einfachen Disaggregationsansätzen beruhen, schwer abzuschätzen und sogar zu konzeptualisieren, da es sich im Wesentlichen um gerasterte Darstellungen der eingegebenen Volkszählungsdaten handelt [24]. Während Vorhersagefehler für gerasterte Populationsdatensätze berechnet werden können, die aus komplexen Modellierungstechniken abgeleitet wurden, ist WorldPop der einzige Datensatz, der Fehler enthält [siehe beispielsweise 56]. Es ist jedoch unklar, wie Umfrageimplementierer Vorhersagefehler verwenden können, um die Genauigkeit von Stichprobenrahmen für Haushaltsumfragen zu quantifizieren oder zu verbessern.

Zahlreiche Studien haben die Genauigkeit von gerasterten Bevölkerungsschätzungen im Vergleich zu am Boden gesammelten Siedlungsstandorten [72], mit Volkszählungsdaten bewertet, die in einem feineren Maßstab als die im Modell verwendeten Volkszählungsdaten verfügbar sind [29, 73,74,75,76], und durch Vergleich alter und neuer gerasterter Bevölkerungsdatensätze, wobei der neue Datensatz aktualisierte oder feiner skalierte Bevölkerungsdaten verwendet [38]. Diese Beweise reichen jedoch nicht aus, um die Genauigkeit eines bestimmten top-down-gerasterten Populationsdatensatzes zu beurteilen. Angesichts der Anzahl der Komponenten, die zu Fehlern bei gerasterten Populationsmodellen beitragen, sollte die zukünftige Forschung Simulationsstudien verwenden, um die Auswirkungen verschiedener Modellkomponenten auf gerasterte Populationsschätzungen zu testen. Diese Studien sollten auch neu formulieren, wie die Schätzfehler behandelt werden (z. B. anstatt zu fragen „wie viel Fehler gibt es bei der Schätzung für jede Zelle der Größe X?“, sollten Forscher fragen „wie viele Zellen müssen aggregiert werden, um einen Fehler von . zu erreichen“. Y?").

Problem mit veränderbaren Flächeneinheiten

Zweitens können Segmentierungs- und Wachstumsansätze bei der Auswahl von Stichprobeneinheiten einer Verzerrung durch das MAUP unterliegen. Simulationsstudien sollten verwendet werden, um die Auswirkungen von Gitterzellengrößen und -gruppierungen auf die Auswahlwahrscheinlichkeiten von Netzteilen zu quantifizieren. Darüber hinaus sollte die Entwicklung geografisch und sozial sinnvoller Stichprobenrahmen mit gerasterten Bevölkerungsdaten verfolgt werden. Die Fähigkeit, einen sinnvollen Raster für die Bevölkerungsstichprobe zu erstellen, hängt in hohem Maße von der Verfügbarkeit feinskaliger, genauer Umweltdaten und gerasterten Schätzungen der sozialen und Gesundheitsmerkmale der Bevölkerung ab.

Adaptive PSU-Probengewichte

Drittens ist, wenn Wachstumsansätze für die Auswahl von PSUs verwendet werden, weitere Forschung erforderlich, um zu bewerten, ob adaptive Stichprobengewichtungen verwendet werden sollten und wenn ja, wie diese zu formulieren sind. Diese Fragen können mit statistischer Theorie und Simulationsstudien evaluiert werden.

Verfügbarkeit von Satellitenbildern

Viertens sind alle hier beschriebenen Ansätze für gerasterte Bevölkerungsstichproben vom Zugang zu fein aufgelösten Satellitenbildern mit guter Sichtbarkeit von Wohngebäuden ohne ausgedehnte Baum- oder Wolkenbedeckung abhängig. Vorhandene gerasterte Bevölkerungsstichproben wurden in Städten, Lagern, Wüsten, Savannen und entwaldeten Ackerflächen implementiert. Methoden zur Implementierung gerasterter Bevölkerungsstichproben wurden für bewaldete Gebiete nicht beschrieben.

Verbergen von Netzteilstandorten in Veröffentlichungen und Crowdsourcing-Karten

Fünftens müssen gerasterte Bevölkerungsstichproben, die Crowdsourcing-Karten in der Feldforschung verwenden, die Anonymität der Umfrageteilnehmer und ihrer Gemeinden gewährleisten. Karten aus Crowdsourcing können für die Feldnavigation und die Aufzählung von Haushalten unglaublich wertvoll sein, obwohl die Technologie und Protokolle zur Unterstützung von Vermessungsaktivitäten begrenzt sind. Es wurden noch keine Standardprotokolle etabliert, um die Standorte von Vermessungs-Netzteilen bei der Kartierung von Gebäuden und Straßen in einer Crowd-Source-Plattform wie OpenStreetMap™ zu verbergen. Darüber hinaus sind uns keine Anwendungen bekannt, die es Umfragezählern ermöglichen, sowohl OpenStreetMap™ zu aktualisieren als auch eine vertrauliche Haushaltsliste, die mit Gebäudestandorten verknüpft ist, separat zu speichern, die Interviewer benötigen würden, um die Stichprobenhaushalte zu identifizieren. Wie bei jeder Umfrage sollten die Grenzen der Netzteileinheiten und die Standorte der Schwerpunktpunkte nicht öffentlich geteilt werden, um die Anonymität der Befragten und ihrer Gemeinschaften zu schützen. PSU-Punktstandorte können veröffentlicht werden, wenn sie nach Methoden wie denen von MeasureDHS [77] zufällig geografisch verschoben sind. Das MeasureDHS-Projekt veröffentlicht PSU-Schwerpunktkoordinaten, die in städtischen Gebieten bis zu 2 km und in ländlichen Gebieten bis zu 5 km verschoben sind, wobei jeder 100. ländliche Punkt um bis zu 10 km verschoben ist.

Machbarkeit der Feldarbeit

Das sechste Anliegen der gerasterten Bevölkerungsstichprobe ist die Durchführbarkeit der Feldforschung. Obwohl es mehrere Gründe gibt, gerasterte Bevölkerungsstichproben zu verwenden, müssen Protokolle zur Anwendung dieser Methoden im Feld weiterentwickelt werden. Was ist das Aufzählungsprotokoll in einem Netzteil, das auf zwei Seiten eines Flusses fällt, wo keine Brücke in der Nähe zu überqueren ist? Sollten Gebäude aufgezählt werden, wenn sie von der PSU-Grenze geschnitten werden? Da die Grenzen der gerasterten Netzteileinheiten keinen vernünftigen geografischen oder administrativen Grenzen folgen, werden während der Aufzählung mit ziemlicher Sicherheit aktuelle Satellitenbilder benötigt. Was ist die Mindestbildauflösung, die für die Probenahme in ländlichen versus städtischen Gebieten erforderlich ist? Wie aktuell sollten die Satellitenbilder sein? Was sind die Kompromisse bei der Verwendung digitaler Aufzählungsmethoden gegenüber papierbasierten Methoden? Die Verwendung von Smartphones oder Tablets zum digitalen Aufzählen von Netzteileinheiten erhöht zwar die Kosten und die Anforderungen an die Fähigkeiten der Aufzähler, kann aber auch den Zeitaufwand und die Genauigkeit der Aufzählung im Vergleich zu Stift-und-Papier-Methoden verringern. Mehrere Fragen in Bezug auf Kosten, Zeit, Genauigkeit, Technologie und Qualifikationsanforderungen des Personals für die Implementierung von gerasterten Bevölkerungsumfragen müssen bewertet werden.


Abstrakt

Es kann davon ausgegangen werden, dass der Lebensraum eines Tieres die Ressourcen umfasst, die es zum Überleben oder zur Fortpflanzung benötigt. Somit haben Tiere, die eine heterogene Landschaft bewohnen, in der Ressourcenfelder in Größe, Form und Verteilung variieren, natürlich Heimatgebiete unterschiedlicher Größe, so dass jedes Heimatgebiet eine minimal erforderliche Menge einer Ressource umfasst. Die Größe des Heimatgebietes kann aus Telemetriedaten geschätzt werden, und oft können Schlüsselressourcen oder Proxys dafür, wie die Gebiete wichtiger Lebensraumtypen, kartiert werden. Wir schlagen eine neue Methode vor, die Resource-Area-Dependence Analysis (RADA), die anhand einer Stichprobe von verfolgten Tieren und einer kategorialen Karte i) ableitet, in welchen Kartenkategorien wichtige Ressourcen zugänglich sind, ii) in welchen Revierkernen sie sich befinden und iii) schätzen die durchschnittlichen Mindestflächen dieser Kartenkategorien, die für eine solche Ressourcenbereitstellung erforderlich sind. Wir stellen drei Beispiele für die Anwendung von RADA auf Datensätze von mit Funk verfolgten Tieren aus Südengland vor: 15 rote Eichhörnchen Sciurus vulgaris, 17 graue Eichhörnchen S. carolinensis und 114 Mäusebussarde Buteo buteo. Die Analysen zeigten, dass jedes Eichhörnchen im Mittel (95 % CL) 0,48 ha (0,24–-0,97) Kiefernwald im äußersten Verbreitungsgebiet benötigte, jedes Grauhörnchen 0,34 ha (0,11–1,12) ha ausgewachsenen Laubwaldes und 0,035–0,046 ha Weizen, ebenfalls innerhalb des äußersten Reviers, während jeder Bussard 0,54 ha (0,35–0,82) unebenes Gelände in der Nähe des Revierzentrums und 14 ha (11–17) Wiese innerhalb eines mittleren Kern, wobei 52% von ihnen auch auf 0,41 ha (0,29–0,59) Vorstadtland in der Nähe des Heimgebietszentrums angewiesen sind. RADA bietet somit ein nützliches Instrument, um den Schlüsselbedarf an Tierressourcen während Studien zu Tierbewegungen und Habitatnutzung abzuleiten.

Zitat: Kenward RE, Arraut EM, Robertson PA, Walls SS, Casey NM, Aebischer NJ (2018)Ressourcen-Bereichs-Abhängigkeitsanalyse: Ableitung des Bedarfs an Tierressourcen aus Heimat- und Kartierungsdaten. PLoS ONE 13(10): e0206354. https://doi.org/10.1371/journal.pone.0206354

Editor: Rob Slotow, Universität Kwazulu-Natal, SÜDAFRIKA

Erhalten: 22. Dezember 2017 Akzeptiert: 11. Oktober 2018 Veröffentlicht: 24. Oktober 2018

Urheberrechte ©: © 2018 Kenward et al. Dies ist ein Open-Access-Artikel, der unter den Bedingungen der Creative Commons Attribution License vertrieben wird und die uneingeschränkte Verwendung, Verbreitung und Reproduktion in jedem Medium gestattet, sofern der ursprüngliche Autor und die Quelle angegeben werden.

Datenverfügbarkeit: Die folgenden Datendateien sind für die öffentliche Nutzung über das Dryad Digital Repository über den folgenden Link verfügbar: http://dx.doi.org/10.5061/dryad.8n183. FUR15xx (mit beliebiger Erweiterung, Standortdaten von 15 funkmarkierten Eichhörnchen), FURHAB (mit beliebiger Erweiterung, Kartendaten zur Analyse mit FUR15XX-Rothörnchen), ELTON (mit beliebiger Erweiterung, Standortdaten von 17 funkmarkierten Grauhörnchen), ELHAB1 (mit beliebiger Erweiterung, Kartendaten zur Analyse mit ELTON Grauhörnchen) und ALBAUT (mit beliebiger Erweiterung, Standortdaten von 114 funkgekennzeichneten Bussarden). Die Landbedeckungskarte von Großbritannien, die bei der Analyse mit Bussarden verwendet wurde, ist gegen Genehmigung auf der öffentlichen Website http://www.ceh.ac.uk/services/land-cover-map-1990 verfügbar.

Finanzierung: Die Finanzierung wurde von British Petroleum PLC (www.bp.com) über mehrere Verträge mit dem Natural Environment Research Council (www.nerc.ac.uk) sowie von Biotrack Ltd (www.biotrack.co.uk), Anatrack . bereitgestellt Ltd (www.anatrack.com), der Game and Wildlife Conservation Trust (www.gwct.org.uk), Newcastle University (www.newcastle.ac.uk), Conselho Nacional de Desenvolvimento Cientifico e Tecnologico do Brasil (CNPq), Instituto Nacional de Ciencia e Tecnologia para Mudancas Climaticas (INCT-MC) und Oxford University (www.oxford.ac.uk). Die Geldgeber unterstützten die Autoren [REK, EMA, SSW, NJA, PAR, NMC] in Form von Gehältern, spielten jedoch keine zusätzliche Rolle beim Studiendesign, der Datenerhebung und -analyse, der Entscheidung zur Veröffentlichung oder der Vorbereitung der Manuskript. Die spezifischen Rollen dieser Autoren werden im Abschnitt "Autorenbeiträge" artikuliert.

Konkurrierende Interessen: Die Finanzierung wurde von British Petroleum PLC (www.bp.com) über mehrere Verträge mit dem Natural Environment Research Council (www.nerc.ac.uk) sowie von Biotrack Ltd (www.biotrack.co.uk), Anatrack . bereitgestellt Ltd (www.anatrack.com), der Game and Wildlife Conservation Trust (www.gwct.org.uk), Newcastle University (www.newcastle.ac.uk), Conselho Nacional de Desenvolvimento Cientifico e Tecnologico do Brasil (CNPq), Instituto Nacional de Ciencia e Tecnologia para Mudancas Climaticas (INCT-MC) und Oxford University (www.oxford.ac.uk). Die Geldgeber unterstützten die Autoren [REK, EMA, SSW, NJA, PAR, NMC] in Form von Gehältern, hatten jedoch keine zusätzliche Rolle beim Studiendesign, der Datenerhebung und -analyse, der Entscheidung zur Veröffentlichung oder der Vorbereitung der Manuskript. Die spezifischen Rollen dieser Autoren werden im Abschnitt "Autorenbeiträge" artikuliert. Dies ändert nichts an unserer Einhaltung der PLOS ONE-Richtlinien zum Teilen von Daten und Materialien.


Erweitertes GIS

1. ist eingerichtet, um die spezifischen Ziele der systematischen Sammlung, Speicherung, Analyse und Darstellung von Informationen zu erreichen.

2. strukturell aus miteinander verbundenen Komponenten besteht, die eine Kombination aus Daten sowie technischen und personellen Ressourcen umfassen

3. aus Eingabe-, Verarbeitungs- und Ausgabesystemen bestehen, die alle nach einem wohldefinierten Satz von Betriebsverfahren und Protokollen arbeiten.

4. kann unabhängig betrieben und gleichzeitig mit anderen Informationssystemen verknüpft werden

  • Die Daten sowie die technischen und personellen Ressourcen, die zur Bildung des Systems verwendet wurden
  • Kommunikationsprotokoll und Datenverwaltungsverfahren
  • funktionale Teilsysteme
  • Standalone- oder Netzwerkmodus von Systemen oder Netzwerkmodus von Systemkonfigurationen
solche, die für die Verarbeitung von Daten bestimmt sind, die sich auf keine Position im geografischen Raum beziehen. Zum Beispiel ein System für die Buchhaltung.
solche, die für die Verarbeitung von Daten zu realen Merkmalen oder Phänomenen bestimmt sind, die in Bezug auf Orte beschrieben werden

Alle Geoinformationssysteme können als GIS angesehen werden

CAD-Systeme, CAM-Systeme sind auch räumliche Informationssysteme

Als GIS können nur solche Geoinformationssysteme bezeichnet werden, die zur Verarbeitung und Analyse von Geodaten oder geografisch referenzierten Daten verwendet werden


Schau das Video: Crash Course QGIS 2 Shapefile Types, Line Polygon Point Creation, Cut Line, Moving, Rotation