Mehr

So normalisieren oder skalieren Sie das NDVI-Rasterbild

So normalisieren oder skalieren Sie das NDVI-Rasterbild


Ich habe meine Landsat-Band 3 und Band 4 aus verschiedenen Jahren verarbeitet, um NDVI-Werte abzuleiten. Die Banden wurden atmosphärisch korrigiert, indem die dos1-Korrektur verwendet wurde.

Der NDVI wurde für mein Untersuchungsgebiet berechnet und die Werte, die in den Statistikparametern jeder Raster-Layer-Eigenschaft als Minimum, Maximum, Mittelwert bzw. Standardabweichung für jedes entsprechende Jahr angezeigt wurden, sind wie folgt:

1993 -0.15 0.73 0.22 0.099 1998 -0.41 0.85 0.33 0.13 2002 0.0009 0.629 0.165 0.07 2009 -0.061 0.55 0.19 0.068 2011 -0.067 0.596 0.165 0.064

Meine Frage hier ist, wie ich alle Raster jedes Jahres normalisieren kann, damit ich die relative Änderung in jedem Jahr sehen kann. Mit anderen Worten, ich möchte den relativen Index über das Untersuchungsgebiet ableiten, aber nicht klarstellen, welchen Bereich ich für meinen Fall wählen soll, in dem meine Rasterwerte einen gleichmäßigen Intervallindex aufweisen. Wie kann ich diese Werte neu skalieren

Als nächstes sollte die Grüne Vegetationsfraktion (GVF) unter Verwendung der gleichen Gleichung wie Hu und Jia berechnet werden, die 2010 für die südchinesische Stadt Guangzhou verwendet wurde, wie erwähnt Gleichung-8 in dem Papier auch als lineares Mischungsmodell bezeichnet.

GVF = NDVI – NDVImin/NDVImax – NDVImin wobei NDVImin und NDVImax als 0,05 bzw. 0,70 gewählt wurden und diese Werte aus AVHRR 10-Tage-Kompositdaten abgeleitet wurden.

Ich möchte alle Werte auf 0-1 normalisieren (oder sagen transformieren, wenn ich nicht falsch liege), um den Anteil jedes Pixels in grüner Vegetation zu vergleichen, um die tatsächliche Rolle der Vegetation zu untersuchen. Wie kann ich die Reichweite für meine Region ableiten. Muss ich zuerst 0-255 neu skalieren? Da es sich um diskrete Daten handelt, sind keine kontinuierlichen Werte von -1 bis +1.

Linear Spectral Unmixing unter Verwendung der bildbasierten Methode zum Sammeln von Endelementen wurde in verschiedenen Studien verwendet, um den Bereich von NDVImin (kahlen Land) und NDVImax (dichte Vegetation) abzuleiten.


Ich glaube, das Tool, das Sie suchen, ist die Neuklassifizierung. Sie können Klassen für Ihre verschiedenen NDVI-Sets erstellen. Außerdem haben Sie die Möglichkeit, verschiedene Klassifikationsmethoden zu wählen, wie z. B. Natural Jenks, Geometrisch, Perzentil usw. Ich arbeite an einer ähnlichen Studie, in der ich 4 Klassen verwendet habe; karg, Gras/Weide, Wald und Wald.


Kann Keras ImageDataGenerator ein Bild zwischen -1 und 1 . neu skalieren

Ich baue derzeit ein GAN für Bilder in meinem lokalen Verzeichnis. Also verwende ich den Keras.ImageDataGenerator flow_from_dir-Konstruktor.

Ich möchte meine Bilder zwischen -1 und 1 normalisieren, das ist die Konvention für GANs, die die Tanh-Aktivierung verursacht.

Ich habe ein Problem beim Neuskalieren des Bildes wie beim Implementieren 1/127.5 -1 im Rescale-Argument.


USGS EROS Archiv - Vegetationsüberwachung - eMODIS Fernerkundungsphänologie

Für Produkte, die aus eMODIS-Daten abgeleitet wurden (2001-heute), ist eine jährliche Aufzeichnung von neun historischen phänologischen Fernerkundungsmetriken für die angrenzenden Vereinigten Staaten mit einer Auflösung von 250 m verfügbar.

eMODIS Phenology Saisonstart für die westliche Region für 2001.
(öffentliche Domain)

Die Remote Sensing Phenology (RSP)-Sammlung besteht aus neun jährlichen phänologischen Metriken für die angrenzenden Vereinigten Staaten. Forscher des U.S. Geological Survey (USGS) Earth Resources Observation and Science (EROS) Center verwenden von Satellitensensoren gesammelte Daten, um saisonale Veränderungen der Vegetation zu verfolgen. Die beiden Satellitensensoren, die die Rohdaten für das RSP-Programm liefern, sind das Advanced Very High Resolution Radiometer (AVHRR) der polarumlaufenden Satelliten der National Oceanic and Atmospheric Administration (NOAA) und das Moderate Resolution Imaging Spectroradiometer (MODIS) an Bord von National Aeronautics und Space Administration (NASA) Terra- und Aqua-Satelliten. Die Satellitendaten werden zunächst in Werte des Normalized Difference Vegetation Index (NDVI) umgewandelt. AVHRR NDVI und eMODIS NDVI bilden die Grundlage für RSP. Zeitreihen NDVI können zusammengefasst und analysiert werden, um neun phänologische Schlüsselindikatoren zu erzeugen, die eine vollständige Vegetationsperiode darstellen. Diese Daten stellen ein leistungsstarkes Werkzeug dar, um Trends im Pflanzenlebenszyklus im Zeitverlauf zu dokumentieren und die Auswirkungen des Klimawandels auf Ökosysteme zu erkennen.

Phänologieprodukte für die Fernerkundung

Fernerkundungsphänologieprodukte sind in zwei Dateiformaten mit geographischen Koordinaten erhältlich, die sich auf das Lambert Azimuthal Equal Area Kartierungsraster beziehen:

  • Georeferenziertes Tagged Image File Format (GeoTIFF) ist eine TIFF-Datei mit eingebetteten geografischen Informationen. Dies ist ein Standardbildformat für GIS-Anwendungen.
  • Die Band Sequential (BSQ)-Bilddatei ist ein binäres Rasterformat mit einer begleitenden Header-Datei, die das Layout und die Formatierung der Datei beschreibt.

EarthExplorer bietet eine jährliche Aufzeichnung von AVHRR-Phänologiedaten mit 1-km-Auflösung aus dem Jahr 1989 und eMODIS-Phänologiedaten mit 250-m-Auflösung aus dem Jahr 2001. Neun jährliche historische Fernerkundungsphänologie-Metriken für die konterminativen Vereinigten Staaten sind verfügbar für jeden Datensatz.

Phänologische Metriken

Parameter Akronym Phänologische Beschreibung
Amplitude AMPERE Maximaler Anstieg der photosynthetischen Aktivität der Canopy über die Basislinie (skalierter NDVI).
Dauer DUR Dauer der photosynthetischen Aktivität (Anzahl der Tage).
Ende der Saison NDVI EOSN Niveau der Photosyntheseaktivität am Ende der messbaren Photosynthese (NDVI-Wert).
Saisonende EOST Ende der messbaren Photosynthese im Vegetationsdach (Tag des Jahres).
Maximaler NDVI MAXN Maximale photosynthetische Aktivität in der Baumkrone (NDVI-Wert).
Maximale Zeit MAXT Zeitpunkt der maximalen Photosynthese im Blätterdach (Tag des Jahres).
Saisonstart NDVI SOSN Niveau der Photosyntheseaktivität zu Beginn der messbaren Photosynthese (NDVI-Wert).
Saisonstart Zeit SOST Beginn der messbaren Photosynthese im Vegetationsdach (Tag des Jahres).
Zeitintegriertes NDVI ZINN Canopy-Photosyntheseaktivität über die gesamte Vegetationsperiode (interpolierter NDVI).

Das Download-Paket für ein bestimmtes Jahr enthält eine GeoTIFF- oder Binärdatei für jede der neun Metriken, die in einer ZIP-Datei enthalten sind. Das tatsächliche Start- und Enddatum der Quelldaten sowie eine detaillierte Beschreibung jedes phänologischen Indikators sind in den Metadaten verfügbar, die mit jedem Download bereitgestellt werden.

Abdeckungskarten

Abdeckungskarten, die die Verfügbarkeit von eMODIS Phenology-Produkten anzeigen, stehen zum Download bereit.

Zusätzliche Information

Zugangsdaten

EarthExplorer kann verwendet werden, um phänologische Daten zu suchen, in der Vorschau anzuzeigen und herunterzuladen. Die Sammlungen AVHRR Phenology und eMODIS Phenology befinden sich in der Kategorie Vegetationsüberwachung.


Bilder, Automatisierung und Anwendungen

Willkommen zum letzten Kurs der Spezialisierung (es sei denn, Sie fahren mit dem Capstone-Projekt fort!). Führen Sie mit Ihrem Wissen über ArcGIS technische Aufgaben wie Rasterberechnungen und Eignungsanalysen durch. In diesem Kurs machen Sie sich in vier einwöchigen Modulen mit räumlicher Analyse und Anwendungen innerhalb von GIS vertraut: Woche 1: Sie lernen alles über Fernerkundungs- und Satellitenbilder und werden in das elektromagnetische Spektrum eingeführt. Am Ende dieser Woche können Sie Satellitenbilder online finden und herunterladen und für zwei gängige Analysearten verwenden: NDVI und trainierte Klassifizierung. Woche 2: Sie lernen, wie Sie mit ModelBuilder große Verarbeitungsworkflows erstellen, die Parameter, Vorbedingungen, Variablen und einen neuen Satz von Tools verwenden. Wir werden auch einige Themen untersuchen, für die wir nicht wirklich die Zeit haben, im Detail zu diskutieren, die jedoch Ihren Appetit auf zukünftiges Lernen in anderen Bereichen anregen könnten: Geokodierung, zeitgesteuerte Daten, räumliche Statistik und ArcGIS Pro. Woche 3: In der dritten Woche erstellen und verwenden wir digitale Höhenmodelle mit einigen neuen, spezifischen Werkzeugen wie dem Schnittfüllwerkzeug, Schummerungen, Sichtfeldern und mehr. Wir gehen auch einige gängige Algorithmen durch, darunter einen sehr wichtigen: die Eignungsanalyse. Woche 4: Wir beginnen die letzte Woche, indem wir über einige räumliche Analysetools sprechen, die wir in der Spezialisierung noch nicht angesprochen haben: Regionsgruppe zum Erstellen unserer eigenen Zonen, Focal Statistics zum Glätten einer Schummerung, Reklassifizieren zum Ändern von Werten und Punktdichte, um eine Dichtefläche zu erstellen. Zum Abschluss sprechen wir noch über einige weitere Dinge, die Sie vielleicht näher kennenlernen möchten, wenn Sie beginnen, sich selbst mit GIS-Themen vertraut zu machen. Belegen Sie Geoinformatik und Umweltanalyse als eigenständigen Kurs oder als Teil der Spezialisierung Geographische Informationssysteme (GIS). Bevor Sie an diesem Kurs teilnehmen, sollten Sie über gleichwertige Erfahrungen mit dem Absolvieren des ersten, zweiten und dritten Kurses in dieser Spezialisierung "Grundlagen der GIS", "GIS-Datenformate, Design und Qualität" bzw. "Geospatial and Environmental Analysis" verfügen. Wenn Sie die vierte Klasse abschließen, erwerben Sie die Fähigkeiten, die Sie benötigen, um den Schlussstein der Spezialisierung zu erreichen.

Олучаемые навыки

Geographisches Informationssystem (GIS), Bildanalyse, Raumanalyse, Satellitenbilder, GIS-Anwendungen

Ецензии

Sehr guter Kurs, aber bestimmte Themen, die in diesem Kurs bewertet wurden, wurden nicht gut erklärt, insbesondere die Verarbeitung von Fernerkundungsbildern (Herunterladen und Verwalten in GIS)

Ein erstaunlicher Kurs! gut organisiert, sehr informativ und reich an Ressourcen und nützlichen Materialien, mit einem ausgezeichneten Diskussionsforum, um die Kursthemen zu diskutieren.

In diesem Modul lernen wir alles über Fernerkundung und Satellitenbilder, beginnend mit einer Einführung in Fernerkundungsdaten und das elektromagnetische Spektrum, bevor wir uns mit der Erfassung von Satelliten- und Luftbildern und Datenprodukten befassen. Sie erfahren, wie Sie Satellitenbilder online finden und herunterladen und wie Sie diese in zwei verschiedenen gängigen Analysearten verwenden: NDVI und eine trainierte Klassifizierung. In der zweiten Lektion erfahren Sie, wie Sie einige grundlegende Werkzeuge verwenden, um die Bildanalyse mit Raster Calculator und Spatial Analyst zu unterstützen.

Реподаватели

Nick Santos

Екст видео

[MUSIK] Hallo zusammen und willkommen zurück. In diesem Vortrag zeige ich Ihnen, wie Sie den normalisierten Differenz-Vegetationsindex (NDVI) berechnen. Anhand derer wir mithilfe von Bildern aus der Ferne feststellen können, ob etwas gesunde Vegetation, weniger gesunde Vegetation oder überhaupt keine Vegetation ist. Ich werde dafür LandSat-Daten verwenden, die wir in der letzten Vorlesung heruntergeladen haben, aber es ist eine Teilmenge davon. Ich gebe Ihnen die Bänder eins bis fünf von LandSat, Sie müssen also nicht alles herunterladen und wir verwenden das, um NDVI zu berechnen. Ich werde Ihnen also zunächst zeigen, wie oder warum es wichtig ist oder wie wir es durch Betrachten des reflektierten Spektrums erhalten, und dann werden wir uns ansehen, wie wir NDVI basierend auf diesen Informationen aus dem berechnen können reflektiertes Spektrum. Und dann werden wir dies in ArcMap auf zwei verschiedene Arten tun, zuerst mit dem Bildanalysefenster und dann mit dem Rasterrechner. Eines der ersten Dinge, die wir mit NDVI verstehen müssen, ist also, wie Reflexionsspektren aussehen und was Reflexion für unsere Datenanalyse bedeutet. Lassen Sie uns also hier eine schnelle Achse zeichnen und auf dieser Achse, auf der y-Achse, haben wir das Reflexionsvermögen, also messen wir das in Prozent, so dass es 100 % ist, das hier unten 0 und 50 Zoll ist die Mitte. Und das bedeutet, dass bei Null nichts von irgendetwas reflektiert wird, wir können also keine Daten wirklich wahrnehmen, es wird kein Licht zu unserem Sensor zurückreflektiert. 50% Reflexion bedeutet, dass 50% des Lichts, das auf etwas trifft, zu einem Beobachter zurückreflektiert wird. Und dann 100 bis ganz nach oben, 100% des Lichts, das auf etwas trifft, wird zu einem Beobachter wie im Weltraum wie einer Satellitenkamera reflektiert. Auf der x-Achse haben wir Wellenlängen, also machen wir es etwas einfacher zu schreiben und wir gehen weiter. Und hier links, sagen wir, wir haben ungefähr 400 Nanometer, also 400 und sagen wir hier ungefähr 700 und dann haben wir keine völlig lineare Skala, wir haben x27ll haben hier ungefähr 1.200. Und das bedeutet, dass wir hier blaues Licht haben, wir haben grünes Licht in der Mitte und wir haben rotes Licht und dann haben wir hier nahes Infrarot. Also entschuldigen Sie bitte ein wenig meine Handschrift und wir können Kurven zeichnen, die hier passen, stellen verschiedene Dinge dar, also können wir uns die Vegetation sehr schnell ansehen. Vegetation reflektiert, wenn wir darüber nachdenken, Vegetation reflektiert mehr grünes Licht im sichtbaren Spektrum als blaues oder rotes Licht, weil es grün erscheint. Grünes Licht wird also davon reflektiert und kommt zu uns zurück, und was passiert, ist die Photosynthese von blauem und rotem Licht und einer Art Kurve dazwischen. Das sieht also ungefähr so ​​aus, wo es im blauen Licht tief unten ist, im grünen Licht etwas mehr reflektiert und im roten Licht wieder nach unten kommt. Jetzt geht es nicht ganz bis 50, sondern eher 25, aber für diese Illustration ist das in Ordnung. Und dann gehen wir weit nach oben in das nahe Infrarot und nivellieren uns dort ein wenig. Das große Ding, das wir hier haben, ist, dass es sehr wenig Blau, sehr wenig Rot, ein wenig Grün und viel Nahinfrarot reflektiert. Und wieder ist es nicht wirklich bis zu 100 % Reflexionsvermögen, aber es ist ziemlich hoch. Nun, wie können wir verschiedene Dinge unterscheiden, wenn wir nur diese vier Bänder haben, wir haben Blau, Grün, Rot und Infrarot. Nun, wie sieht es aus, wenn wir so etwas wie Wasser wollen? Nun, das Wasser bleibt hier unten, Wasser reflektiert nicht viel von allem, also bewegt sich das Wasser hier unten und es ist ziemlich niedrig, unter Vegetation. Aber was ist dann mit nacktem Boden? Nun, nackter Boden beginnt niedrig, aber nicht einmal so niedrig wie das Grün und steigt in diesem Bereich des elektromagnetischen Spektrums mit einer ziemlich konstanten Geschwindigkeit an. Was also interessant ist, ist, wenn wir gesunde Vegetation von nacktem Boden unterscheiden wollen, können wir sagen, das nahe Infrarot sollte höher sein als der Luftboden, also sollte der Nahinfrarotwert höher sein und der Rotwert sollte sein niedriger. Während sie auf nacktem Boden ziemlich nahe beieinander liegen, unterscheiden sie sich nur geringfügig. Gesunde Vegetation ist also hoch, nahes Infrarot, niedriges Rot und sogar relativ niedriges Grün, da dies etwa 15, 20 % im Grünen sein sollte. Während es im nahen Infrarot eigentlich eher bei 50% liegen sollte. Wir können also unsere Skala auf der linken Seite ändern, wenn wir möchten, aber noch einmal, um zu überprüfen, was wir sehen, was jede dieser Kurvensätze ist, also was jede dieser Farben sagt, wie viel Licht von ihnen reflektiert wird bei jeder anderen Wellenlänge. Also hier drinnen, lasst uns, Entschuldigung, lasst uns Bands zeichnen, die wir von so etwas wie Land hier bekommen könnten. Also werde ich diese und Art von Bands hier einklammern. Nehmen wir also an, dies ist das Land-Set-Band und zwischen diesen beiden schwarzen Linien liegt das Land-Set-Band für Blau. Und wir können erwarten, dass die nackte Erde in der Bräune dort relativ niedrig, aber höher ist als die Vegetation in Grün und noch höher als Wasser im Blau. Und dann haben wir hier ein Landset-Band für grünes Licht, und es gibt eine ähnliche Reihenfolge, aber bei rotem Licht sind sie ziemlich unterschiedlich. Das Wasser ist niedrig, die Vegetation ist auch noch ziemlich niedrig, aber dann steigt hier die nackte Erde höher, das können wir wirklich sehen. Wenn es im roten Bereich 30 % oder mehr davon reflektiert, ist es wahrscheinlich keine Vegetation, sondern wahrscheinlich etwas anderes wie nackte Erde. Und wenn Sie es wirklich bestätigen möchten, können Sie sagen: Wenn es im nahen Infrarotbereich von LandSat sehr stark und niedriger oder ziemlich niedrig im roten Bereich reflektiert, könnte es sich um eine gesunde Vegetation handeln. Wenn es jedoch im nahen Infrarotbereich mäßig stark und im roten Bereich immer noch mäßig stark reflektiert, könnte es sich stattdessen um nackte Erde handeln. So würden wir das also lesen und wofür wir es verwenden könnten. Werfen wir also einen Blick auf den Normalized Difference Vegetation Index, oder NDVI, im Sinne eines theoretischen Gedankenexperiments. Und zuerst verwenden wir es als Proxy für alle Arten von Umweltmessungen, weil es eine großartige Möglichkeit ist, zu sehen, wie es einem Ökosystem durch die Gesundheit seiner Vegetation geht. Das ist es also, was wir wirklich versuchen, die Gesundheit der Vegetation zu erreichen, und ein Teil der Gründe, warum wir dies als Stellvertreter für all diese anderen Verwendungen verwenden, ist, dass es ziemlich billig ist, es zu sammeln, weil Nahinfrarotlicht gebaut wird in viele Sensoren. Die Kamera in Ihrem Telefon oder Ihrer Pocket-Digitalkamera kann Infrarot erkennen, wenn Sie den Filter entfernen. Standardmäßig werden nur Blau, Grün und Rot angezeigt, aber das liegt daran, dass der rote Sensor tatsächlich für Rot und nahes Infrarot empfindlich ist. Daher hat er einen Filter vor dem Sensor, der nahes Infrarotlicht blockiert, sodass Sie nur das sichtbares Licht. Sie sind also wirklich einfach zu konvertieren, die Sensoren sind überall leicht verfügbar und deshalb ist NDVI großartig, da es im Allgemeinen nur nahes Infrarot und rotes Licht verwendet und diese leicht auf kostengünstige Weise erfasst werden können. Und der Algorithmus zur Berechnung von NDVI nimmt das nahe Infrarotband und subtrahiert den Wert des roten Bands und dividiert diesen dann durch die Summe dieser beiden Bänder. Und das wird gleich mehr Sinn machen, wir werden ein bisschen darüber sprechen. Wenn Sie sich also immer noch fragen, was das überhaupt bedeutet? Wir werden dort ankommen. Stellen Sie sich das so vor, dass gesunde Pflanzen viel mehr rotes Licht absorbieren, weil sie es für die Photosynthese verwenden, richtig, sie verwenden es zur Nahrungsproduktion. Sie absorbieren also das rote Licht, sie reflektieren das grüne Licht und sie absorbieren blaues Licht. Und sie reflektieren auch viel Licht im nahen Infrarot. Sie reflektieren also nahes Infrarotlicht in großen Werten. Wir haben in den Reflektionsspektren gesehen, dass Sie hohe Werte im nahen Infrarot haben und etwas niedriger als die grünen Werte für das rote Licht. Wenn also die Reflexion im nahen Infrarot wie bei gesunder Vegetation zunimmt, steigt auch der Wert von oben und unten, was Teil der Normalisierung des normalisierten Differenz-Vegetationsindex ist. Aber wenn das rote Licht zunimmt, nimmt die Spitze ab. Wenn Pflanzen also mehr rotes Licht reflektieren, bedeutet dies, dass sie es nicht für die Photosynthese verwenden, sie sind weniger gesund. Da wir also das rote Licht vom nahen Infrarot subtrahieren, nimmt unser Spitzenwert ab, wenn wir höhere Rotwerte erhalten. Und es bringt den Wert näher an 0 oder sogar an -1. Wenn es mehr rotes Licht reflektiert als das nahe Infrarot, ist es wahrscheinlich nicht einmal Vegetation. Und wenn dann die Rotreflexion abnimmt, wie es bei Pflanzen der Fall ist, steigt der Spitzenwert wieder an. Wenn sich Rot also Null nähert, nähern wir uns dem reinen Nahinfrarotwert, und die Spitze nähert sich Eins, die Ober- und Unterseite nähern sich Eins, wenn wir beispielsweise 100 % des Nahinfrarots reflektiert haben minus Null des roten Lichts, sagen wir, in einer theoretischen Situation. Und dann bekommen wir unten 100 plus 0. Und so haben wir 100 über 100 gleich 1. In NDVI ist also näher an 1 eher eine gesunde Vegetation. Näher an 0 ist eher ungesunde Vegetation. Und normalerweise ist irgendwo unter 0 wahrscheinlich überhaupt keine Vegetation. Der Wert skaliert also von -1 bis 1. Und wir werden sie gleich sehen. Und es gibt andere normalisierte Indizes, die Sie verwenden können, um herauszufiltern, was wir aus der Luft sehen. Es gibt eine zur Bestimmung von Wasser und andere, die verschiedene Bänder verwenden, um zu versuchen, bestimmte Wechselwirkungen im elektromagnetischen Spektrum zu erhalten. Da wir in diesem Fall wissen, dass nahes Infrarot für Vegetation hoch und Rot niedrig ist, können wir diesen wirklich kleinen kleinen Algorithmus erstellen, um zu sehen, ob wir Vegetation mit nur diesen beiden Informationsbändern erkennen können. Wie dies in der Praxis aussieht, wenn wir Nahinfrarot minus Rot oder Nahinfrarot plus Rot haben, ist ein RasterCalculator-Ausdruck. Wir würden also die Bänder kombinieren, und dies ist in einem Bild, in dem wir nur Blau, Grün, Rot und Infrarot haben, wo also Rot Band3 und nahes Infrarot Band4 ist. Aber bei Landsat sind diese eins höher, also ist Rot 4 und Nahinfrarot ist 5. Aber stellen Sie sich vor, wir haben gerade ein Vierbandbild, also machen wir Nahinfrarot in imageBand4-imageBand3, das das Rot ist, und dann dividiere es durch ImageBand4 + ImageBand3. Alternativ können wir das Bildanalysefenster verwenden. Und das zeige ich Ihnen auch, das diesen Wert für uns berechnen kann, ohne dass wir uns diese spezielle Berechnung merken müssen. Schauen wir uns also an, wie dies in ArcMap funktioniert. Ich habe hier meine Landsat-Szene, die in diesem Fall nur das sichtbare Licht zeigt. Band 4 ist rot, Band 3 ist grün und Band 2 ist blau, und ich möchte NDVI anzeigen. Nun, zuerst lassen Sie es einfach das Bildanalysefenster tun. So kann ich zu Windows > Image Analysis gehen, und es fliegt heraus. Und wenn ich hier die landsat_scene auswähle, gibt es hier unten einen kleinen Verarbeitungsknopf, der ein kleines Blatt für NDVI hat. Und bevor ich darauf klicke, werde ich es einrichten, da es standardmäßig möglicherweise nicht richtig eingerichtet ist, aber ich muss auf der Registerkarte NDVI angeben, welches Band in meinem Bild rot und welches infrarot ist. Es könnte also ursprünglich so sein, und ich muss sagen, dass Band 4 rot und Band 5 nahes Infrarot ist. Und es wird wahrscheinlich auch anfangs so sein und wir werden die Schaltfläche Wissenschaftliche Ausgabe überprüfen lassen. Und ich klicke auf OK und klicke jetzt auf die Blattschaltfläche, um NDVI zu erhalten. Und es gibt mir hier eine Illustration, wo Grün eher eine gesunde Vegetation ist und Farben, die nicht grün sind, überhaupt keine Vegetation. Sie können also sehen, wie diese Seen auftauchen. Dann können wir hier die starke Vegetation in den Bergen sehen und in den landwirtschaftlichen Gebieten hier drüben mit hohen NDVI-Werten auftauchen. Dies ist nur das Farbkartenraster. Hier werden den Dingen bestimmte Farben zugewiesen, und die Werte haben keine besondere Bedeutung. Es gibt uns nur eine Illustration für unsere eigenen Augen. Verwenden wir also die wissenschaftliche Ausgabeoption und führen Sie sie erneut aus. Und in diesem Fall bekommen wir mehr von dem, worüber ich gesprochen habe. Der hohe Wert von 1 und der niedrige Wert von minus 1. Und wir können sehen, dass die Seen, nicht die Vegetation, näher bei minus 1 liegen. Und dass die Werte, die Weiß am nächsten sind, die Werte sind, die wir zuvor in den landwirtschaftlichen Regionen gesehen haben. und in den Bergen war das eher Vegetation. Und was hier passiert, ist, denken Sie daran, dass sie eine hohe Nahinfrarotreflexion und eine niedrige Rotreflexion haben. Wenn wir also das Rot vom nahen Infrarot subtrahieren, haben wir einen höheren, positiven Wert oben, und wenn wir das nahe Infrarot zum Rot unten addieren oder subtrahieren, erhalten wir unten einen ähnlichen Wert. Da Rot ein niedriger Wert ist, ist es sowohl am oberen als auch am unteren Rand der Gleichung fast bedeutungslos. Das ist ein sehr kleiner Unterschied. Wir teilen also fast nur das Infrarot durch sich selbst und erhalten etwas in der Nähe von 1. Und das zeigt sich in diesem speziellen Bild als heller Fleck, was darauf hindeutet, dass es sich eher um Vegetation handelt. Wenn ich jetzt das Bildanalysefenster nicht verwende, wenn ich es mit dem Raster-Rechner tun möchte, muss ich diese Bänder separat in meine Karte laden. So kann ich zu Daten hinzufügen gehen. Also gehe ich zur Schaltfläche Daten hinzufügen und habe Ihnen für diese Demo eine Fünf-Band-Version der Landsat-Daten gegeben, damit Sie nicht alles herunterladen müssen, und ich werde sie auf meinem Computer suchen. Und wenn ich wieder in die Bänder doppelklicke, kann ich nur die beiden Bänder, die ich hier benötige, als separate Bänder zu meinem Kartendokument hinzufügen. In Ihrem Download befindet es sich in Ihrem Documents-Ordner unter ArcGIS im Packages-Ordner, da dort Kartenpakete extrahiert werden. Sie können also das soeben extrahierte Paket mit diesem Namen in diesem Ordner finden und dann dort im Ordner ArcGIS 10.3 suchen. Geo-Datenbank, die diese Daten enthält. Wenn Sie also das Kartenpaket dafür herunterladen, ist es dort, wo es sein wird. Jetzt, da ich beides habe, kann ich sie im Raster-Rechner verwenden. Wenn ich also zu ArcToolbox gehe, gehe in der Kartenalgebra von Spacial Analyst zu Raster-Rechner. Und ich habe Zugang zu diesen beiden Bands. Und diese beiden Bänder als Raster im Raster-Rechner. Und ich kann eine Version dieser Gleichung erstellen. Also lassen Sie es zuerst so machen, wie ich weiß, dass es etwas falsch ist, aber es wird richtig aussehen. Versuchen wir es also gemeinsam. Lassen Sie uns es also zunächst so zusammenstellen, wie wir es kennen. Wir wissen, dass wir das nahe Infrarotband nehmen und das rote Band subtrahieren müssen. Und gruppieren Sie diese zusammen, sodass dies separat geschieht. In der Reihenfolge der Operationen erfolgt diese Subtraktion zuerst, und dann dividiere ich diesen Wert durch diesen anderen Wert. Ich mache Nahinfarkt plus Rot. Und dann wird diese Addition geschehen, bevor die Teilung stattfindet. Es erfolgt also die Subtraktion, die Addition und dann werden die subtrahierten Werte durch die addierten Werte dividiert. Und ich lasse es in meine Standard-Geodatenbank einfügen und nenne es ndvi_try1 und klicke auf OK. Und es wird der Raster-Rechner ausgeführt, und was ich hier bekomme, ist, dass ich drei Werte bekomme. Nicht der Wertebereich hier auf einem Farbverlauf, ich erhalte 3 Werte, -1, 0 und 1. Und das liegt daran, dass sie als Integer-Raster interpretiert werden. Die Eingabe-Raster sind, nicht das. Ein Eingabe-Raster ist ein ganzzahliges Raster, wobei alle diese Werte hier ganzzahlige Werte für die Intensität in jedem Band sind. Also los geht's, die 0 bis 44.825. Da es also Integer-Raster verwendet, führt es Integer-Mathematik durch und gibt mir Ganzzahlen als Ausgabe, nicht die Dezimalzahlen, die wir wollen. Nehmen wir also das, was wir gerade ausgeführt haben, und versuchen Sie es erneut, und ich mache es zu ndvi_try2. Und was wir tun müssen, ist im Math-Bereich eine Float-Funktion. Also werden wir die Float-Funktion genau dort einfügen. Und im Grunde werden wir es zwingen, jedes davon in ein Gleitkomma-Raster umzuwandeln, bevor wir die mathematische Operation ausführen. Und tatsächlich können wir das sogar von hier aus verschieben, bevor wir die Aufteilung vornehmen. Wir könnten als ganze Zahlen subtrahieren, aber dann müssen wir als Gleitkomma-Raster dividieren. Also schließe ich jeden dieser Teile in die Float-Funktion ein, um daraus im Grunde doppelte Raster zu machen, richtig? Der Gleitkomma- oder Double-Datentyp. Also verwandeln wir sie in eines von diesen und dann machen wir die Aufteilung zwischen diesen neuen Gleitkomma-Rastern. Dies wird als Casting unserer Daten bezeichnet, es wird zwischen zwei Datentypen konvertiert. In diesem Fall wandeln wir eine ganze Zahl als Double um und können sie dann als Division mit Gleitkommazahlen berechnen. Versuchen wir es also, und ich klicke auf OK, oops. Irgendwo habe ich wohl meine Klammern durcheinander gebracht. Und es ist so, dass ich die zusätzlichen Klammern hier nicht brauche, Und dann habe ich jetzt hier eine zusätzliche am Ende. Also klicke ich auf OK und führe den Raster-Rechner hier unten erneut aus. Und jetzt erhalten wir viel mehr von dem, was wir vorher erwartet hatten oder hatten, basierend darauf, wann ArcGIS NDVI für uns berechnet hat. Und wenn ich möchte, kann ich die Bildanalyse wieder verwenden. Ich schalte diese anderen Layer hier einfach aus und habe nur den NDVI, den es berechnet hat, und den NDVI, den wir berechnet haben. Und wir werden einfach wischen und sehen, wie es sich verhält oder ob es optisch ungefähr gleich aussieht. Tatsächlich können Sie nicht sehen, dass ich wische, da die ihm zugewiesenen Farbverläufe gleich sind und die Werte dazwischen gleich sind. Okay, jetzt wissen wir also, wie man NDVI auf zwei verschiedene Arten berechnet. Wenn NDVI für Sie immer noch ein wenig verwirrend ist, machen Sie sich darüber noch keine allzu großen Sorgen. Ich möchte, dass Sie daraus mitnehmen, wenn Sie NDVI berechnen, sind Werte, die näher an 1 liegen, viel eher Vegetation. Und oft ist 0,5 immer noch Vegetation. Aber Werte, wenn Sie sich 0 nähern, sind sowieso keine Vegetation oder gesunde Vegetation. Und wenn Sie sich -1 nähern, betrachten Sie mehr Dinge, die überhaupt keine Vegetation sind. Und wenn Sie sich daran erinnern, ist das der wichtigste Teil. Und dann ist die Berechnung noch etwas komplizierter. Sie können versuchen, sich Teile dieses Videos noch einmal anzusehen oder eine Frage in den Diskussionsforen stellen. Versuchen Sie, es in Ordnung zu bringen, damit Sie ein wenig verstehen, was vor sich geht. Aber vor allem müssen Sie für diesen Kurs wissen, wie man es interpretiert, und dann, dass es existiert, damit Sie bei Bedarf weiter nachschlagen können, wie man es berechnet, wenn Sie es in Ihrer eigenen Arbeit finden. Okay, das war's für diesen Vortrag. In diesem Vortrag haben wir Reflektionsspektren besprochen, und dann haben wir uns auch angesehen, was NDVI ist und wie man es auf zwei verschiedene Arten in ArcGIS berechnet. Im Bildanalysefenster mit dem NDVI-Tool und mit dem Raster-Rechner. Ich weiß, das war ein langer Vortrag, aber ich hoffe, es hat sich gelohnt. Bis zum nächsten Mal.


Importieren von Bibliotheken und Erstellen einer SparkSession

Als nächstes werden wir die notwendigen Bibliotheken und Abhängigkeiten von EarthAI importieren. Dadurch wird wiederum eine neue SparkSession erstellt. Dazu gehören earth_on_demand , Rasterframes und pyspark

RasterFrames ist ein Geodaten Open Source Rasterverarbeitungsbibliothek für Python, Scala und SQL, die über mehrere Mechanismen verfügbar ist. RasterFrames bietet eine DataFrame-zentrierte Ansicht über beliebige georäumliche Rasterdaten und ermöglicht raumzeitliche Abfragen, Kartenalgebra-Rasteroperationen und Interoperabilität mit Spark ML


Wie, wann und warum sollten Sie Ihre Daten normalisieren / standardisieren / neu skalieren?

Bevor wir in dieses Thema eintauchen, beginnen wir zunächst mit einigen Definitionen.

„Neuskalierung“ Ein Vektor bedeutet, eine Konstante zu addieren oder zu subtrahieren und dann mit einer Konstanten zu multiplizieren oder zu dividieren, wie Sie es tun würden, um die Maßeinheiten der Daten zu ändern, beispielsweise um eine Temperatur von Celsius in Fahrenheit umzuwandeln.

„Normalisierung“ ein Vektor bedeutet meistens das Teilen durch eine Norm des Vektors. Es bezieht sich auch oft auf die Neuskalierung um das Minimum und den Bereich des Vektors, damit alle Elemente zwischen 0 und 1 liegen, wodurch alle Werte der numerischen Spalten im Dataset auf eine gemeinsame Skala gebracht werden.

„Standardisierung“ ein Vektor bedeutet meistens das Subtrahieren eines Positionsmaßes und das Dividieren durch ein Maßstabsmaß. Wenn der Vektor beispielsweise Zufallswerte mit einer Gaußschen Verteilung enthält, können Sie den Mittelwert subtrahieren und durch die Standardabweichung dividieren, um so eine „standardnormale“ Zufallsvariable mit Mittelwert 0 und Standardabweichung 1 zu erhalten.

Nachdem Sie diesen Beitrag gelesen haben, wissen Sie:

  • Warum sollten Sie Ihre Daten standardisieren/normalisieren/skalieren?
  • So standardisieren Sie Ihre numerischen Attribute mit einem Standardskalar, um einen Mittelwert von 0 und eine Einheitsvarianz zu haben
  • So normalisieren Sie Ihre numerischen Attribute mit einem Min-Max-Skalar im Bereich von 0 bis 1
  • So normalisieren Sie mit robustem Skalar
  • Wann Sie Standardisierung oder Normalisierung wählen sollten

Warum sollten Sie Variablen standardisieren / normalisieren:

Standardisierung:

Die Standardisierung der Merkmale um den Mittelpunkt und 0 mit einer Standardabweichung von 1 ist wichtig, wenn wir Messungen mit unterschiedlichen Einheiten vergleichen. Variables that are measured at different scales do not contribute equally to the analysis and might end up creating a bais.

For example, A variable that ranges between 0 and 1000 will outweigh a variable that ranges between 0 and 1. Using these variables without standardization will give the variable with the larger range weight of 1000 in the analysis. Transforming the data to comparable scales can prevent this problem. Typical data standardization procedures equalize the range and/or data variability.

Normalization:

Similarly, the goal of normalization is to change the values of numeric columns in the dataset to a common scale, without distorting differences in the ranges of values. For machine learning, every dataset does not require normalization. It is required only when features have different ranges.

For example, consider a data set containing two features, age, and income(x2). Where age ranges from 0–100, while income ranges from 0–100,000 and higher. Income is about 1,000 times larger than age. So, these two features are in very different ranges. When we do further analysis, like multivariate linear regression, for example, the attributed income will intrinsically influence the result more due to its larger value. But this doesn’t necessarily mean it is more important as a predictor. So we normalize the data to bring all the variables to the same range.

When Should You Use Normalization And Standardization:

Normalization is a good technique to use when you do not know the distribution of your data or when you know the distribution is not Gaussian (a bell curve). Normalization is useful when your data has varying scales and the algorithm you are using does not make assumptions about the distribution of your data, such as k-nearest neighbors and artificial neural networks.

Standardization assumes that your data has a Gaussian (bell curve) distribution. This does not strictly have to be true, but the technique is more effective if your attribute distribution is Gaussian. Standardization is useful when your data has varying scales and the algorithm you are using does make assumptions about your data having a Gaussian distribution, such as linear regression, logistic regression, and linear discriminant analysis.

Dataset:

I have used the Lending Club Loan Dataset from Kaggle to demonstrate examples in this article.

Importing Libraries:

Importing dataset:

Let’s import three columns — Loan amount, int_rate and installment and the first 30000 rows in the data set (to reduce the computation time)

If you import the entire data, there will be missing values in some columns. You can simply drop the rows with missing values using the pandas drop na method.

Basic Analysis:

Let’s now analyze the basic statistical values of our dataset.

The different variables present different value ranges, therefore different magnitudes. Not only the minimum and maximum values are different, but they also spread over ranges of different widths.

Standardization (Standard Scalar) :

As we discussed earlier, standardization (or Z-score normalization) means centering the variable at zero and standardizing the variance at 1. The procedure involves subtracting the mean of each observation and then dividing by the standard deviation:

The result of standardization is that the features will be rescaled so that they’ll have the properties of a standard normal distribution with

where μ is the mean (average) and σ is the standard deviation from the mean.

StandardScaler from sci-kit-learn removes the mean and scales the data to unit variance. We can import the StandardScalar method from sci-kit learn and apply it to our dataset.

Now let’s check the mean and standard deviation values

As expected, the mean of each variable is now around zero and the standard deviation is set to 1. Thus, all the variable values lie within the same range.

However, the minimum and maximum values vary according to how spread out the variable was, to begin with, and is highly influenced by the presence of outliers.

Normalization (Min-Max Scalar) :

In this approach, the data is scaled to a fixed range — usually 0 to 1.
In contrast to standardization, the cost of having this bounded range is that we will end up with smaller standard deviations, which can suppress the effect of outliers. Thus MinMax Scalar is sensitive to outliers.

A Min-Max scaling is typically done via the following equation:

Let’s import MinMaxScalar from Scikit-learn and apply it to our dataset.

Now let’s check the mean and standard deviation values.

After MinMaxScaling, the distributions are not centered at zero and the standard deviation is not 1.

But the minimum and maximum values are standardized across variables, different from what occurs with standardization.

Robust Scalar (Scaling to median and quantiles) :

Scaling using median and quantiles consists of subtracting the median to all the observations and then dividing by the interquartile difference. It Scales features using statistics that are robust to outliers.

The interquartile difference is the difference between the 75th and 25th quantile:

The equation to calculate scaled values:

First, Import RobustScalar from Scikit learn.

Now check the mean and standard deviation values.

As you can see, the distributions are not centered in zero and the standard deviation is not 1.

Neither are the minimum and maximum values set to a certain upper and lower boundaries like in the MinMaxScaler.

I hope you found this article useful. Happy learning!

Verweise

How, When and Why Should You Normalize/Standardize/Rescale Your Data? was originally published in Towards AI — Multidisciplinary Science Journal on Medium, where people are continuing the conversation by highlighting and responding to this story.


Rescaling each image Individually with keras

I am a beginner working on a simple CNN to classify X-ray detector images. Due to source intensity, all images have different max values. I want to use ImageDataGenerator to rescale those images to be in range [0,1], but cant't find a way to do that for each individual image. As far as I understand it, people usually just divide by 255 because that is the RGB max, but in my case the max could be anything between 1 and serveral million. Does anyone have an idea how to do this within ImageDataGenerator? Thank you for your time!

Edit: I ran over my images and normalized all of them prior to feeding them to the generator. Inspecting them then showed that the generator had scaled them back to rgb values (I assume due to color_mode). I then used rescale with the standard 1./255 and got the expectd max value of 1. However, after adding back samplewise_std_normalization, I again am getting values larger than 1. I understand why this is happening, but I'm not sure which "rule" is more important to follow: normalize to [0,1] or use samplewise_std_normalization


Data Products from sUAS collected imagery

New processing techniques, developed by NUPO researchers to utilize the higher resolution data collected by sUAS, generate the leading-edge geospatial data products needed to best support DOI scientific research.

Geospatial products that can be generated from UAS collected imagery include:

Orthophotos

Raw imagery captured by camera sensors is converted into orthophotos using the orthorectification process. This process removes the effects of topography and any sensor tilt to produce a distortion-free aerial photograph with a uniform scale. Orthorectification of sUAS imagery utilizes Structure from Motion (SfM) software and precise GNSS data acquired during the flight to produce high-resolution orthophotos. These orthophotos may have ground sample distances of less than 5 centimeters. A series of high-resolution orthophotos can be combined into a seamless orthomosaic a common technique used to produce base-maps supporting geospatial analysis.

Natural color (RGB) imagery from commercially available low-cost digital single-lens reflex cameras, mirrorless interchangeable-lens cameras, or point-and-shoot cameras can generate orthophotos used to produce the most common type of base map, a natural color orthomosaic.

Thermal imagery from sensors such as the FLIR Vue Pro R captures non-contact temperature measurements that generate thermal orthophotos. Thermal orthophotos contain 16-bit radiometrically calibrated raster data each pixel has an associated absolute surface temperature.

Color infrared orthophotos and orthomosaics are generated from multispectral sensors like the MicaSense RedEdge and MicaSense Altum. These sensors detect the visible and near-infrared wavelengths (in individual bands) needed to support vegetative analysis.

Orthomosaic of the Northeast Indiana study site generated from Ricoh GR natural color images

Point Clouds and 3D Models

Point clouds are a set of geographic data points in a three-dimensional coordinate system derived by either SfM processing techniques (photogrammetrically from overlapping raster images) or collected directly by LiDAR scanners. True-color point clouds are generated by processing the natural color imagery in SfM software or combining this imagery with LiDAR data collected at the same location.

Closeup of the 3D model that was generated for Devils Tower in Wyoming

Contours

Elevation values derived from UAS point clouds are an ideal data source for generating contour lines. Contour lines represent equal elevations of a surface and contour intervals represent the elevation difference between successive contours. Contour maps are used for terrain visualizations showing valleys, hilltops, and the steepness of slopes.

Contours over the Piute Valley in southern California derived on a ground sample distance (GSD) of 1.4 inch

Elevation Models (DEMs, DSMs, DTMs)

A digital elevation model (DEM) is a generic term for digital topographic and bathymetric data. A DEM or a Digital Terrain Model (DTM) implies an x, y coordinate system and z values of bare-earth terrain, i.e. void of vegetation and man-made features. Digital surface models (DSMs) are a form of DEM that contains surface elevations of natural terrain features in addition to vegetation and man-made features. Both sUAS acquired LiDAR data and photogrammetry derived point cloud data can be used to generate accurate DEMs/DTMs and DSMs.

Digital Surface Model of the West Fork Mine in Missouri generated from high-resolution imagery (5-10 cm pixel size) and elevation data (6-10 cm vertical and 2-4 cm horizontal resolution)

Extracted Features

A high-resolution orthomosaic generated from imagery collected on low-altitude UAS flights provides an ideal source for accurately identifying small-scale (<1 m) to larger-scale objects (>1 m) with feature extraction. This automated process recognizes spatial and spectral patterns within an image and can outline or classify those features into a newly defined dataset. Examples of objects identified using feature extraction include outlining individual tree crowns and identifying birds or other animals for population estimates.

Extracted bird locations at the Chase Lake National Wildlife Refuge pelican nests (red), cormorant nests (blue), gull/snowy egret non-nesting (black)

Normalized Difference Vegetation Index (NDVI)

Orthomosaics made from UAS collected multispectral imagery with bands in the visible red and near-infrared (NIR) range can be used to generate Normalized Difference Vegetation Index (NDVI) maps. NDVI calculations create a standardized index utilizing the amount of red light compared to NIR light reflected from a plant. The bright red display of an NDVI color ramp indicates areas with high NIR reflectance associated with healthy plants. The blue shades of the color ramp indicate lower NIR reflectivity and possibly less healthy vegetation.

Normalized Difference Vegetation Index (NDVI) derived from an orthomosaic of near infrared imagery taken from approximately 400 feet AGL over the Sycan River in the Klamath Basin in Oregon


Einführung

Since the mid-1990s, the number of equine West Nile virus (WNV) outbreaks and their severity have increased (Castillo-Olivares and Wood, 2004). Outbreaks have recently been recorded in Morocco (1996), Israel (1998–2000), Italy (1998) and France (2000, 2004). The North American outbreak of equine WNV disease exploded during 2002, with nearly 15,000 laboratory confirmed cases in 44 American states, 5 Canadian provinces and 3 Mexican states. Horses are particularly susceptible to WNV infection and may present with acute clinical signs of encephalomyelitis, such as ataxia, rearlimb paresis, muscle tremors and fasciculations, and recumbency. Although 80% of affected horses recover in 3–4 weeks, a small proportion has persistent neurological deficients. Treatment is supportive, including the use of anti-inflammatories, vitamins, fluids and antibiotics (Ostlund et al., 2001, Porter et al., 2003, Salazar et al., 2004, Snook et al., 2001, Trock et al., 2001, Ward et al., 2005). The cost of WNV disease to the U.S. equine industry is substantial, and this disease remains an important zoonosis.

WNV is maintained within a mosquito-wild bird transmission cycle. The mosquito species Culex pipiens und C. salinarius might be important vectors of WNV in horse populations in parts of the United States (Nasci et al., 2002). The vector-borne transmission of WNV makes it possible to identify foci of disease based on the presence of specific habitat factors, such as vegetation and standing water (White, 2001). The location of suitable vector mosquito habitats can be identified by the characteristics of vegetation cover. The Normalized Difference Vegetation Index (NDVI), derived from remotely sensed imagery, is associated with photosynthetically active radiation and has been used to characterize vegetation cover. It is calculated from measured brightness values based on the absorption, transmittance and reflectance of energy by vegetation in the visible red and near-infrared wavelengths of the electromagnetic spectrum (Derring and Haas, 1980, Jensen, 1996, Lyon and McCarthy, 1995).

The NDVI is the most commonly used vegetation index in health studies (Kitron and Kazmierczak, 1997). The use of remote sensing in epidemiology is based on the development of a logical sequence linking measures of radiation from a sensor on an aircraft or a satellite, to measures of a disease and its corresponding vector or host (Crombie et al., 1999). NDVI data, collected by the National Oceanic & Atmospheric Administration’s Advanced Very High Resolution Radiometer (AVHRR) satellite, have moderate spatial resolution (1 km 2 ) but high temporal resolution (Senay and Elliott, 2000). The NDVI has been used to classify habitat suitability for disease vectors, such as Ixodes scapularis (Ogden et al., 2006) and I. pacificus (Eisen et al., 2006) ticks (Lyme disease), Anopheles spp. mosquitoes (malaria) (Shililu et al., 2003) and Culicoides spp. (bluetongue) (Purse et al., 2004).

AVHRR satellite sensor data have been applied to describe the distribution of WNV in North America (Rogers et al., 2002). Based on this analysis, it has been suggested that the mild winter of 1998–1999 in the northeast of the United States provided conditions favorable for WNV transmission and perhaps allowed greater over-winter survival of hibernating mosquitoes. Higher NDVI values (indicative of suitable vector habitat) have been associated with clusters of human cases of WNV in New York City (Brownstein et al., 2002). In a study of an outbreak of WNV encephalomyelitis in a population of unvaccinated horses located in northern Indiana, U.S.A., a higher NDVI was found surrounding case, versus control, premises (Ward et al., 2005). It was concluded that the NDVI may be useful for identifying foci of WNV transmission. Remotely sensed data have also been used to identify potential environmental risk factors associated with WNV disease in horses in Camargue, France (Leblond et al., 2007). Biotypes that included rice fields and open water were associated with the presence of WNV cases. However, the temporal resolution (3 monthly) of satellite data available in this study was an issue. Since WNV transmission may be focal (Komar et al., 2001), using satellite imagery to estimate risk at unsampled locations can vastly supplement limited field resources (Brownstein et al., 2002).

The objective of this study was to determine if the NDVI was associated with equine West Nile virus disease seasonality – periods of above- or below-average reported cases – in Texas between 2002 and 2004. The long-term goal of the research is to develop an early-warning system for WNV disease risk in equine populations.


Materials and methods

Description of study area

This study was conducted in Waghimra Zone Easter part of Amhara National Regional state, Ethiopia. It is located 435 km far from Bahir Dar, and 720 km from Addis Ababa. Geographically Waghimra Zone is located between 12°15´and 13°16´ N latitude and 38°20´and 39°17´ E longitude (Fig. 1). The most common features of the zone are its rugged topography characterized by mountains, steep escarpments and deeply incised valleys (Berhanu 2015). It has a mean annual rainfall of 150 to 700mm in which the highest rainfall occur during summer season which starts in mid-June and ends in early September. The rainfall pattern in the area is relatively erratic and unpredictable.

Location map of the study area

Data source and methods of data collection

For this study an expedited MODIS (eMODIS) NDVI Terra image at 250m spatial resolution were used to monitor vegetation condition. Since this study aims to assess agricultural drought data for crop growing season months from June to September for the 17 years period (2000 to 2016) were downloaded from (https://earthexplorer.usgs.gov website). Enhanced/expedited/expandable MODIS (eMODIS) data provides separate Geostationary Earth Orbit Tagged Image File Format (GeoTIFF) for each product in a 10 day interval, allowing the users to download only the files they need. For example, the eMODIS NDVI imagery for the month of June 2015 includes NDVI data from June 1st–10th, 6th–15th, 11th–20th, 16th–25th, 21st–30th, and 26th–July 5th (Zhumanova et al. 2018). In this study 21st to 30th day interval of eMODIS NDVI imagery were taken for analysis purpose for the growing season of crops.

Monthly rainfall data recorded for 17 years were collected from Ethiopian National Meteorological Service Agency. Rainfall data was used to analyze relation between NDVI with variability of rainfall to drive standard precipitation index (SPI). In addition seasonal rainfall map was prepared from latitude/longitude files of those stations (Table 1 and Fig. 2). To validate rainfall and satellite derived indices agricultural production yield data was collected from Waghimra Zone Agricultural office from the period 2000 to 2016.

Location of weather station in Waghimra Zone Ethiopia

Data processing and analysis

One weekly or 10 day’s composite eMODIS data sets include NDVI, quality, acquisition image, and acquisition table and metadata files. In this study, NDVI and quality data has been used to calculate NDVI metrics. Quality files have been used to get the reliability of eMODIS NDVI image product which is computed in ArcGIS 10.5 spatial analysis tool (Eq. 1).

where, reliable NDVI = reliable NDVI image which have values range from 0 to 10,000, QC = quality image which have values from 0 to 10 where 0 is good values and 10 is fill values, NDVI is image which have values ranges from − 2000 to 10,000 where − 2000 is fill values and − 1999 to 10,000 is valid range. After applying scale factor (the scale factor is 0.0001) NDVI values range from − 0.2 to1.0 where valid/normal valid or normal NDVI ranges from 0.0 to 0.1 (Zhu et al. 2013) (Eq. 2).

Time series NDVI variation was derived from the calculation of NDVI using the eMODIS NDVI data set for the year 2000 to 2016 and also used to generate the maximum, minimum and average NDVI values of each season for the year 2000 to 2016 using ArcGIS 10.5 environment spatial analysis tool. Based on the threshold value Vegetation Condition Index was computed. To determine average value of monthly and seasonal composites of NDVI values, float (math) and cell statistics toolset of ArcGIS 10.5 were applied.

Vegetation condition index (VCI)

Normalize Different Vegetation Index (NDVI) has been extensively used in the past for vegetation monitoring it is often very difficult to interpret in relation to vegetation condition, especially when comparing different ecosystems. The vegetation condition index reflects the overall effect of rainfall, soil moisture, weather and agricultural practices (Kogan 1995). To compare the current NDVI with historical Vegetation Condition Index was used (Liu and Kogan 1996). Accordingly in areas like Waghimra which have different ecosystems and non-homogenous topography VCI is important for one to compare the weather impact in areas with different ecological and economical resources, since the index captures rainfall dynamics better than the NDVI particularly in geographically non homogeneous areas.

The VCI has been used to estimate the climate impact on vegetation. This index is most useful during the growing season because it is a measure of vegetation vigor. When the vegetation is dormant (not in the summer season), the VCI cannot be used to measure moisture stress or drought. In different parts of the world Vegetation Condition Index has been extensively used to monitor vegetation conditions (Bhuiyan et al. 2006 Winkler et al. 2017 Demisse et al. 2018 Tadesse et al. 2014). Anything that stresses the vegetation including insects, disease, and lack of nutrients will result in decreases in plant growth and therefore lower VCI values. Also, areas that have significant irrigation may not respond to precipitation deficiencies (Quiring and Papakryiakou 2003). As shown in Eq. (3) Vegetation condition index normalize NDVI on pixel by pixel basis scaling between the maximum and minimum value of NDVI (Liou and Mulualem 2019). For each monthly and seasonal NDVI image, VCI will be processed from 2000 to 2016 using the ArcGIS raster calculator (Eq. 3).

where, NDVImax and NDVImin are calculated from the long-term record for that month, and j is the index of the current month in ArcGIS cell statistics. VCI value is being measured in percentage ranging from 1 to 100 reflecting change in vegetation condition from extremely low to high VCI (Liu and Kogan 1996). The VCI values between 50 and 100% indicates slight or optimal/normal conditions whereas VCI values close to zero percent reflects an extreme dry season (Thenkabail et al 2004).The VCI was reclassified into five clusters (Table 2).

Standardized precipitation index (SPI)

Standard precipitation index, developed by Mckee et al. (1993) is the most widely used index for calibrating the magnitude and duration of drought events. SPI is used to examine the severity and spatial patterns of drought distribution in a given region (Guttman 1998 and Wattanakij et al. 2006). Guttman (1998) has made comparison of Palmers Drought Severity Index (PDSI) and SPI, and recommend SPI as drought index, as it is easy to determine and has greater spatial consistence. It has been used in many studies to determine the frequency of precipitation distribution like the effect of the time scales on the drought parameters, and the spatial classification of drought patterns (Edossa et al. 2010 Hayes et al. 2011 Gebrehiwot et al. 2011 Mohammed et al. 2018). In this study the SPI values at two time-scales, (three months SPI-3) was computed. Seasonal rainfall data have been used as an input to compute the SPI for the periods 2000–2016. Spatial distribution of meteorological drought was prepared from latitude/longitude files of those stations (Table 1 and Fig. 2).

The software which automatically calculates SPI value by using observed monthly rainfall data to detect historical drought at 1, 3, 6, 9, 12, 36 and 48 months ‘ time scale. It is freely available at (https://drought.unl.edu/droughtmonitoring/SPI/SPI Program.aspx) website.

Mathematically SPI is calculated based on following empirical formula (Eq. 4)

where, (Xij = is the seasonal precipitation and, Xim is its long-term seasonal mean and σ is its standard deviation). SPI results computed from seasonal rainfall data were assigned to each grid cell of the study area and reclassified based on drought severity classes (Table 3). Positive SPI values indicate the rainfall is greater than median rainfall and negative values indicate less than median rainfall. SPI values of meteorological stations have been spatially interpolated using inverse distance weight of ArcGIS spatial analysis tool box to create drought severity map of study area at multiple time scale.

Drought frequency analysis

In this study the seasonal frequency maps derived from agricultural and metrological drought indices were reclassified into common scale based on the frequency of drought occurrence. To generate drought frequency map, each drought indices have been reclassified in to binary images for each of the drought severity class. Those maps are added to obtain the frequency of slight, moderate, severe and very severe drought occurrence at each pixel level for both agricultural and meteorological drought. The resultant severity maps were then added to get agricultural and meteorological drought risk maps. The probability of drought occurrence in a given area can be classified into high, moderate and low drought probability zones when drought occurs in more than 50%, 30 to 50%and less than 30%of the years, respectively (Lemma 1996). Based on these criteria, the frequency maps of each drought classes are reclassified into five classes based on the frequency of drought occurrence in study periods: 0–2 classified as no drought 3–4 as slight drought 5–8 as moderate drought 9–13 as severe drought 13–16 as very severe drought. Finally, maps from agricultural and meteorological drought frequency maps were weighted according to the percentage of influence, and then combined using weighted overly analysis (Fig. 3).


Schau das Video: NDVI in ArcGIS