IBM und das Marshall Space Flight Center der NASA kündigten eine Zusammenarbeit an, um die Technologie der künstlichen Intelligenz (KI) von IBM zu nutzen, um neue Erkenntnisse aus dem riesigen Fundus an Erd- und Geowissenschaftsdaten der NASA zu gewinnen. Im Rahmen der gemeinsamen Arbeit wird die KI-Foundation-Model-Technologie zum ersten Mal auf die Daten der NASA-Satelliten zur Erdbeobachtung angewendet. Basismodelle sind eine Art von KI-Modellen, die auf einem breiten Satz von unbeschrifteten Daten trainiert werden, für verschiedene Aufgaben verwendet werden können und Informationen über eine Situation auf eine andere anwenden können.

Diese Modelle haben den Bereich der natürlichen Sprachverarbeitung (NLP) in den letzten fünf Jahren rasant vorangebracht, und IBM leistet Pionierarbeit bei der Anwendung von Basismodellen über die Sprache hinaus. Erdbeobachtungen, die es Wissenschaftlern ermöglichen, unseren Planeten zu studieren und zu überwachen, werden in nie dagewesener Geschwindigkeit und Menge gesammelt. Neue und innovative Ansätze sind erforderlich, um Wissen aus diesen riesigen Datenbeständen zu gewinnen.

Ziel dieser Arbeit ist es, Forschern eine einfachere Möglichkeit zu bieten, diese großen Datensätze zu analysieren und Erkenntnisse daraus zu ziehen. Die IBM Foundation Model Technologie hat das Potenzial, die Entdeckung und Analyse dieser Daten zu beschleunigen, um das wissenschaftliche Verständnis der Erde und die Reaktion auf klimabezogene Probleme schnell voranzutreiben. IBM und die NASA planen die Entwicklung mehrerer neuer Technologien, um Erkenntnisse aus den Erdbeobachtungen zu gewinnen.

Im Rahmen eines Projekts wird ein IBM Geospatial Intelligence Foundation Modell auf dem HLS-Datensatz (Harmonized Landsat Sentinel-2) der NASA trainiert, einer Aufzeichnung von Landbedeckung und Landnutzungsänderungen, die von Satelliten in der Erdumlaufbahn erfasst werden. Durch die Analyse von Petabytes an Satellitendaten zur Identifizierung von Veränderungen im geografischen Fußabdruck von Phänomenen wie Naturkatastrophen, zyklischen Ernteerträgen und Lebensräumen von Wildtieren wird diese grundlegende Modelltechnologie Forschern helfen, kritische Analysen der Umweltsysteme unseres Planeten zu erstellen. Ein weiteres Ergebnis dieser Zusammenarbeit soll ein leicht durchsuchbarer Korpus an geowissenschaftlicher Literatur sein. IBM hat ein NLP-Modell entwickelt, das auf fast 300.000 geowissenschaftliche Zeitschriftenartikel trainiert wurde, um die Literatur zu organisieren und die Suche nach neuem Wissen zu erleichtern.

Das vollständig trainierte Modell enthält eine der größten KI-Workloads, die bisher auf der OpenShift-Software von Red Hat trainiert wurden, und verwendet PrimeQA, das mehrsprachige Open-Source-System von IBM zur Beantwortung von Fragen. Das neue Sprachmodell für die Geowissenschaften könnte nicht nur Forschern als Ressource dienen, sondern auch in die Prozesse der NASA für das wissenschaftliche Datenmanagement und die Verwaltung der Daten einfließen. Zu den weiteren potenziellen gemeinsamen Projekten von IBM und NASA im Rahmen dieser Vereinbarung gehört die Erstellung eines Grundlagenmodells für Wetter- und Klimavorhersagen unter Verwendung von MERRA-2, einem Datensatz mit atmosphärischen Beobachtungen.

Diese Zusammenarbeit ist Teil der Open-Source-Wissenschaftsinitiative der NASA, die sich zum Ziel gesetzt hat, in den nächsten zehn Jahren eine integrative, transparente und kollaborative offene Wissenschaftsgemeinschaft aufzubauen.