Zum Inhalt springen

Machine Learning und Modelltraining

Pl@ntNet ist eine kollaborative Anwendung zur Pflanzenbestimmung, die von Millionen Menschen weltweit genutzt wird. Künstliche Intelligenz (KI), genauer gesagt Deep Learning, ist das Herzstück von Pl@ntNet.

Das Prinzip von Deep Learning und Bildern

Deep Learning ist ein Zweig der künstlichen Intelligenz, bei dem „neuronale Netze“ lernen, Muster in Daten zu erkennen, hier in Bildern. Durch die Analyse von Millionen von Pflanzenfotos kann ein Computermodell lernen, Arten anhand ihrer visuellen Merkmale zu unterscheiden: Blattform, Blütenfarbe usw.

Pl@ntNet stützt sich auf Millionen von Bildern, die von Nutzern und Experten gesammelt wurden. Diese Fotos werden sortiert, validiert und organisiert, um Deep-Learning-Modelle zu trainieren. Je mehr Bilder und Vielfalt vorhanden sind, desto genauer wird das Modell!

Die jüngsten Fortschritte dank fortschrittlicher Modelle

Heute verwendet Pl@ntNet eine Spitzentechnologie namens Vision Transformer (ViT). Diese Modelle, wie das aus DINOv2, ermöglichen es, die großen Mengen verfügbarer Bilder zu nutzen und gleichzeitig die Erkennung seltener oder wenig fotografierter Pflanzen zu verbessern.

Das Modell wird nicht nur mit von der Community bereitgestellten Fotos trainiert, sondern auch mit sehr spezifischen Testbildern bewertet. Diese Bilder, die oft von Experten stammen und nicht online zugänglich sind, dienen dazu, die Zuverlässigkeit des Systems auch bei schwer zu identifizierenden Pflanzen zu gewährleisten.

Die Bedeutung von Herausforderungen und Tests

Pl@ntNet veranstaltet jährlich den PlantCLEF-Wettbewerb, eine Veranstaltung, bei der Forscher und Ingenieure die neuesten Fortschritte in der Pflanzenbestimmung testen. Diese Wettbewerbe ermöglichen den Vergleich verschiedener Ansätze und die Verbesserung der Modellleistung. Beispielsweise zeigte der PlantCLEF2022, eine Herausforderung basierend auf 4 Millionen Bildern, dass neue Architekturen wie Vision Transformers ältere Systeme auf Basis konvolutioneller neuronaler Netze übertreffen.

Intern führt Pl@ntNet auch strenge Tests durch. „Geschützte“ Bildmengen, die aufgrund ihrer Qualität und Seltenheit ausgewählt wurden, ermöglichen es zu überprüfen, ob das Modell komplexe oder unterrepräsentierte Arten korrekt erkennt.

Warum das alles wichtig ist

Dank dieser Fortschritte ist Pl@ntNet nicht nur ein praktisches Werkzeug für Botanikliebhaber. Es trägt zum Schutz der Artenvielfalt bei, indem es hilft, Pflanzen weltweit zu dokumentieren. Jedes geteilte Foto erweitert die Datenbank und stärkt die Fähigkeiten des Modells, wodurch eine positive Rückkopplungsschleife für Wissenschaft und Natur entsteht.

Mit dieser Technologie kann jeder dazu beitragen, die Pflanzen in unserer Umgebung besser kennenzulernen und zu schützen!