Kurz & bündig
- Ein neuronales Netzwerk berechnet Pixel-Wahrscheinlichkeiten für Pflanzen. - Daraus lässt sich die Lage einer Kulturreihe bestimmen. - Die Daten der Kulturreihe gelangen in die Gerätesteuerung, welche die Hackkörper entlang der Pflanze steuert.
Beim Reihenhackgerät namens Multihack der Strebel Maschinen AG sind die Hackkörper einzeln breitenverstellbar. Sie passen sich automatisch unterschiedlichen Abständen zwischen den Kulturreihen an. Man kann also vierreihig säen und sechsreihig hacken. Wenn die Anschlussspur nicht exakt den gleichen Abstand hat, gleicht die Hackgerätelenkung die Abweichung aus und hackt immer mit dem gleichen Abstand zur Kulturpflanze. Die mechanischen Einrichtungen für die Breitenverstellung sind ein Meisterwerk. Aber wie kann man die Hackkörper lenken? Die Lenkung des Multihack wäre manuell möglich. Allerdings ist dies bei sechs Reihen, die einzeln gesteuert werden müssten, in der Praxis undenkbar. Thomas Kuhn von der Fachhochschule Nordwestschweiz (FHNW) kennt die Lösung: «Dank der aussergewöhnlichen Präzision der Mechanik ist es möglich, dass wir mit digitalen Systemen die Lenkung automatisieren können.»

Von der klassischen Bildverarbeitung zur KI
Das Hackgerät wird mit einer Software, welche auf Bilddaten basiert, automatisch gesteuert. Das Prinzip der bildbasierten Spurführung ist nicht neu. Bereits seit Jahren werden Pflanzenreihen mithilfe von Kameras erkannt und für die Geräteführung genutzt. Besonders einfach funktioniert dies unter stabilen Bedingungen mit gleichmässigen Pflanzenbeständen, konstanten Lichtverhältnissen und exakt definierten Reihenabständen. In solchen Fällen erkennt die Software die grüne Pflanzenreihe auf dem Bild und berechnet daraus eine Linie als Referenz für die Fahrspur.
Das ist eine klassische, regelbasierte Bildverarbeitung, welche jedoch rasch an ihre Grenzen stösst, sobald die Bedingungen und Anforderungen komplexer werden.
Regelbasierte Software reicht oft nicht aus
«Regelbasierte Systeme funktionieren problemlos, solange die Realität so aussieht, wie sie programmiert wurde. Auf dem Acker ist das aber selten der Fall», sagt Thomas Kuhn. Es ist rasch der Fall, dass etwas nicht mehr der Regel entspricht, zum Beispiel durch ungleichmässige Bestände, wechselnde Lichtverhältnisse, starken Unkrautdruck oder auch Wind, der die Pflanze anders aussehen lässt, wenn sie sich zur Seite neigt. Hier kann nicht direkt mit einem Bild entschieden werden, wo man hackt und wo nicht. Wo die regelbasierte Software nicht mehr ausreicht, kommen künstliche neuronale Netzwerke zum Einsatz. Anstatt feste Regeln vorzugeben (z. B. das ist Mais und alles andere ist nicht Mais), lernen diese Netzwerke anhand von Beispielen, wie eine Kulturreihe bei unterschiedlichen Bedingungen aussehen könnte.
Neuronale Netzwerke erkennen die Wahrscheinlichkeit
Technisch gesehen basiert diese Lösung auf einer kameragestützten KI-Steuerung. Das erwähnte neuronale Netzwerk verarbeitet Bilder nicht direkt, sondern zerlegt das Bild in Zahlen. Dazu wird das Kamerabild in seine einzelnen Pixel zerlegt, die jeweils numerische Werte erhalten. Für jedes dieser Pixel berechnet das Netzwerk Wahrscheinlichkeiten, was sich an seiner Position befindet. Zeigt das Pixel einen Teil der Kulturpflanze, einen Unkrautteil oder einfach Boden? Das Ergebnis ist eine Segmentierung des Bildes, aus der die exakte Lage der Pflanzenreihe abgeleitet wird. «Die KI sieht keine Pflanzen, wie wir sie sehen. Sie sieht Zahlen, aus denen Wahrscheinlichkeiten berechnet werden, die am Ende präzise Entscheidungen ermöglichen», sagt Wissenschaftler Thomas Kuhn.

Trainieren aus Beispielen, die von Hand erzeugt sind
Damit das neuronale Netzwerk funktioniert, muss es vorher trainiert werden. Die Software kann das nicht einfach so. Dazu werden als Erstes auf dem Feld viele Videos gemacht. Aus den Videos wurden Bilder genommen, auf denen die Kulturreihen manuell mit einer Linie markiert worden sind. Diese Markierungen sind die Vorlage (Label). Beim Training vergleicht sich das neuronale Netzwerk mit den manuell erzeugten Vorlagen und passt interne Parameter durch Gewichtung einzelner Bildinformationen solange an, bis die Software die Linie ähnlich über die Maisreihe legt wie die händisch erzeugte Vorgabe. Mit weiteren Vergleichsbildern verbessert die künstliche Intelligenz die Software immer mehr, um Pflanzenreihen korrekt zu erkennen.

«Es ist nicht nötig, dem System unzählige perfekte Einzelsituationen anzutrainieren. Die Vielfalt ist wichtig, damit das System Situationen verallgemeinern kann», sagt Kuhn.
Der grosse Vorteil moderner neuronaler Netzwerke liegt in ihrer Fähigkeit zur Generalisierung. Das heisst, die KI erkennt die Reihe auch in neuen Situationen, wie beispielsweise bei Lücken im Bestand oder bei schräg einfallender Sonne. Nach dem Training kann das System auch neue, bisher unbekannte Bildsituationen interpretieren. Es erkennt die Kulturreihe auch dann, wenn sie teilweise verdeckt ist, ungleichmässig wächst oder von Unkraut umgeben ist.
Das Ergebnis dieser Bildauswertung dient schliesslich als Grundlage für die aktive Lenkung des Hackgeräts. Die berechnete Fahrspur wird zehnmal pro Sekunde an die einzelnen Hackkörper übergeben, die ihre Position kontinuierlich anpassen.
Klassische Verfahren stossen an Grenzen, KI übernimmt
Wer das Hackgerät Multihack sieht, staunt ob der raffinierten Mechanik, da diese gut sichtbar und nachvollziehbar ist. Um die Technik jedoch einzusetzen, braucht es eine Bildverarbeitungssoftware, welche sich selbstständig an die Situationen auf den Bildern anpasst und auch etwas noch nie Gesehenes einordnen kann, weil auf den Bildern nach besonderen Eigenschaften gesucht wird. Das ist nur möglich, weil die Kamera die Bilder digitalisiert. Auf dieser Basis erfolgen datenbasierte Entscheide, die durch KI getroffen werden.
Mit einem menschlichen Gehirn kann die KI allerdings nicht verglichen werden. Es braucht das menschliche Gehirn, welches die Trainingsstruktur erstellt, mit der die KI oder die Algorithmen dann selbstständig trainieren. Es braucht dann aber wieder den Menschen, welcher das Trainingsergebnis überwacht. Komplett selbstständig lernen Algorithmen (noch) nicht.
Eingangssignale werden in eine mathematische Form gebracht
Künstliche neuronale Netze sind mathematische Modelle. Dabei werden beispielsweise Bilder oder Sprache als Eingangssignal in eine mathematische Form gebracht. Aus der mathematischen Form lassen sich anschliessend Entscheide treffen, welche auf Daten basieren. Das neuronale Netz wird mit Übungsbildern trainiert. Es geht im Beispiel des Hackgeräts darum, dass das neuronale Netz auf einem Bild die Pixel so interpretieren kann, dass es in der Lage ist, eine Linie über eine Pflanzenreihe zu legen. Beim Lernen geht es nicht darum, die händische Vorgabe zu kopieren, sondern dieser möglichst nahezukommen, indem Fehler über sehr viele Bilder minimiert werden. Der Mensch gibt die Struktur des Netzes vor und überwacht das Lernen. Die Algorithmen verändern die Parameter im neuronalen Netz autonom auf Basis der Daten, welche der Mensch als Wegweiser erstellt hat. Wenn das Training zu wenig Erfolg bringt, muss der Mensch das Training bei den Daten oder bei der Struktur anpassen. Dies bedeutet: Kann der Fehler über die Trainingsdaten nicht genügend minimiert werden oder ist die Generalisationsfähigkeit des Netzes schlecht, muss der Mensch etwas ändern, damit das Training erfolgreicher verläuft. Quelle: Thomas Kuhn, FHNW (vereinfachte Beschreibung)

