Definition

Maschinelles Sehen (Machine Vision)

Was ist maschinelles Sehen (Machine Vision)?

Maschinelles Sehen (Machine Vision) ist die Fähigkeit eines Computers, zu sehen. Dazu werden eine oder mehrere Videokameras, Analog-Digital-Wandler und digitale Signalverarbeitung eingesetzt. Die dabei erzeugten Daten werden an einen Computer oder eine Robotersteuerung weitergeleitet. Maschinelles Sehen ist ähnlich komplex wie Spracherkennung.

Die Technologie wird oft mit künstlicher Intelligenz (KI), maschinellem Lernen und Deep Learning kombiniert, um die Bildverarbeitung zu beschleunigen.

Wie funktioniert maschinelles Sehen?

Maschinelles Sehen verwendet Kameras, um visuelle Informationen aus der Umgebung zu erfassen. Anschließend werden die Bilder mit einer Kombination aus Hardware sowie Software verarbeitet und die Informationen für die Verwendung in verschiedenen Anwendungen aufbereitet. Die Technologie des maschinellen Sehens verwendet häufig eine spezielle Optik, um Bilder zu erfassen. Auf diese Weise können bestimmte Merkmale des Bildes verarbeitet, analysiert und gemessen werden.

Eine Bildverarbeitungsanwendung als Teil eines Fertigungssystems kann zum Beispiel dazu verwendet werden, ein bestimmtes Merkmal eines Teils zu analysieren, das auf einem Fließband gefertigt wird. So kann festgestellt werden, ob das Teil den Qualitätskriterien entspricht und, falls nicht, entsorgt werden.

In der Fertigung benötigen Bildverarbeitungssysteme in der Regel folgende Elemente:

  • Beleuchtung. Die Beleuchtung bestrahlt das Objekt oder die Szene, um deren Merkmale sichtbar zu machen.
  • Objektiv. Dieses fängt das Bild ein und gibt es als Licht an den Sensor in der Kamera weiter.
  • Capture Board, Framegrabber oder Sensor. Diese Geräte arbeiten zusammen, um das Bild von der Kamera zu verarbeiten und es in ein digitales Format als Pixel umzuwandeln. Bildsensoren wandeln Licht in elektrische Signale um, indem sie entweder die komplementäre Metalloxid-Halbleitertechnologie oder ein ladungsgekoppeltes Gerät verwenden.
  • Prozessor. Auf dem Prozessor laufen Software und entsprechende Algorithmen, die das digitale Bild verarbeiten und die erforderlichen Informationen extrahieren.
  • Kommunikation. Die zugehörigen Systeme ermöglichen es den Bildverarbeitungskameras und dem Verarbeitungssystem, mit anderen Elementen des größeren Systems zu kommunizieren, normalerweise über ein diskretes Eingangs-/Ausgangssignal oder eine serielle Verbindung.
Abbildung 1: Kameras und Sensoren werden verwendet, um Bilder in Form von Licht oder Photonen zu sammeln und in elektrische Signale oder Elektronen umzuwandeln, die in industriellen Anwendungen verarbeitet und verwendet werden können.
Abbildung 1: Kameras und Sensoren werden verwendet, um Bilder in Form von Licht oder Photonen zu sammeln und in elektrische Signale oder Elektronen umzuwandeln, die in industriellen Anwendungen verarbeitet und verwendet werden können.

Es gibt zwei Arten von Kameras, die in der industriellen Bildverarbeitung eingesetzt werden:

  1. Flächenscanner/Flächenkamera. Diese Kameras nehmen Bilder in einem einzigen Bild mit einem rechteckigen Sensor auf. Die Anzahl der Pixel im Sensor entspricht der Breite und Höhe des Bildes. Flächenkameras werden zum Scannen von Objekten verwendet, die in Bezug auf Breite und Höhe gleich groß sind.
  2. Zeilenscanner/Zeilenkamera. Diese Kameras bauen ein Bild Pixel für Pixel auf. Sie eignen sich für die Aufnahme von Objekten in Bewegung oder mit unregelmäßigen Größen. Der Sensor fährt bei der Aufnahme in einer linearen Bewegung über ein Objekt. Zeilenkameras sind nicht so sehr auf bestimmte Auflösungen beschränkt, wie dies bei Flächenkameras der Fall ist.

Kameraobjektive variieren in ihrer optischen Qualität. Zwei wichtige Spezifikationen in jedem Bildverarbeitungssystem sind die Empfindlichkeit und die Auflösung des Objektivs, welche folgende Merkmale aufweisen:

  • Die Empfindlichkeit ist die Fähigkeit eines Geräts, bei schwachem Licht zu sehen oder schwache Impulse bei unsichtbaren Wellenlängen zu erkennen.
  • Die Auflösung ist das Ausmaß, in dem ein Gerät zwischen Objekten unterscheiden kann.

Im Allgemeinen gilt: Je höher die Auflösung, desto begrenzter ist das Sichtfeld. Empfindlichkeit und Auflösung sind voneinander abhängig. Wenn andere Faktoren konstant sind, verringert eine Erhöhung der Empfindlichkeit die Auflösung und eine Erhöhung der Auflösung die Empfindlichkeit.

Das menschliche Auge ist für elektromagnetische Wellenlängen zwischen 390 und 770 Nanometern empfindlich. Videokameras können für einen viel breiteren Wellenlängenbereich empfindlich sein. Einige Bildverarbeitungssysteme funktionieren bei Infrarot-, Ultraviolett- oder Röntgenwellenlängen.

Binokulares (oder Stereo) maschinelles Sehen erfordert einen Computer mit einem fortschrittlichen Prozessor. Darüber hinaus sind für die Tiefenwahrnehmung hochauflösende Kameras, eine große Menge an RAM und eine KI-Programmierung erforderlich.

Arten des maschinellen Sehens

Bildverarbeitungssysteme können in verschiedenen Dimensionen arbeiten, je nach spezifischen Bedürfnissen und Anforderungen einer bestimmten Anwendung.

Zu den gängigen Arten von Bildverarbeitungssystemen gehören:

  • 2D-Bildverarbeitungssysteme. Dies sind die am weitesten verbreiteten Systeme, die sich bei der Mustererkennung auszeichnen.
  • 3D-Bildverarbeitungssysteme. 3D-Bildverarbeitungssysteme arbeiten in mehreren Dimensionen und bieten eine höhere Genauigkeit für Mess- und Inspektionszwecke.
  • Intelligente kamerabasierte Bildverarbeitungssysteme. Diese Systeme verwenden integrierte Kameras und Software, um eine Vielzahl von Inspektionsaufgaben zu erfüllen.
  • Kompakte Bildverarbeitungssysteme. Diese Systeme sind so konzipiert, dass sie in sich geschlossen sind und sich nahtlos in bestehende Anlagen und Fertigungsprozesse integrieren lassen.
  • PC-basierte Bildverarbeitungssysteme. Durch den Einsatz von Computerverarbeitung und Bildanalyse ermöglichen diese Systeme die Ausführung komplexerer visueller Inspektionsaufgaben.
  • Multispektrale Bildverarbeitung. Als Alternative zur herkömmlichen 2D-Bildgebung werden bei dieser Methode Bilder mit mehreren Wellenlängen aufgenommen.
  • Hyperspektrale Bildgebung. Ähnlich wie bei der multispektralen Bildgebung werden bei der hyperspektralen Bildgebung Bilder mit einer wesentlich größeren Anzahl von Wellenlängen erfasst, was eine detaillierte Analyse der Spektraldaten ermöglicht.
  • Variable Vergrößerungsobjektive. Ausgestattet mit einstellbaren Vergrößerungsstufen bieten diese Objektive mehr Flexibilität bei der Durchführung von Inspektionsaufgaben.

Wie werden Bildverarbeitungssysteme eingesetzt?

Industrielle Bildverarbeitungssysteme werden in einer Reihe von Industrien für verschiedene Aufgaben eingesetzt, darunter:

  • Analyse von elektronischen Bauteilen. Bildverarbeitungssysteme werden bei der Herstellung von Leiterplatten für Aufgaben wie die Inspektion der Lötpaste und die Platzierung von Komponenten eingesetzt.
  • Optische Zeichenerkennung (Optical Character Recognition, OCR). OCR ermöglicht es einem Computer, gedruckten oder handgeschriebenen Text aus Bildern zu extrahieren.
  • Handschrift- und Unterschriftserkennung. Mit diesen Funktionen kann ein Computer Muster in Bildern von Handschriften und Unterschriften erkennen.
  • Objekterkennung. In der Automobilindustrie verwenden selbstfahrende Autos Objekterkennung auf Bildern, die von Kameras aufgenommen wurden, um Hindernisse auf der Straße zu erkennen. Bildverarbeitungssysteme bestimmen auch die Position von Objekten, wie zum Beispiel die richtige Platzierung eines Etiketts auf einer Tablettenflasche.
  • Mustererkennung. Die medizinische Bildanalyse nutzt die Mustererkennung, um Diagnosen auf der Grundlage von Technologien wie Magnetresonanztomographie, Blut- und Gehirnscans zu erstellen.
  • Materialprüfung. Bildverarbeitungsfunktionen in Systemen zur Materialprüfung gewährleisten die Qualitätskontrolle. Maschinelles Sehen prüft auf Fehler, Defekte und Verunreinigungen in einer Reihe von Materialien und Produkten. So können diese Systeme beispielsweise Pillen und Tabletten auf Probleme bei der Herstellung untersuchen.
  • Währungsüberprüfung. Maschinelles Sehen wird zur Analyse von Währungen eingesetzt, um gefälschte Banknoten zu erkennen.
  • Zählen von Artikeln. Dies wird verwendet, um Artikel wie Pillen in einer Packung oder Flaschen in einem Behälter zu zählen.
  • Barcode-Verfolgung. Diese gängige Anwendung nutzt die Fähigkeiten von Bildverarbeitungssystemen, um Barcodes in Echtzeit zu lesen und zu verfolgen.
  • Robotik. Die Verwendung von Kameras für die Roboterführung ist ein schnell wachsender Bereich der industriellen Bildverarbeitung. Sowohl 2D- als auch 3D-Kameras sind wichtig, wenn es darum geht, Roboter anzuweisen, einzelne oder große Komponenten effektiv zu handhaben. Diese Anwendungen bieten eine hohe Investitionsrendite, da sie den Bedarf an körperlicher Arbeit verringern.

Vorteile der maschinellen Bildverarbeitung

Zu den allgemeinen Vorteilen der maschinellen Bildverarbeitung gehören:

  • Beseitigt menschliche Fehler. Obwohl das menschliche Auge beeindruckend ist, ist es nicht vor Fehlern gefeit. Das maschinelle Sehen zeichnet sich bei quantitativen Messungen durch seine Präzision, Konsistenz und Geschwindigkeit aus. Wenn ein Bildverarbeitungssystem beispielsweise in eine Produktionslinie integriert ist, kann es schnell Hunderte oder sogar Tausende von Teilen pro Minute prüfen. Durch den Einsatz hochauflösender Kameras können Bildverarbeitungssysteme winzige Objektdetails erkennen und untersuchen, die dem menschlichen Auge entgehen können. Darüber hinaus eliminiert die maschinelle Bildverarbeitung die Auswirkungen von Ermüdung des Bedieners und individuellen Abweichungen und gewährleistet so konsistente und zuverlässige Inspektionen.
  • Reduziert Ausfallzeiten. Ein Bildverarbeitungssystem schützt vor der Beschädigung von Teilen, indem es die physische Berührung zwischen einem Prüfsystem und den gefertigten Teilen verhindert. Da Verschleiß und Abnutzung bei mechanischen Komponenten ihren Tribut fordern, werden auch die Zeit und die Kosten für Reparaturen gesenkt. Die Maschinen arbeiten schneller, da sie weniger Pflege benötigen, so dass Unternehmen ihre Produktionsfristen konstant und problemlos einhalten können.
  • Senkt die Kosten. Ein Bildverarbeitungssystem kann die Produktionsgeschwindigkeit erhöhen und den Arbeitsaufwand für die Bedienung der Anlagen reduzieren. Es kann auch die Ausschussrate minimieren, so dass weniger Material verschwendet wird, was die Kosten senkt.
  • Verbessert die Sicherheit am Arbeitsplatz. Maschinelles Sehen in Kombination mit KI verbessert die Sicherheit am Arbeitsplatz, indem es den Bedarf an menschlichen Eingriffen während des Herstellungsprozesses minimiert. Bei der Bedienung großer, leistungsstarker Maschinen ist die Wahrscheinlichkeit geringer, dass sich Mitarbeiter verletzen, und ihr Kontakt mit gefährlichen Teilen und Materialien ist ebenfalls begrenzt.
  • Entdeckt Fehler. Die maschinelle Bildverarbeitung kann Unregelmäßigkeiten am Produkt erkennen, zum Beispiel Dellen und Kratzer auf der Oberfläche. Durch die sorgfältige Festlegung von Erkennungsgrenzen wird zwischen akzeptablen und inakzeptablen Fehlern unterschieden.
  • Misst genau. Ein Bildverarbeitungssystem kann bestimmte Punkte auf einem Bild lokalisieren und messen, zum Beispiel Durchmesser, Radius, Abstand und Tiefe. Auf diese Weise lässt sich beispielsweise der Innendurchmesser einer Motorzylinderbohrung oder der Füllstand eines Behälters bestimmen. Diese Informationen können entweder mit 2D- oder 3D-Kameras erfasst werden.
  • Identifiziert Druckfehler. Ein Bildverarbeitungssystem kann Druckanomalien, wie zum Beispiel falsche Farbtöne, fehlerhafte Drucke oder fehlende Buchstaben, leicht erkennen. Das System beginnt mit der Eingabe eines Master- oder Goldbildes, das als Referenz für alle produzierten Komponenten dient. Alle Abweichungen vom Masterbild werden sofort erkannt und zur Korrektur markiert, so dass genaue und hochwertige Drucke gewährleistet sind.

Maschinelles Sehen in der KI

KI wird in der maschinellen Bildverarbeitung eingesetzt, um den Entscheidungsprozess zu beschleunigen. KI kann eine große Menge an Bildern und Dateninformationen verarbeiten, die bisher nur schwer zu erfassen waren.

Beispiele für den Einsatz von KI in der maschinellen Bildverarbeitung sind:

  • KI kann bei der Erkennung von Unterschriften und Zeichen helfen, die ein gewisses Maß an Nuancierung erfordern.
  • In der Fertigung unterstützt KI bei der Objekterkennung und der Materialprüfung, damit Bildverarbeitungssysteme akzeptable Abweichungen in Form und Textur eines Objekts oder Materials erkennen können.
  • In der Qualitätssicherung kann ein KI-gestütztes System akzeptable Anomalien interpretieren, anstatt alles abzulehnen, was nicht starr einer Spezifikation entspricht.

Maschinelles Sehen in der Robotik

Maschinelles Sehen, gepaart mit KI und Deep Learning, erweitert die Rolle von Robotern bei der Ausführung von Aufgaben in der Produktionslinie, wie zum Beispiel beim Kommissionieren, Sortieren, Platzieren und Scannen von Fertigungslinien. Diese Kombination von Technologien ermöglicht auch den Einsatz von Robotern in anderen Umgebungen, wie zum Beispiel in Supermärkten, Krankenhäusern und Restaurants.

Beispiele für den Einsatz von maschinellem Sehen in der Robotik sind:

  • Ein Roboter mit maschinellem Sehen kann durch die Gänge eines Supermarkts navigieren und dabei Bestandsdaten über die Produkte in den Regalen des Geschäfts erfassen. Er scannt Produkte mit RFID-Technologie (Radio Frequency Identification), um einen Barcode zu lesen, und kann Hindernisse in überfüllten Gängen umgehen. Die Amazon Go-Läden verwenden maschinelle Bildverarbeitungssysteme, um den Bestand zu überwachen und abzurechnen, wenn Kunden bereit sind zu bezahlen.
  • Die Bildverarbeitungstechnologie ermöglicht die Automatisierung und die Vernetzung von Prozessabläufen in verschiedenen Anwendungen.
  • Bildverarbeitung macht auch die Zusammenarbeit zwischen Robotern und Menschen effizienter und sicherer. In einem Supermarkt zum Beispiel kann ein Roboter für die Bestandsverwaltung eingesetzt werden, damit die Mitarbeiter mehr Zeit für die Kundenbetreuung haben. Der Roboter kann die Bestände häufiger und mit größerer Genauigkeit prüfen als Menschen. In einem Fließband können Roboter mit maschinellem Sehen gefährliche Materialien analysieren und andere gefährliche Aufgaben ausführen, ohne dass die Arbeiter unsicheren Bedingungen ausgesetzt sind.
  • Die Daten, die Roboter mit maschinellem Sehen sammeln und verwenden, können in der Cloud oder am Rande des Netzwerks verarbeitet werden, was Skalierbarkeit und detaillierte Datenanalysen ermöglicht.

Was ist der Unterschied zwischen maschinellem Sehen und Computer Vision?

In einigen Fällen werden die Begriffe Machine Vision und Computer Vision synonym verwendet. In anderen Fällen wird zwischen ihnen unterschieden.

Maschinelles Sehen wird oft mit industriellen Anwendungen der Fähigkeit eines Computers zu sehen in Verbindung gebracht. Der Begriff Computer Vision wird häufig verwendet, um jede Technologie zu beschreiben, bei der ein Computer mit der Digitalisierung eines Bildes, der Verarbeitung der darin enthaltenen Daten und der Durchführung einer Aktion beauftragt wird.

Eine weitere Unterscheidung, die oft gemacht wird, ist die Verarbeitungsleistung – also der Unterschied zwischen einer Maschine und einem Computer. Ein maschinelles Bildverarbeitungssystem hat in der Regel eine geringere Verarbeitungsleistung und wird in schlanken Produktionsumgebungen (Lean Production) eingesetzt, wo es praktische Aufgaben mit hoher Geschwindigkeit ausführt, um die Daten zu erfassen, die zur Ausführung einer bestimmten Aufgabe erforderlich sind. Qualitätskontrolle, Inspektion von Gegenständen und das Führen von Objekten durch ein Fließband sind häufige Anwendungen von Bildverarbeitungssystemen.

Bildverarbeitungssysteme sammeln so viele Daten wie möglich über Objekte oder Szenen und versuchen, diese vollständig zu verstehen. Das maschinelle Sehen ist besser geeignet, um allgemeine, übertragbare Informationen zu sammeln, die auf eine Vielzahl von Aufgaben angewendet werden können. Sie kann auch ohne Kamera durchgeführt werden, da sich der Begriff auf die Fähigkeit eines Computers beziehen kann, Bilder aus jeder beliebigen Quelle, einschließlich des Internets, zu verarbeiten. Zu den gängigen Anwendungen des maschinellen Sehens gehören selbstfahrende Autos, das Lesen von Barcodes und RFID-Tags und die Inspektion auf Produktfehler.

Diese Definition wurde zuletzt im Dezember 2023 aktualisiert

Erfahren Sie mehr über Softwareentwicklung