Unter generischer Objektdetektion versteht man die Detektion von Objekten, deren genaue Klasse vorher unbekannt ist.
Dazu bedient man sich im Allgemeinen geometrischer Eigenschaften.
So bestehen viele Objekte aus zusammenhängenden Komponenten, die sich von ihrer Umgebung abheben.

Mithilfe von Stereo-Daten können Objekte auf diese Weise segmentiert werden, indem zuerst die Bodenebene detektiert wird, und anschließend in den 3D-Daten zusammenhängende Komponenten gesucht werden, die gewisse Schwellwerte nicht über- bzw. unterschreiten.
Mehrere solcher Komponenten werden dann anhand verschiedener Ähnlichkeitsmaße zu Objekten zusammengefügt.

Anschließend findet eine Klassifikation der Objekte statt, um ein besseres Verständnis der Szene und der in ihr enthaltenen Objekte zu erhalten.
Ebenfalls werden die Objekte zeitlich getrackt, was besonders bei bewegten Objekten wie Fahrzeugen, Fahrradfahrern und Fußgängern wichtig ist.

 

Beispiel für Generische Objektdetektion