Das Histogram of oriented gradients (HOG) ist ein Hilfsmittel zur Merkmalsgewinnung in der Bildverarbeitung. Es wird insbesondere zur Detektion von Personen auf Fotos verwendet.[1] In einer Arbeit bei Udacity wurde im Jahr 2017 auch der Einsatz zur Erkennung von bewegten Kraftfahrzeugen in einem Video demonstriert.[2][3] Zur Objekterkennung ist immer ein Trainingsvorgang erforderlich. Die Größe des Trainingsdatensatzes hat einen Einfluss auf die Qualität der Objekterkennung. Bei HOG benötigt dieses Training deutlich weniger Beispiele und kann deutlich schneller als z. B. bei Haar-Wavelets durchgeführt werden.[4]
Der grundlegende Gedanke ist, dass Aussehen und Form von Objekten innerhalb eines Fotos auch ohne näheres Wissen über die Positionen von Kanten oder Ecken durch die Verteilung der lokalen Intensität oder der Anordnung der Kanten dargestellt werden kann. Daher wird das Bild in Teilbereiche zerlegt und für jeden Teilbereich werden die Orientierungen aller Kanten bestimmt und deren Anzahl als Histogramm gespeichert.
Eine weitere Anwendung ist, dass auf diese Weise die Ähnlichkeit zwischen verschiedenen Bildern bestimmt werden kann – ähnlich wie bei der Scale-invariant feature transform (SIFT).
Robert K. McConnell hat das grundsätzliche Verfahren bereits 1986 in einem Patent beschrieben,[5] bekannt wurde das Konzept und die Bezeichnung „Histogram of oriented gradients“ durch eine Veröffentlichung von Navneet Dalal and Bill Triggs im Jahr 2005,[1] welche zu diesem Zeitpunkt am Institut national de recherche en informatique et en automatique forschten.
Dalal, Navneet; Triggs, Bill. Histograms of oriented gradients for human detection. In: Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005. S. 886–893. doi:10.1109/CVPR.2005.177
↑Patent US4567610A: Method of and apparatus for pattern recognition. Angemeldet am 22. Juli 1982, veröffentlicht am 28. Januar 1986, Anmelder: Wayland Research Inc, Erfinder: Robert K. McConnell.