Kenar algılama, dijital bir görüntüde görüntü parlaklığının keskin bir şekilde değiştiği veya daha resmi olarak süreksizliklerin olduğu noktaları tanımlamayı amaçlayan çeşitli yöntemdir. İçerisinde çeşitli matematiksel yöntemleri barındırmakta ve görüntü parlaklığının keskin bir şekilde değiştiği noktalar tipik olarak "kenarlar" adı verilen bir dizi eğri çizgi parçası halinde düzenlenmektedir. Tek boyutlu sinyallerde süreksizlikleri bulmanın aynı problemi, adım tespiti olarak bilinmektedir. Zaman içinde sinyal süreksizliklerini bulma problemi, değişiklik tespiti olarak bilinir. Kenar algılama, görüntü işleme, makine görüşü, bilgisayarla görme ve özellikle özellik algılama ile özellik çıkarma alanlarında temel bir araçtır.[1]
Amaç
Görüntü parlaklığındaki keskin değişiklikleri tespit etmenin amacı, dünyanın özelliklerindeki önemli olayları ve değişiklikleri yakalamaktır. Yani kısaca amaç nesne tespitidir. Bir görüntü oluşturma modeli için oldukça genel varsayımlar ışığında, görüntü parlaklığındaki süreksizliklerin (artıp azalmaların) muhtemelen aşağıdaki maddelere karşılık geldiği gösterilebilir:[2][3]
Derinlikteki süreksizlikler,
yüzey yönelimindeki süreksizlikler,
malzeme özelliklerindeki değişiklikler ve
sahne aydınlatmasındaki farklılıklar.
Bir görüntüye bir kenar detektörü uygulamasının sonucunda, nesnelerin sınırlarına, yüzey işaretlerinin sınırlarına ve ayrıca yüzey yönelimindeki süreksizliklere karşılık gelen eğrileri gösteren bir dizi bağlantılı eğriye yol oluşturulmaktadır. Bu nedenle, bir görüntüye bir kenar algılama algoritması uygulamak, işlenecek veri miktarını önemli ölçüde azaltmaktadır. Ayrıca, bir görüntünün önemli yapısal özelliklerini korurken daha az ilgili olarak kabul edilebilecek bilgileri filtrelemektedir. Kenar saptama adımı başarılı olursa, orijinal görüntüdeki bilgi içeriklerini yorumlamanın sonraki görevi bu nedenle büyük ölçüde basitleştirilebilmektedir. Bununla birlikte, orta düzeyde karmaşıklığa sahip gerçek hayat görüntülerden bu tür ideal kenarları elde etmek her zaman mümkün olmamaktadır.
Önemsiz görüntülerden çıkarılan kenarlar genellikle parçalanma nedeniyle engellenir. Kenar eğrileri birbirine bağlı değildir, eksik kenar bölümlemeleri (segmentleri) ve görüntüdeki ilginç olgulara karşılık gelmeyen yanlış kenarların yanı sıra eksik kenar parçalarının olmadığı anlamına gelir. Bu nedenle görüntü verilerinin yorumlanması sonraki görevi karmakarışık bir hal almaktadır.[4]
Kenar özellikleri
Üç boyutlu bir sahnenin iki boyutlu bir görüntüsünden çıkarılan kenarlar, bakış açısına bağlı veya bağımsız olarak sınıflandırılabilir. Bakış açısından bağımsız bir kenar, tipik olarak, üç boyutlu nesnelerin yüzey işaretleri ve yüzey şekli gibi doğal özelliklerini yansıtmaktadır. Bakış açısına bağlı bir kenar, bakış açısı değiştikçe değişmektedir. Ayrıca tipik olarak birbirini kapatan nesneler gibi sahnenin geometrisini yansıtmaktadır.
Tipik bir kenar, örneğin bir kırmızı renk bloğu ile bir sarı blok arasındaki sınır olabilir. Bir çizgi, değişmeyen bir arka plan üzerindeki farklı bir renkteki az sayıda piksel olabilir. Bu nedenle, genellikle çizginin her iki tarafında bir kenar bulunmaktadır.
Basit bir kenar modeli
Bazı araştırmacılar kenarlarının tespitinin ideal basamaklarla olduğunu düşünse de, doğal görüntülerden elde edilen kenarlar genellikle ideal basamak kenarları değildir. Bunun yerine normalde aşağıdaki etkilerden bir veya birkaçından etkilenirler:
sonlu bir alan derinliği ve sonlu nokta yayılma fonksiyonunun neden olduğu bir odak bulanıklığı,
sıfır yarıçaplı olmayan ışık kaynakları tarafından oluşturulan gölgelerin neden olduğu yarı gölgeli bir bulanıklık ve
düzgün bir nesnede gölgeleme.
Birkaç araştırmacı, pratik uygulamalarda kenar bulanıklığının etkilerini modellemek için ideal adım kenar modelinin en basit uzantısı olarak Gauss düzgünleştirilmiş adım kenarını kullanmaktadır.[5][6]
Böylece, x=0'da tam olarak bir kenarı olan tek boyutlu bir f görüntüsü şu şekilde modellenmektedir:
Kenarın sol tarafında, yoğunluk , sağ tarfındaki yoğunluk ise ile ifade edilmektedir. Ölçek parametresine kenarın bulanıklık ölçeği denir. İdeal olarak bu ölçek parametresi, görüntünün gerçek kenarlarını bozmamak için görüntünün kalitesine göre ayarlanmaktadır.
Önemsiz bir görev mi?
Kenar algılamanın önemsiz bir iş olmadığını göstermek için, aşağıdaki tek boyutlu sinyalde kenarları algılama problemi incelendiğinde daha iyi açıklanmaktadır. Burada sezgisel olarak 4. ve 5. pikseller arasında bir kenar olması gerektiği söylenebilir.
5
7
6
4
152
148
149
Eğer 4. ve 5. pikseller arasındaki yoğunluk farkı daha küçük olsaydı ve komşu pikseller arasındaki yoğunluk farkları daha yüksek olsaydı, piksellere karşılık gelen bölgede bir kenar olması gerektiği kolayca söylenememekteydi. Ayrıca, bu durumun birkaç kenarın olduğu bir durum olduğu iddia edilmektedir.
5
7
6
41
113
148
149
Bu nedenle, iki komşu piksel arasındaki yoğunluk değişiminin ne kadar büyük olması gerektiğine dair belirli bir eşiği kesin olarak belirtmek, bu pikseller arasında bir kenar olması gerektiğini söylemek için her zaman bu kadar rahat olmamaktadır.[5] Aslında, sahnedeki nesneler özellikle basit olmadıkça ve aydınlatma koşulları iyi kontrol edilemedikçe kenar algılamanın önemsiz bir sorun olarak görülmektedir. Örneğin, yandaki kızın görüntüsünden çıkarılan kenarlara bakıldığında sadece istenilen kenarlara ulaşıldığı görülmektedir.
Metodlar
Kenar tespiti için birçok yöntem vardır. Bunların çoğu arama tabanlı ve sıfır geçiş tabanlı olmak üzere iki kategoride gruplandırılabilir. Arama tabanlı yöntemler, önce kenar kuvvetinin bir ölçüsünü hesaplayarak, genellikle gradyan büyüklüğü gibi birinci dereceden türev ifadeyi hesaplamaktadır. Ardından gradyan büyüklüğünün yerel yönlü maksimumunu aramaktadır. Son adımda ise yerel yönelimin hesaplanmış bir tahminini kullanarak kenarları tespit etmektedir. Sıfır geçiş tabanlı yöntemler, genellikle Laplacian filtresinin sıfır geçişlerini veya doğrusal olmayan bir diferansiyel ifadenin sıfır geçişlerini bulmak için görüntüden hesaplanan ikinci dereceden bir türev ifadesinde sıfır geçişlerini aramaktadır. Kenar algılamaya yönelik bir ön işleme adımı olan, Gauss yumuşatma aşaması neredeyse her zaman uygulanmaktadır.
Yayınlanmış olan kenar algılama yöntemleri, esas olarak uygulanan yumuşatma filtrelerinin türleri ve kenar mukavemeti ölçülerinin hesaplanma şekli bakımından farklılık göstermektedir. Birçok kenar algılama yöntemi, görüntü gradyanlarının hesaplanmasına dayandığından, x ve y yönlerinde gradyan tahminlerini hesaplamak için kullanılmaktadır. Bu hesaplamalar filtre türlerinde de farklılık göstermektedir.
Bir dizi farklı kenar algılama yöntemine ilişkin araştırmalar (Ziou ve Tabbone 1998);[7]
Bilgisayar Bilimi ve Mühendisliği Ansiklopedisi'ndeki kenar algılama ile ilgili makaleler.[8]
Matematik Ansiklopedisi'ndeki kenar algılamayla ilgili makaleler.[9]
Canny
John Canny, algılama, lokalizasyon ve tek bir kenara uygulanan çoklu tepkileri en aza indirmek için kriterleri verilen optimal bir yumuşatma filtresin uygulamayı düşünmekteydi[10] Eldeki bilgiler verilen optimal filtrenin dört üstel terimin toplamı olduğunu göstermekteydi. Ayrıca, bu filtrenin gauss filtrelerinin birinci dereceden türevleri tarafından iyi bir şekilde tahmin edilebileceğini de gösterdi. Canny, ayrıca maksimum olmayan bastırma kavramını da tanıttı. Bu kavram, ön yumuşatma filtreleri uygulandığında, kenar noktalarının, gradyan büyüklüğünün gradyan yönünde yerel bir maksimum kabul ettiği noktalar olarak tanımlandığını açıklamaktaydı. Gradyan yönü boyunca 2. türevin sıfır geçişini aramak ilk olarak Haralick tarafından önerilmişti.[11] Bu uygulamayı Marr-Hildreth (Laplacian'ın sıfır geçiş filtresine) kenar dedektörüne bağlayan modern bir geometrik varyasyonel anlam bulmak yaklaşık 20 yıl sürdü. Bu gözlem, Ron Kimmel ve Alfred Bruckstein tarafından sunuldu.[12]
Bu çalışmalar bilgisayarlı görmenin ilk zamanlarında yapılmış olmasına rağmen, Canny kenar dedektörü (varyasyonları dahil) hala son teknoloji bir kenar dedektör olarak bilinmektedir.[13] Canny'den daha iyi performans gösteren kenar dedektörleri genellikle daha uzun hesaplama süreleri veya daha fazla sayıda parametre içremesi gerektirmektedir.
Canny-Deriche detektörü, ayrı bir bakış açısından başlayıp daha sonra üstel filtreler veya Gauss filtreleri yerine görüntü yumuşatma için bir dizi özyinelemeli filtreye yol açmasına rağmen, Canny kenar dedektörü ile benzer matematiksel kriterlerden türetilmiştir.[14]
Diğer birinci dereceden yöntemler
Giriş görüntüsünden veya düzleştirilmiş bir versiyonundan görüntü gradyanlarını tahmin etmek için farklı gradyan operatörleri uygulanmaktadır. En basit yaklaşım, merkezi farklılıkları kullanmaktır:
Aşağıdaki ifadeler, filtre maskelerinin görüntü verilerine uygulanmasına karşılık gelmektedir:
İyi bilinen ve daha önceki Sobel operatörü aşağıdaki filtrelere dayanmaktadır:
Birinci dereceden görüntü türevlerinin bu tür tahminleri göz önüne alındığında, gradyan büyüklüğü şu şekilde hesaplanır:
Gradyan yönü ise aşağıdaki ifade ile bulunmaktadır:
Prewitt, Roberts cross, Kayyali 19 Ocak 2019 tarihinde Wayback Machine sitesinde arşivlendi.[15] e Frei-Chen operatörlerinde görüntünün gradyanını tahmin etmek için diğer birinci dereceden fark operatörleri kullanılmaktadır.
Düşük SNR görüntüsünde kenar tanıma sorununu önlemek için filtre boyutunu genişletmek mümkündür. Bu işlemin maliyeti çözüm açısından kayıp yaratmaktadır.
Eşik oluşturma ve bağlama
Kenar kuvvetinin bir ölçüsünü hesapladıktan sonra, bir görüntü noktasında kenarların bulunup bulunmadığına karar vermek için bir eşik uygulanmaktır. Eşik ne kadar düşükse, o kadar fazla kenar algılanmaktadır. Sonuç olarak ise gürültüye ve görüntüdeki ilgisiz özelliklerin kenarlarını tespit etmeye giderek daha duyarlı hale gelmektedir. Tersine, yüksek bir eşik, ince kenarları kaçırabilir veya parçalanmış kenarlara neden olabilmektedir.
Eşik sadece gradyan büyüklük görüntüsüne uygulanırsa, elde edilen kenarların daha kalın olması beklenmektedir. Bir tür kenar inceltme sonrası işlemene gerek duymaktadır. Maksimum olmayanı bastırma ile tespit edilen kenarlar, kenar eğrileri tanımı gereği ince hale gelmektedir. Kenar pikselleri, bir kenar bağlama (kenar izleme) prosedürü ile kenar poligonuna bağlanabilir. Ayrık bir ızgarada, maksimum olmayanı bastırma aşaması, birinci dereceden türevler kullanılarak gradyan yönünü tahmin etmektedir. Ardından gradyan yönünü 45 derecenin katlarına yuvarlamaktedır. Son olarak tahmini gradyandaki büyüklüğünün değerlerini karşılaştırarak uygulanabilmektedir.
Eşikleme için uygun eşik sorununu halletmek için yaygın olarak kullanılan bir yaklaşım, histerezis ile eşikleme kullanmaktır. Bu yöntem, kenarları bulmak için birden çok eşik kullanır. Bir kenarın başlangıcını bulmak için üst eşiği kullanarak başlıyoruz. Bir başlangıç noktamız olduğunda, alt eşiğin üzerine çıktığımızda bir kenarı işaretleyerek, görüntü pikseli boyunca kenarın yolunu piksel piksel izleriz. Sınırımızı işaretlemeyi yalnızca değer alt eşiğimizin altına düştüğünde durdururuz. Bu yaklaşım, kenarların muhtemelen sürekli eğriler halinde olduğu varsayımını yapar ve görüntüdeki her gürültülü pikselin bir kenar olarak işaretlendiği anlamına gelmeden, daha önce gördüğümüz bir kenarın soluk bir bölümünü izlememize izin verir. Ancak yine de uygun eşikleme parametreleri seçme sorunumuz var ve uygun eşik değerleri görüntü üzerinde değişebilir.
İkinci dereceden yaklaşım methodları
Bazı kenar algılama operatörleri yoğunluğun ikinci dereceden türevlerine dayanmaktadır. Bu yoğunluk gradyanındaki değişim oranını yakalamaktadır. Bu nedenle, ideal sürekli durumda, ikinci türevdeki sıfır geçişlerin tespiti, gradyandaki yerel maksimumları yakalakmatadır.
Eski bir uygulama olan Marr-Hildreth filtresi, Gauss düzgünleştirilmiş bir görüntüye uygulanan Laplacian filtresinin sıfır geçişlerinin saptanmasına dayanmaktadır. Bununla birlikte, bu operatörün gradyan büyüklüğünün yerel minimumlarına karşılık gelen yanlış kenarları da döndüreceğini göstermektedir. Ayrıca, bu operatör kavisli kenarlarda zayıf lokalizasyon verecektir. Bu nedenle, bu operatör bugün esas olarak tarihsel ilgi çekmektedir.
Diferansiyel/ Türev Alma
Alt piksel doğruluğu ile kenarları otomatik olarak algılayan daha rafine bir ikinci dereceden kenar algılama yaklaşımı, gradyan yönünde ikinci dereceden yönlü türevin sıfır geçişlerini algılamak için aşağıdaki diferansiyel yaklaşımı kullanmaktadır:
Lindeberg tarafından önerilen maksimum olmayan bastırma gereksinimini ifade etmenin diferansiyel geometrik yolunda,[5][16] her görüntü noktasına v-yönü gradyan yönüne paralel olan bir yerel koordinat sistemi (u,v) tanıtılmaktadır. Görüntünün Gauss yumuşatma ile önceden yumuşatıldığını ve ölçekte bir ölçek uzayı temsilinin hesaplandığını varsayarsak, birinciye eşit olan ölçek uzayı temsilinin L(x,y;t) gradyan büyüklüğüne ihtiyaç duyulmaktadır. V-yönündeki Lv sert yönlü türev, sıfıra eşit v-yönündeki birinci dereceden yönlü türevine sahip olmalıdır.
v -yönündeki ikinci dereceden Lv yönlü türev negatif olmalıdır, yani:
, cinsinden yazılan yerel kısmi türevler cinsinden açık bir ifade olarak yazılan bu kenar tanımı, diferansiyel değişmezin sıfır geçiş eğrileri olarak ifade edilmektedir.
aşağıdaki diferansiyel değişmezde bir işaret koşulu sağlanmaktadır:
where
orijinal görüntünün bir Gauss çekirdeği ile yumuşatılmasıyla elde edilen bir ölçek uzayı temsilinden L hesaplanan kısmi türevleri belirtilmektedir. Bu şekilde, kenarlar otomatik olarak alt piksel doğruluğu ile sürekli eğriler olarak elde edilmektedir. Histerezis eşikleme, bu diferansiyel ve alt piksel kenar segmentlerine de uygulanmaktadır.
Uygulamada, birinci dereceden türev yaklaşımları, yukarıda açıklandığı gibi merkezi farklarla hesaplanabilirken, ikinci dereceden türevler, aşağıdaki ifadelere göre ölçek alanı temsili L'den hesaplanabilir:
Aşağıdaki ifadeler, filtre maskelerine karşılık gelmektedir.
Üçüncü mertebeden işaret koşulu için daha yüksek mertebeden türevler benzer bir şekilde elde edilmektedirler.
Faz merkezli taban
Kenar algılama tekniklerindeki yeni bir gelişmeye örnek, kenar konumlarını bulmak için bir frekans alanı yaklaşımını benimsemesi verilebilir. Faz uyumu yöntemleri, bir görüntüde frekans alanındaki tüm sinüzoidlerin fazda olduğu yerleri bulmaya çalışmaktadır. Bu konumlar, kenarın uzamsal alandaki yoğunlukta büyük bir değişiklikle temsil edilip edilmediğine bakılmaksızın, genellikle algılanan bir kenarın konumuna karşılık gelmektedir. Bu tekniğin önemli bir faydası, Mach bantlarına güçlü bir şekilde tepki vermesi ve tipik olarak çatı kenarlarında bulunan yanlış pozitiflerden kaçınmasıdır. Bir çatı kenarı, gri seviyeli bir profilin birinci dereceden türevinde bir süreksizlik sağlamaktadır.[17]
Fizikte kenar algılama
Faz gerdirme dönüşümü veya PST, sinyal ve görüntü işlemeye yönelik fizikten ilham alan bir hesaplama yaklaşımıdır. Yardımcı programlarından biri, özellik algılama ve sınıflandırma için kullanılmaktadır.[18][19] PST, zaman uzatmalı dağıtmalı Fourier dönüşümü üzerine yapılan araştırmanın bir yan ürünüdür. PST, tasarlanmış 3B dağılım özelliğine (kırılma indeksi) sahip bir kırınım ortamı aracılığıyla yayılmayı taklit ederek görüntüyü dönüştürmektedir. İşlem, dağılım profilinin simetrisine dayanmaktadır. Ayrıca dağılımın öz fonksiyonları veya gerilme modları açısından anlaşılabilmektedir.[20] Ancak dijital görüntülerde PST, faz kontrast mikroskobu ile benzer işlevleri yerine getirmektedir. PST, dijital görüntülerin yanı sıra zamansal, zaman serileri ve verilere de uygulanmaktadır.
Alt Piksel
Kenar algılamanın kesinliğini artırmak için, eğri uydurma, moment tabanlı,[21][22] yeniden yapılandırma ve kısmi alan etkisi yöntemleri dahil olmak üzere çeşitli alt piksel teknikleri önerilmektedir.[23] Bu yöntemlerin farklı özellikleri mevcuttur. Eğri uydurma yöntemleri hesaplama açısından basittir ancak gürültüden kolayca etkilenmektedir. Moment tabanlı yöntemler, gürültünün etkisini azaltmak için integral tabanlı bir yaklaşım kullanmaktadır. Ancak bazı durumlarda daha fazla hesaplama gerekmektedir. Yeniden yapılandırma yöntemleri, bir eğri oluşturmak ve eğrinin tepe noktasını alt piksel kenarı olarak bulmak için yatay gradyanlar veya dikey gradyanlar kullanmaktadır. Kısmi alan etkisi yöntemleri, her piksel değerinin, o pikselin içindeki kenarın her iki yanındaki alana bağlı olduğu ve her kenar pikseli için doğru bireysel tahmin ürettiği hipotezine dayanmaktadır. Moment tabanlı tekniğin bazı varyantlarının, izole edilmiş kenarlar için en doğru olduğu gösterilmektedir.[22]
^D. Ziou and S. Tabbone (1998) "Edge detection techniques: An overview", International Journal of Pattern Recognition and Image Analysis, 8(4):537–559, 1998
^M. H. Asghari, and B. Jalali, "Edge detection in digital images using dispersive phase stretch," International Journal of Biomedical Imaging, Vol. 2015, Article ID 687819, pp. 1–6 (2015).
^Ghosal, S.; Mehrota, R (1 Ocak 1993). "Orthogonal Moment Operators for Subpixel Edge Detection". Pattern Recognition. 26 (2): 295-306. doi:10.1016/0031-3203(93)90038-X.
^abChristian, John (1 Ocak 2017). "Accurate Planetary Limb Localization for Image-Based Spacecraft Navigation". Journal of Spacecraft and Rockets. 54 (3): 708-730. Bibcode:2017JSpRo..54..708C. doi:10.2514/1.A33692.