Her gün üzerinden geçtiğimiz yollar, çoğu zaman fark etmediğimiz küçük izlerle yaşlanır. Asfaltın üzerinde beliren ince bir çatlak, birkaç ay içinde daha büyük bir yarığa dönüşebilir; yağmur suyunun içine dolduğu küçük bir bozulma, zamanla çukura evrilebilir. Bu kusurlar yalnızca sürüş konforunu azaltmaz; araç hasarlarına, trafik kazalarına, bakım maliyetlerinin artmasına ve hatta can güvenliğini tehdit eden durumlara yol açabilir. Bu nedenle yolların düzenli olarak izlenmesi, modern şehircilik ve ulaşım yönetiminin en kritik konularından biridir.

Geleneksel yöntemlerde yol kusurlarının tespiti çoğunlukla insan gözlemine dayanır. Görevliler sahaya çıkar, belirli güzergâhları kontrol eder, çatlakları, yamaları, çukurları ve bozulmaları kaydeder. Ancak bu süreç hem zaman alıcıdır hem de hataya açıktır. Uzun yol ağları düşünüldüğünde, her noktayı düzenli ve aynı hassasiyetle denetlemek neredeyse imkânsızdır. Üstelik kusurların bazıları ışık, gölge, yol çizgisi, araç izi ya da asfalt dokusu nedeniyle çıplak gözle kolayca ayırt edilemeyebilir. İşte bu noktada bilgisayarlı görü ve derin öğrenme, yolların “görmesini” sağlayan yeni bir teknolojik kapı açar.

Son yıllarda yapay zekâ, özellikle görüntülerden nesne tespiti konusunda büyük ilerleme kaydetti. Bir fotoğraftaki insanı, aracı, trafik levhasını ya da yüzey kusurunu tanımak artık yalnızca laboratuvar deneyi değil; gerçek dünyada kullanılabilir bir mühendislik çözümüdür. Yol kusuru tespitinde de benzer bir yaklaşım uygulanır: Kamera ile elde edilen yol görüntüleri yapay zekâ modeline verilir, model görüntüde çatlak, çukur, timsah sırtı çatlak, enine çatlak ya da yama gibi kusurları bulmaya çalışır. Üstelik yalnızca “kusur var” demekle kalmaz; kusurun görüntü üzerindeki konumunu bir kutu ile işaretler.

Bu alanda öne çıkan modellerden biri YOLO ailesidir. “You Only Look Once” ifadesinin kısaltması olan YOLO, görüntüye tek seferde bakarak nesneleri tespit eden hızlı bir derin öğrenme yaklaşımıdır. Hız, yol kusuru tespiti için özellikle önemlidir; çünkü gerçek bir uygulamada kamera bir araca, belediye denetim sistemine veya mobil bir cihaza takılabilir. Böyle bir sistemin yalnızca doğru değil, aynı zamanda hızlı çalışması gerekir. Yavaş bir model laboratuvar ortamında başarılı görünse bile, gerçek zamanlı yol taramasında yetersiz kalabilir.

Firdevs Ilgaz’ın çalışmasının amacı, kara yolu yüzeylerindeki kusurları YOLO tabanlı modellerle tespit etmek ve modelin hem doğruluğunu hem de kullanılabilirliğini artırmaktır. Bunun için YOLOv8 mimarisi temel alınmış, ancak modelin “omurga” adı verilen özellik çıkarım bölümü değiştirilmiştir. Derin öğrenme modellerinde omurga, görüntüden anlamlı özellikleri çıkaran kısımdır. Bir insanın çatlağı fark ederken çizgi, gölge, kenar ve yüzey dokusu gibi ipuçlarını bir araya getirmesi gibi, modelin omurgası da görüntüden bu tür ayırt edici bilgileri öğrenir.

Çalışmada YOLOv8’in omurga yapısı, mobil cihazlar ve gömülü sistemler için geliştirilen MobileNetV3 tabanlı daha hafif bir yapı ile özelleştirilmiştir. Bu tercih önemlidir; çünkü yol kusuru tespit sistemlerinin gelecekte yalnızca güçlü sunucularda değil, araç üstü kameralarda, düşük güç tüketimli cihazlarda veya sahada çalışan taşınabilir sistemlerde de kullanılabilmesi beklenir. Daha hafif bir model, daha az işlem yükü ve daha düşük enerji tüketimi anlamına gelir. Ancak burada kritik bir denge vardır: Model hafifledikçe hız kazanabilir, fakat doğruluk kaybı yaşanabilir. Temel sorulardan biri de bu dengenin nasıl kurulabileceğidir.

Deneylerde iki açık kaynaklı veri seti kullanılmıştır: RDD2022 ve SVRDD. RDD2022, farklı ülkelerden elde edilen yol görüntülerini içerir ve uzunlamasına çatlak, enine çatlak, timsah çatlağı ve çukur gibi sınıfları barındırır. Bu veri setinin çok ülkeli yapısı, yol kusurlarının coğrafyaya, iklime, asfalt tipine ve görüntüleme koşullarına göre değişebildiğini göstermesi bakımından değerlidir. SVRDD ise Baidu Maps üzerinden elde edilen sokak görüntülerinden oluşur ve çatlak türlerinin yanı sıra rögar kapağı, uzunlamasına yama ve enine yama gibi ek sınıfları da içerir. Bu çeşitlilik, modelin yalnızca tek tip kusura değil, farklı yol yüzeyi işaretlerine ve bozulma biçimlerine karşı da sınanmasını sağlar.

Araştırmada yalnızca model eğitimi yapılmamış, transfer öğrenme yöntemi de kullanılmıştır. Transfer öğrenme, daha önce bir veri seti üzerinde öğrenmiş bir modelin, benzer başka bir veri seti üzerinde yeniden eğitilmesi anlamına gelir. Basit bir benzetmeyle, bir mühendisin Japonya’daki yol görüntülerinden çatlakları tanımayı öğrenip daha sonra Türkiye, Çin ya da başka bir ülkedeki yolları daha hızlı anlamaya başlaması gibidir. Model, önceki deneyimini tamamen unutmaz; yeni verilerle bu deneyimi günceller. Bu yöntem, görsel çeşitliliğin yüksek olduğu alanlarda özellikle kullanışlıdır.

Çalışmada performansı artırmak için iki son işleme yöntemi de denenmiştir: Test Time Augmentation (TTA) ve Non-Maximum Suppression (NMS). TTA, test sırasında aynı görüntünün farklı sürümlerini modele göstermeye dayanır. Görüntü yatay çevrilebilir, çözünürlüğü değiştirilebilir ya da farklı biçimlerde yeniden ölçeklenebilir; böylece model aynı kusura farklı açılardan bakmış olur. NMS ise modelin aynı kusur için birden fazla kutu üretmesi durumunda en uygun kutuyu seçmeye yarar. Çünkü yapay zekâ bazen aynı çatlağı birkaç farklı kutu ile işaretleyebilir; bu adım tekrarları azaltır.

Elde edilen sonuçlar, yapay zekâ modellerinde tek bir yöntemin her veri setinde aynı başarıyı garanti etmediğini göstermektedir. SVRDD veri setinde özelleştirilmiş YOLOv8n modeli, transfer öğrenme ve son işleme yöntemleriyle birlikte yüzde 66,8 mAP ve yüzde 67,8 F1 skoruna ulaşmıştır. YOLOv8l sürümünde ise F1 skoru yüzde 68’e kadar çıkmıştır. Bu değerler, modelin farklı kusur türlerini genel olarak dengeli biçimde algılayabildiğine işaret eder. Özellikle rögar kapağı, yama ve bazı çatlak sınıflarında daha güçlü sonuçlar elde edilmiştir.

Buna karşılık RDD2022 veri setinde son işleme yöntemlerinin her zaman avantaj sağlamadığı görülmüştür. Transfer öğrenme uygulanmış YOLOv8l modeli, RDD2022 üzerinde son işleme olmadan yüzde 53 mAP ve yüzde 55 F1 skoru elde ederken; TTA ve NMS eklendiğinde mAP yüzde 51,6’ya, F1 skoru ise yüzde 54,5’e gerilemiştir. Bu bulgu, “daha fazla işlem”in her zaman “daha iyi sonuç” anlamına gelmediğini hatırlatır. Görüntülerin çözünürlüğü, kusurların boyutu, veri setindeki sınıf dağılımı ve arka plan karmaşıklığı, kullanılan yöntemin başarısını doğrudan etkiler.

Çukur sınıfının birçok deneyde daha düşük başarı göstermesi de dikkat çekicidir. Bunun nedeni, çukurların görüntülerde farklı ışık ve gölge koşullarında çok değişken görünmesi olabilir. Bir çukur bazen koyu bir leke gibi, bazen asfalt yaması gibi, bazen de gölgeyle karışmış düzensiz bir yüzey gibi algılanabilir. Çatlaklar ise çoğu durumda çizgisel yapılara sahip oldukları için model tarafından daha tutarlı öğrenilebilir. Timsah çatlağı gibi belirgin desen oluşturan kusurların bazı deneylerde daha başarılı tespit edilmesi de bu nedenle şaşırtıcı değildir.

Bu tür çalışmaların pratik etkisi oldukça geniştir. Belediyeler, karayolları birimleri ve altyapı yöneticileri, yapay zekâ destekli yol tarama sistemleriyle bakım kararlarını daha hızlı verebilir. Kamera takılmış araçlar düzenli olarak şehir içinde dolaşabilir, görüntüler otomatik analiz edilebilir ve hangi bölgede hangi kusurun bulunduğu harita üzerinde işaretlenebilir. Böylece bakım ekipleri yalnızca şikâyet gelen noktalara değil, sistemin erken uyarı verdiği riskli bölgelere de yönlendirilebilir. Bu yaklaşım, bakım maliyetlerini düşürebilir ve küçük kusurlar büyümeden müdahale edilmesini sağlayabilir.

MobileNetV3 tabanlı omurga kullanmak işlem yükünü azaltma potansiyeli taşır; ancak doğruluk kaybı yaşanabileceği için bu değişiklik dikkatle tasarlanmalıdır. Gerçek zamanlı uygulamalarda yalnızca en yüksek doğruluğa sahip modeli seçmek yeterli değildir. Modelin kaç işlem yaptığı, hangi donanımda çalışacağı, saniyede kaç görüntü işleyebileceği ve enerji tüketimi de en az doğruluk kadar önemlidir. Yol kusuru tespiti, bu nedenle yalnızca bir yapay zekâ problemi değil, aynı zamanda bir sistem mühendisliği problemidir.

Gelecek çalışmalar için model mimarisinde yalnızca omurga değil, YOLO’nun boyun ve baş bölümleri de özelleştirilebilir. Farklı dikkat mekanizmaları, daha gelişmiş özellik birleştirme katmanları veya küçük kusurları daha iyi yakalayacak çok ölçekli yapılar denenebilir. Son işleme yöntemlerinde kullanılan parametreler veri setine özel biçimde ayarlanabilir. TTA bazı görüntülerde başarıyı artırırken bazı veri setlerinde düşüşe yol açtığı için, hangi dönüşümün hangi kusur türünde işe yaradığını ayrı incelemek önemlidir. Ayrıca görüntü ön işleme teknikleriyle gölge azaltma, kontrast iyileştirme veya yol yüzeyinin arka plandan ayrıştırılması da model başarısını artırabilir.

Sonuç olarak, yollar artık yalnızca mühendislerin ve bakım ekiplerinin gözleriyle değil, yapay zekânın dikkatli bakışıyla da izlenebilir. Bir çatlağın erken fark edilmesi, yalnızca asfaltın onarılması anlamına gelmez; daha güvenli yolculuklar, daha düşük bakım maliyetleri ve daha akıllı şehirler anlamına gelir. Bu çalışma, bu hedefe giden yolda önemli bir deneysel katkı sunmaktadır. YOLO tabanlı modellerin yol kusuru tespitinde kullanılabilir olduğunu; ancak veri seti, model mimarisi, transfer öğrenme ve son işleme adımlarının birlikte değerlendirilmesi gerektiğini göstermektedir. Yapay zekâ yolların yüzeyindeki sessiz işaretleri okumayı öğrenirken, ulaşım altyapısının geleceği de daha öngörülebilir ve daha güvenli hale gelebilir.

Mehmet Göktürk

Kaynak: Ilgaz, Firdevs. Karayollarında Bulunan Kusurların Yapay Zeka Teknikleri Kullanılarak Tespiti. Yüksek lisans tezi, Konya Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği, 2026.