40 YANGIN VE GÜVENLİK • MAYIS - HAZİRAN / 2026 MAKALE YOLOv10m’in tespit süreci şu şekilde ilerler: İlk olarak, Input aşaması giriş görüntüsünü algoritmanın kabul ettiği standart boyutlara yeniden ölçeklendirir ve normalize eder. Ardından işlenen görüntü, özellik çıkarımı için Backbone katmanına aktarılır çok ölçekli derin özellik haritaları üreterek devam eder. Bu özellik haritaları daha sonra Neck katmanı aracılığıyla birleştirilir (füzyonlanır). Son olarak Head, çok ölçekli özellikleri analiz ederek sınırlayıcı kutu (bounding box) konumlarını ve sınıf tahminlerini üretir ve nihai tespit sonuçlarını oluşturur. 2.2. BoT-SORT’a Genel Bakış BoT-SORT, ByteTrack ve SORT algoritmalarından türetilmiş gelişmiş bir çoklu nesne izleme algoritmasıdır. ByteTrack’in iki aşamalı eşleştirme stratejisini entegre eder; bu strateji, yüksek güvenli ve düşük güvenli tespitleri ilk ve ikinci eşleştirme için ayırarak kaçırılan tespitler ve örtülme (occlusion) problemlerini etkili biçimde ele alır. Ayrıca algoritma, Re-Identification (ReID) ile çıkarılan görünüm özelliklerini ve Kalman filtresiyle elde edilen hareket özelliklerini birleştirerek hedef eşleştirme doğruluğunu artırır. Bunun yanında, Kalman filtresinin durum vektörü optimize edilir ve kamera hareketi telafisi eklenerek izleme doğruluğu önemli ölçüde geliştirilir. BoT-SORT’un temel iş akışı Şekil 2’de gösterilmektedir. Algoritma, öncelikle yüksek güvenli hedefler için ReID modeli kullanarak görünüm özelliklerini çıkarır ve geçmiş iz bilgileri ile kamera hareketi telafi edilmiş mevcut kare verisini kullanarak Kalman filtresi ile yeni yörünge durumlarını tahmin eder. Ardından, Macar (Hungarian) algoritması kullanılarak ilk eşleştirme gerçekleştirilir; bu aşamada hareket bilgisi (IoU tabanlı) ve görünüm özellikleri birlikte kullanılarak mevcut izler güncellenir veya yeni izler başlatılır. Eşleşmeyen izler ve düşük güvenli hedefler, yanlış negatifleri azaltmak amacıyla ikinci bir eşleştirme sürecine tabi tutulur. Sonrasında iz yönetim modülü, uzun süre eşleşmeyen izleri silerken potansiyel olarak geçerli olanları koruyarak izlerin yaşam döngüsünü dinamik şekilde düzenler. Son olarak algoritma; benzersiz hedef kimlikleri, konumlar, sınıflar ve güven skorlarını içeren izleme sonuçlarını üretir ve böylece hassas ve sağlam bir çoklu nesne izleme sağlar. 3. YÖNTEM 3.1. Statik duman ve yangın özelliklerine dayalı olarak YOLOv10m Backbone’unun geliştirilmesi Yangın genellikle yukarı doğru daralan ve aşağı doğru genişleyen, yaklaşık üçgen biçimli bir morfoloji sergilerken; yanma sırasında yayılan duman da benzer şekil özellikleri gösterir. Bu statik geometrik özellikleri yakalamak için deformable convolution (deforme edilebilir evrişim) kullanılabilir. Deformable Convolution [13], geleneksel evrişim çekirdeklerinin sabit örnekleme düzeni sınırlamasını aşarak öğrenilebilir uyarlanabilir ofsetler ekler ve böylece ağın yangın ve duman şekillerindeki geometrik değişimleri modelleme kapasitesini artırır. Geleneksel 2D evrişim iki adımdan oluşur: İlk olarak, giriş özellik haritası x üzerinde düzenli bir ızgara R kullanılarak örnekleme yapılır. Ardından, bu örneklenen değerlerin ağırlıklar w ile çarpılıp toplanmasıyla çıktı elde edilir. Deformable convolution’da ise bu düzenli ızgara R, öğrenilebilir ofset parametreleri Δpn ile genişletilir. Bu sayede model, eğitim sürecinde Δpn parametrelerini optimize ederek düzensiz hedeflerin morfolojik özelliklerini öğrenebilir. Bununla birlikte, deformable convolution’ın da bazı sınırlamaları vardır ve sıfırdan eğitilmesi gereken büyük ölçekli görsel temel modeller için tam anlamıyla uygun değildir. Bu sorunu çözmek amacıyla Wang ve ark. [14], DCN ve DCNv2 üzerine yapılan sistematik iyileştirmelerle DCNv3’ü önermiştir. Ayrılabilir (separable) evrişimden ilham alan DCNv3, evrişim ağırlıklarını derinlik yönlü (depthwise) mgk ve noktasal (point-wise) wg bileşenlerine ayırarak hesaplama verimliliğini önemli ölçüde artırır. Ayrıca Multi-Head Self-Attention (MHSA) yaklaşımından esinlenerek uzamsal toplama sürecini bağımsız parametrelere sahip G gruba bölerek özellik temsil gücünü artırır. Ağ derinliği arttıkça, özellik haritalarının uzamsal boyutları küçülürken daha soyut ve üst düzey anlamsal bilgiler içerir. Düzensiz hedef şekillerini daha iyi yakalayabilmek için bu çalışmada, orijinal backbone’un son aşamasındaki C2f/CIB modülü DCNv3 ile geliştirilmiştir. Özellikle CIB modülü DCNv3 ile değiştirilerek yeniden tasarlanmış bir C2f/Deformable Convolution Block (C2f/ Şekil 3. C2f/DCB Modülü Şekil 4. SEAMFHead
RkJQdWJsaXNoZXIy MTcyMTY=