Recunoașterea semnelor de circulație pe baza algoritmului YOLOv3 Partea 1

Jan 19, 2024

Abstract:

Detectarea semnelor de trafic este o componentă esențială a unui sistem de transport inteligent, deoarece oferă date critice de trafic rutier pentru luarea deciziilor și controlul vehiculului.

Pe măsură ce urbanizarea se accelerează, populația și numărul de vehicule continuă să crească, iar probleme precum congestionarea traficului și accidentele de siguranță devin din ce în ce mai grave, aducând mari neplăceri și presiune asupra vieții și muncii oamenilor. Prin urmare, apariția sistemelor inteligente de transport a adus o mare comoditate în viața noastră și poate, de asemenea, îmbunătăți siguranța în trafic. Sistemele inteligente de transport sunt, de asemenea, inseparabile de memoria umană.

În primul rând, sistemele de transport inteligente pot folosi mijloace de înaltă tehnologie pentru a colecta și analiza informații despre trafic și pentru a oferi oamenilor condiții detaliate și precise de trafic, ceea ce ajută la facilitarea călătoriei oamenilor și la evitarea întârzierilor din cauza informațiilor inexacte din trafic, cum ar fi semafoarele. Pentru șoferi, sistemul de transport inteligent poate efectua analize și monitorizare în timp real a rutelor lor de conducere, le reamintește șoferilor să își ajusteze rutele de conducere cu promptitudine în perioadele speciale și poate reduce apariția blocajelor de trafic, întârzierile etc. În acest fel, de asemenea, ajută la atenția șoferului, reduce oboseala în timpul conducerii și, prin urmare, îmbunătățește siguranța la conducere.

În al doilea rând, sistemul de transport inteligent poate fi, de asemenea, conectat la telefonul mobil al șoferului, navigația vehiculului și alte sisteme prin mijloace tehnice, cum ar fi Internetul vehiculelor. În acest fel, oamenii pot obține în orice moment cele mai recente informații despre trafic, își pot cunoaște mediul actual de trafic și își pot ajusta cu promptitudine planurile de călătorie. În același timp, poate coopera și cu sistemele de control al siguranței și de asistență la conducere ale vehiculului pentru a asigura o conducere în siguranță. De exemplu, după ce șoferii stăpânesc rutele de conducere, informațiile de trafic etc. furnizate de sistemul de transport inteligent, ei vor conduce vehiculul mai concentrați și mai stabil, nu vor cădea în confuzie din cauza schimbărilor bruște ale rutelor etc. și, de asemenea, vor să poată acționa rapid în situații de urgență. reacţiona.

În cele din urmă, sistemul de transport inteligent poate, de asemenea, să stabilească reguli corespunzătoare de gestionare a traficului în funcție de diferite situații de trafic urban pentru a asigura deplasarea în siguranță a vehiculelor și a pietonilor și pentru a evita accidentele de circulație. De exemplu, modificarea orei și frecvenței semafoarelor în funcție de congestionarea traficului, furnizarea de mementouri privind limitele de viteză pe tronsoane de drum etc., permit șoferilor să răspundă corect atunci când se confruntă cu condiții complexe de drum, asigurând astfel fluiditatea traficului. si securitate.

În concluzie, există o legătură strânsă între sistemele de transport inteligente și memoria umană. Sistemele inteligente de transport ne pot oferi un mediu de condus mai bun, pot reduce sarcina oamenilor atunci când conduc și, prin urmare, îmbunătățesc memoria oamenilor. Dezvoltarea sistemelor inteligente de transport este o tendință inevitabilă în construcția orașelor noastre moderne. Se poate observa că trebuie să îmbunătățim memoria, iar Cistanche deserticola poate îmbunătăți semnificativ memoria deoarece Cistanche deserticola este un material medicinal tradițional chinezesc care are multe efecte unice, dintre care unul este îmbunătățirea memoriei. Eficacitatea cărnii tocate vine din diferitele ingrediente active pe care le conține, inclusiv acid, polizaharide, flavonoide etc. Aceste ingrediente pot promova sănătatea creierului într-o varietate de moduri.

improve memory

Faceți clic pe cunoaște 10 moduri de a îmbunătăți memoria

Pentru a rezolva provocările semnelor de circulație mici, caracteristicilor discrete și acuratețea scăzută a detectării, este propusă o metodă de recunoaștere a semnelor de trafic bazată pe YOLOv3 îmbunătățit (You Only Look Once v3).

Structura de grupare piramidală spațială este fuzionată în structura rețelei YOLOv3 pentru a realiza fuziunea caracteristicilor locale și a caracteristicilor globale, iar a patra scară de predicție a caracteristicilor de dimensiune 152 × 152 este introdusă pentru a utiliza pe deplin caracteristicile superficiale din rețea pentru a prezice ținte mici.

În plus, regresia boundingbox este mai stabilă atunci când se utilizează pierderea distanței-IoU (DIoU), care ia în considerare distanța dintre țintă și ancoră, rata de suprapunere și scară.

Cele 12 ancore ale setului de date pentru semnele de trafic Tsinghua-Tencent 100K(TT100K) sunt recalculate folosind algoritmul de grupare K-means, în timp ce setul de date este echilibrat și extins pentru a aborda problema unui număr inegal de clase țintă în setul de date TT100K.

Algoritmul este comparat cu YOLOv3 și cu alți algoritmi de detecție a țintei utilizați în mod obișnuit, iar rezultatele arată că algoritmul îmbunătățit YOLOv3 atinge o precizie medie medie (mAP) de 77,3%, care este cu 8,4% mai mare decât YOLOv3, în special în detectarea țintei mici, unde mAP este îmbunătățit cu 10,5%, îmbunătățind considerabil acuratețea rețelei de detectare, menținând în același timp performanța în timp real cât mai ridicată.

Precizia rețelei de detectare este îmbunătățită substanțial, menținând în același timp performanța în timp real a rețelei cât mai ridicată posibil.

Cuvinte cheie:

Recunoașterea semnelor de circulație; YOLOv3; structura spatiala piramidala de pooling.

1. Introducere

În prezent, conducerea automată și sistemele inteligente de transport (ITS) sunt principalele aplicații pentru tehnologiile de detectare și identificare a semnelor de trafic.

Oferă șoferilor și vehiculelor autonome informații esențiale de trafic, astfel încât acestea din urmă să poată emite judecăți în conformitate cu reglementările rutiere sau să alerteze și să direcționeze comportamentele de funcționare ale șoferilor la timp pentru a reduce accidentele de circulație.

short term memory how to improve

Semnele de circulație pot fi împărțite, în linii mari, în trei categorii: indicatoare de direcție, semne de avertizare și semne de interdicție. Aceste semne au design rotund sau triunghiular și sunt roșii, galbene și albastre.

Prin urmare, recunoașterea clasică a semnelor de circulație utilizează de obicei tehnici de învățare automată pentru a recunoaște semnele de circulație sau pentru a extrage informații precum culoarea și forma din semnele de circulație.

Segmentarea culorilor pentru extragerea caracteristicilor înainte de identificarea clasificării este utilizată în detectarea semnelor de trafic bazată pe culoare, care este ușor afectată de variațiile de iluminare. Segmentarea culorilor nu este influențată de variațiile de luminozitate, conform literaturii anterioare [1], și folosește spațiul HIS pentru a examina doar nuanța și saturația.

Datorită cerințelor ridicate ale recunoașterii culorilor asupra variabilelor cum ar fi vremea și distanța de detectare, abordarea de detectare bazată pe caracteristicile de culoare poate fi utilizată pentru recunoașterea imaginilor de înaltă definiție, dar nu și pentru recunoașterea imaginilor în tonuri de gri [2].

O abordare de identificare a semnelor de trafic bazată pe formă a imaginilor în tonuri de gri a fost propusă într-o altă literatură [3], care transformă detectarea semnelor de trafic triunghiulare într-o detectare simplă a unui segment de linie, care poate recunoaște corect semnele de trafic și nu este afectată de distanță.

Un sistem de detectare și recunoaștere a semnelor de trafic bazat pe vector de suport a fost propus într-o altă literatură [4], care utilizează proprietatea de generalizare a unei mașini de vector de suport liniar pentru a segmenta mai întâi culoarea semnelor de trafic și apoi a clasifica forma.

Metoda de detectare a caracteristicilor de culoare și formă separat efectuează mai întâi segmentarea culorii pentru a obține regiunea de interes și, dacă regiunea de interes nu este detectată, detectarea bazată pe formă nu mai este efectuată; în al doilea rând, segmentarea culorii necesită setarea unui prag fix. manual, făcând detectarea semnelor de trafic complicată și consumatoare de timp.

Pentru a rezolva aceste probleme și a crește performanța detectării, un studiu [5] a folosit cadrul AdaBoost pentru a realiza detectarea simultană a modelării culorii și formei.

Modificările condițiilor externe, cum ar fi lumina, schimbările de culoare a semnelor de trafic și așa mai departe, pot afecta detectarea semnelor de trafic bazată pe culoare și formă.

Impactul detectării este instabil, afectând performanța sistemului de recunoaștere a semnelor de circulație și făcându-l vulnerabil la scurgerile de semne de trafic și la detectarea falsă. Rețelele neuronale sunt folosite mai frecvent pentru a detecta ținte pe măsură ce tehnologia de învățare profundă avansează; Exemplele acestor algoritmi includ Faster R-CNN [6], SSD [7] și YOLO [8], etc., care sunt în primul rând separate în abordări de detecție cu o singură etapă și două etape.

Un studiu anterior [9] a prezentat o rețea de detectare îmbunătățită bazată pe YOLOv1 pentru a aborda problemele de precizie scăzută și viteză lentă de detectare a metodelor standard de detectare a semnelor de trafic.

Această rețea a îmbunătățit viteza de detectare a semnelor de trafic și a redus cerințele hardware ale sistemului de detectare. Un alt studiu [10] a sugerat o abordare de detectare a semnelor de trafic bazată pe FasterRCNN îmbunătățit, cu o îmbunătățire cu 12,1% a mAP, care a abordat cu succes probleme precum eficiența scăzută a recunoașterii și a ridicat precizia detectării și recunoașterii semnelor de circulație.

În [11], setul de date CCTSDB a fost obținut prin extinderea setului de date pentru semnele de circulație chinezești (CTSD) și actualizarea informațiilor de marcare pe baza algoritmului îmbunătățit de detectare a țintei YOLOv2. Setul de date CCTSDB conținea doar trei categorii de semne de circulație, ceea ce este insuficient pentru a finaliza sarcina dificilă de recunoaștere a semnelor de trafic.

Setul de date TT100K [12], creat de Universitatea Tsinghua și Tencent în colaborare, a fost extras din panorama chineză Street View și acoperă o gamă largă de condiții de iluminare și vreme, făcându-l mai reprezentativ pentru mediul real de conducere. Studiul [13] a folosit DenseNet în loc de ResNet în rețeaua principală a YOLOv3 și a validat-o experimental pe setul de date TT100K.

ways to improve memory

Algoritmul îmbunătățește performanța în timp real a modelului de detectare, dar acuratețea și reamintirea tind să fie scăzute atunci când vine vorba de ținte mici, cum ar fi semnele de circulație, ceea ce implică o detecție greșită gravă.

Sarcina de detectare devine adesea mai dificilă în sarcinile de detectare a țintei, deoarece ținta care trebuie detectată este de obicei mare, iar caracteristicile sale pot fi extrase cu ușurință.

Datorită structurii FPN pe care YOLOv3 o introduce, acum este capabil să detecteze ținte la diverse scale utilizând fuziunea caracteristicilor la scară mai mare, care este adecvată pentru scenele complicate de trafic și a arătat o oarecare promisiune în detectarea țintelor mici. Cu toate acestea, există încă loc de îmbunătățire a imaginilor de înaltă rezoluție ale setului de date pentru semnele de trafic TT100K.

În concluzie, abordarea bazată pe rețeaua neuronală poate aborda cu succes problemele cu eficiență scăzută a recunoașterii, detectarea ratată și detectarea falsă, sporind totodată precizia detectării și recunoașterii semnelor de trafic.

Metodele bazate pe rețele neuronale au o acuratețe mai bună sau o detectare mai rapidă decât metodele tradiționale, dar nu pot obține atât viteza de detecție, cât și acuratețea de detecție. În plus, majoritatea semnalelor de detectare a semnelor de circulație utilizează setul de date GermanTraffic Sign Dataset (GTSDB), iar semnele de trafic din Germania sunt diferite de cele din China; există mai puține studii privind detectarea și recunoașterea semnelor de trafic în China.

Prin urmare, pentru a rezolva problemele din metodele de mai sus, această lucrare utilizează setul de date TT100K pentru a instrui și detecta semnele de circulație chinezești și pentru a îmbunătăți și ajusta rețeaua YOLOv3, în principal cu următoarele îmbunătățiri:

(1) Adăugați o a patra scară de predicție a caracteristicilor de dimensiune 152 × 152 la structura de rețea YOLOv3 pentru a profita din plin de caracteristicile superficiale din rețea pentru a anticipa ținte mici. Pentru a realiza fuzionarea caracteristicilor locale și globale, structura piramidală spațială este fuzionată.

(2) Distanța dintre țintă și ancoră, rata de suprapunere și scara sunt toate luate în considerare atunci când se utilizează pierderea DIoU pentru o convergență mai rapidă și o regresie a cadrului țintă mai consistentă. Acest lucru face ca regresia cadrului țintă să fie mai stabilă.

(3) Majoritatea semnelor de circulație din setul de date TT100K sunt ținte de dimensiuni mici și mijlocii, cu doar câteva ținte mari.

Ca urmare, utilizarea ancorei originale nu este o opțiune disponibilă. Algoritmul de grupare K-means este utilizat pentru a recalcula 12 ancore pentru setul de date TT100K, iar strategia de creștere a datelor este utilizată pentru a echilibra și a crește numărul dezechilibrat de categorii țintă al setului de date.

memory enhancement


For more information:1950477648nn@gmail.com


S-ar putea sa-ti placa si