Intelligenza Artificiale

Computer Vision

Far vedere le macchine: riconoscimento immagini, rilevamento oggetti e modelli visivi. I termini della computer vision spiegati chiaro.

150 termini

Preferiti Vota

A
Affine Transform

Preferiti Vota permalink

Trasformazione affine. Trasformazione che preserva linee parallele tramite rotazione, scala, traslazione e taglio.
Anchor Box

Preferiti Vota permalink

Riquadro di ancoraggio. Riquadro predefinito di forma e dimensione fissa usato come riferimento nel rilevamento.
Average Pooling

Preferiti Vota permalink

Pooling medio. Riduce le feature map sostituendo ogni regione con la media dei suoi valori.
B
Backbone

Preferiti Vota permalink

Rete dorsale. Rete convoluzionale di base che estrae le caratteristiche riutilizzate dai vari task.
Background Subtraction

Preferiti Vota permalink

Sottrazione dello sfondo. Isola gli oggetti in movimento rimuovendo lo sfondo statico di una scena.
Bag of Visual Words

Preferiti Vota permalink

Sacco di parole visive. Rappresentazione che descrive un'immagine come frequenza di caratteristiche locali raggruppate.
Bilateral Filter

Preferiti Vota permalink

Filtro bilaterale. Filtro che riduce il rumore preservando i bordi, pesando i pixel per vicinanza e somiglianza.
Bilinear Interpolation

Preferiti Vota permalink

Interpolazione bilineare. Metodo che stima il valore di un pixel mediando i quattro pixel vicini, usato nel ridimensionamento.
Bundle Adjustment

Preferiti Vota permalink

Aggiustamento dei fasci. Ottimizzazione che affina insieme punti 3D e parametri di camera minimizzando l'errore di proiezione.
C
Camera Calibration

Preferiti Vota permalink

Calibrazione della camera. Stima i parametri interni dell'obiettivo per correggere distorsioni e misurare la scena.
Canny Edge Detector

Preferiti Vota permalink

Rilevatore di Canny. Algoritmo multi-fase che individua bordi netti con soppressione e doppia soglia.
Class Imbalance

Preferiti Vota permalink

Sbilanciamento delle classi. Situazione in cui alcune categorie sono molto più rare di altre nei dati.
Class Token

Preferiti Vota permalink

Token di classe. Vettore speciale aggiunto in un ViT che raccoglie l'informazione per la classificazione finale.
CLIP

Preferiti Vota permalink

Allineamento testo-immagine. Modello che apprende rappresentazioni condivise di immagini e descrizioni testuali.
Closing

Preferiti Vota permalink

Chiusura morfologica. Dilatazione seguita da erosione, utile per colmare piccoli buchi negli oggetti.
Color Histogram

Preferiti Vota permalink

Istogramma dei colori. Distribuzione delle frequenze dei colori in un'immagine, usata per descriverla.
Confidence Threshold

Preferiti Vota permalink

Soglia di confidenza. Valore minimo di sicurezza sotto il quale una predizione viene scartata.
Confusion Matrix

Preferiti Vota permalink

Matrice di confusione. Tabella che confronta classi predette e reali per analizzare gli errori del modello.
Connected Components

Preferiti Vota permalink

Componenti connesse. Etichettatura di regioni di pixel contigui appartenenti allo stesso oggetto.
Contour Detection

Preferiti Vota permalink

Rilevamento di contorni. Individua le curve continue che delimitano gli oggetti in un'immagine binaria.
ConvNeXt

Preferiti Vota permalink

Rete convoluzionale moderna. Architettura che aggiorna le CNN classiche ispirandosi ai vincenti trasformer.
Convolution

Preferiti Vota permalink

Convoluzione. Operazione che fa scorrere un kernel sull'immagine per estrarre caratteristiche locali.
D
Data Annotation

Preferiti Vota permalink

Annotazione dei dati. Processo di etichettatura manuale di immagini per creare dati di addestramento.
Depth Estimation

Preferiti Vota permalink

Stima della profondità. Calcola la distanza di ogni punto della scena dalla telecamera a partire da una o più immagini.
Depthwise Separable Convolution

Preferiti Vota permalink

Convoluzione separabile in profondità. Scompone la convoluzione per ridurre calcolo e parametri, usata in reti leggere.
DETR

Preferiti Vota permalink

Rilevamento con trasformer. Modello end-to-end che vede il rilevamento come predizione diretta di insiemi di oggetti.
Dice Coefficient

Preferiti Vota permalink

Coefficiente di Dice. Metrica di segmentazione che misura la sovrapposizione tra maschera predetta e reale.
Dilated Convolution

Preferiti Vota permalink

Convoluzione dilatata. Convoluzione con kernel espanso che amplia il campo recettivo senza aumentare i parametri.
Dilation

Preferiti Vota permalink

Dilatazione. Operazione morfologica che ingrandisce gli oggetti aggiungendo pixel ai loro bordi.
Disparity Map

Preferiti Vota permalink

Mappa di disparità. Rappresenta lo spostamento tra pixel corrispondenti in una coppia stereo, legato alla profondità.
E
EfficientNet

Preferiti Vota permalink

Rete bilanciata. Architettura che scala in modo coordinato profondità, larghezza e risoluzione.
Epipolar Geometry

Preferiti Vota permalink

Geometria epipolare. Descrive le relazioni geometriche tra due viste della stessa scena.
Erosion

Preferiti Vota permalink

Erosione. Operazione morfologica che assottiglia gli oggetti rimuovendo i pixel sui bordi.
Essential Matrix

Preferiti Vota permalink

Matrice essenziale. Versione calibrata della matrice fondamentale, lega due viste con camera nota.
Extrinsic Parameters

Preferiti Vota permalink

Parametri estrinseci. Posizione e orientamento della camera rispetto al mondo.
F
Fast R-CNN

Preferiti Vota permalink

R-CNN accelerato. Versione che condivide il calcolo convoluzionale su tutta l'immagine per velocizzare il rilevamento.
Faster R-CNN

Preferiti Vota permalink

Rilevatore a due stadi. Introduce una rete di proposta di regioni integrata, eliminando i metodi esterni lenti.
Feature Map

Preferiti Vota permalink

Mappa di caratteristiche. Output di un filtro convoluzionale che evidenzia dove appare una certa caratteristica.
Feature Matching

Preferiti Vota permalink

Corrispondenza di caratteristiche. Associazione di punti chiave tra immagini diverse confrontandone i descrittori.
Feature Pyramid Network

Preferiti Vota permalink

Rete a piramide di caratteristiche. Struttura che combina feature a più scale per rilevare oggetti di dimensioni diverse.
Focal Loss

Preferiti Vota permalink

Focal loss. Funzione di perdita che riduce il peso degli esempi facili per concentrarsi su quelli difficili.
Frame Differencing

Preferiti Vota permalink

Differenza tra fotogrammi. Rileva movimento confrontando pixel di fotogrammi consecutivi.
Fundamental Matrix

Preferiti Vota permalink

Matrice fondamentale. Matrice che descrive la relazione epipolare tra due immagini non calibrate.
G
Gaussian Blur

Preferiti Vota permalink

Sfocatura gaussiana. Filtro che attenua dettagli e rumore mediando i pixel secondo una distribuzione gaussiana.
Gaussian Pyramid

Preferiti Vota permalink

Piramide gaussiana. Piramide ottenuta sfocando e sottocampionando ripetutamente l'immagine.
GrabCut

Preferiti Vota permalink

Segmentazione interattiva. Metodo che separa primo piano e sfondo a partire da un riquadro fornito dall'utente.
Grad-CAM

Preferiti Vota permalink

Grad-CAM. Tecnica che evidenzia le regioni dell'immagine più rilevanti per la decisione di una rete.
Ground Truth Mask

Preferiti Vota permalink

Maschera di riferimento. Segmentazione corretta annotata a mano usata per valutare le predizioni.
H
Hard Negative Mining

Preferiti Vota permalink

Selezione dei negativi difficili. Tecnica che addestra il modello sugli esempi di sfondo più ingannevoli.
Harris Corner Detector

Preferiti Vota permalink

Rilevatore di angoli. Algoritmo che individua punti dove l'intensità varia in più direzioni.
Heatmap

Preferiti Vota permalink

Mappa di calore. Rappresentazione a colori dell'intensità di un valore su una superficie, usata per pose e attenzione.
Histogram Equalization

Preferiti Vota permalink

Equalizzazione dell'istogramma. Tecnica che ridistribuisce le intensità per migliorare il contrasto dell'immagine.
HOG

Preferiti Vota permalink

Istogramma dei gradienti. Descrittore che riassume le direzioni dei gradienti locali, usato per riconoscere forme.
Homography

Preferiti Vota permalink

Omografia. Trasformazione che mappa punti tra due piani, usata per allineare immagini complanari.
Hough Transform

Preferiti Vota permalink

Trasformata di Hough. Metodo che individua forme geometriche come rette e cerchi votando in uno spazio di parametri.
HSV Color Space

Preferiti Vota permalink

Spazio colore HSV. Modello che descrive il colore tramite tonalità, saturazione e valore di luminosità.
Hu Moments

Preferiti Vota permalink

Momenti di Hu. Set di sette descrittori invarianti a traslazione, scala e rotazione per riconoscere forme.
I
Image Classification

Preferiti Vota permalink

Classificazione di immagini. Task che assegna a un'intera immagine una sola etichetta tra categorie predefinite.
Image Denoising

Preferiti Vota permalink

Riduzione del rumore. Rimuove disturbi e granulosità da un'immagine preservandone i dettagli reali.
Image Gradient

Preferiti Vota permalink

Gradiente di immagine. Vettore che indica direzione e intensità della variazione di luminosità in un punto.
Image Kernel

Preferiti Vota permalink

Kernel di immagine. Piccola matrice di pesi applicata in convoluzione per filtrare o trasformare un'immagine.
Image Moments

Preferiti Vota permalink

Momenti dell'immagine. Misure statistiche di una regione usate per calcolarne area, centroide e orientamento.
Image Pyramid

Preferiti Vota permalink

Piramide di immagini. Serie di versioni della stessa immagine a risoluzioni decrescenti, usata per analisi multiscala.
Image Registration

Preferiti Vota permalink

Allineamento di immagini. Sovrappone due o più immagini della stessa scena in un sistema di coordinate comune.
Image Retrieval

Preferiti Vota permalink

Recupero di immagini. Cerca in un archivio le immagini più simili a una query visiva data.
Inception

Preferiti Vota permalink

Modulo Inception. Architettura che applica filtri di dimensioni diverse in parallelo nello stesso livello.
Inpainting

Preferiti Vota permalink

Ricostruzione di aree mancanti. Riempie regioni rovinate o rimosse di un'immagine in modo coerente con il contesto.
Instance Segmentation

Preferiti Vota permalink

Segmentazione di istanze. Identifica e separa singoli oggetti distinti della stessa classe, mascherandoli pixel per pixel.
Intersection over Union Loss

Preferiti Vota permalink

Perdita IoU. Funzione di costo che ottimizza direttamente la sovrapposizione tra riquadri predetti e reali.
Intrinsic Parameters

Preferiti Vota permalink

Parametri intrinseci. Caratteristiche interne della camera come lunghezza focale e centro ottico.
IoU

Preferiti Vota permalink

Intersezione su unione. Metrica che misura la sovrapposizione tra riquadro predetto e riquadro reale.
K
Kalman Filter

Preferiti Vota permalink

Filtro di Kalman. Algoritmo che stima e predice lo stato di un oggetto in movimento riducendo il rumore.
Keypoint Detection

Preferiti Vota permalink

Rilevamento di punti chiave. Localizza punti caratteristici di un oggetto, come articolazioni del corpo o tratti del volto.
L
Laplacian Operator

Preferiti Vota permalink

Operatore laplaciano. Filtro basato sulla derivata seconda che evidenzia bordi e zone di rapida variazione.
Laplacian Pyramid

Preferiti Vota permalink

Piramide laplaciana. Rappresentazione che memorizza i dettagli persi tra i livelli di una piramide gaussiana.
Lens Distortion

Preferiti Vota permalink

Distorsione dell'obiettivo. Deformazione geometrica introdotta dall'ottica, come l'effetto barile o cuscinetto.
LiDAR

Preferiti Vota permalink

LiDAR. Sensore che misura distanze con impulsi laser per produrre nuvole di punti 3D.
M
mAP

Preferiti Vota permalink

Precisione media. Metrica principale del rilevamento, media delle precisioni su classi e soglie di sovrapposizione.
Mask R-CNN

Preferiti Vota permalink

Rilevatore con maschere. Estende Faster R-CNN aggiungendo un ramo che produce maschere di segmentazione per ogni istanza.
Max Pooling

Preferiti Vota permalink

Pooling massimo. Riduce le feature map mantenendo il valore più alto di ogni regione.
Mean Average Precision

Preferiti Vota permalink

Precisione media globale. Sintesi delle prestazioni di rilevamento mediando la precisione su tutte le classi.
Median Filter

Preferiti Vota permalink

Filtro mediano. Filtro che sostituisce ogni pixel con il valore mediano dei vicini, efficace contro il rumore impulsivo.
Mesh

Preferiti Vota permalink

Mesh poligonale. Rappresentazione 3D di superfici tramite vertici, spigoli e facce.
MobileNet

Preferiti Vota permalink

Rete per dispositivi mobili. Architettura leggera ottimizzata per girare su smartphone e dispositivi embedded.
Morphological Operations

Preferiti Vota permalink

Operazioni morfologiche. Trasformazioni come erosione e dilatazione che modificano la forma di regioni binarie.
N
Nearest Neighbor Interpolation

Preferiti Vota permalink

Interpolazione al vicino più prossimo. Ridimensiona copiando il valore del pixel più vicino, veloce ma a blocchi.
NeRF

Preferiti Vota permalink

Campi di radianza neurali. Modello che ricostruisce scene 3D fotorealistiche da immagini per sintetizzare nuove viste.
Non-Maximum Suppression

Preferiti Vota permalink

Soppressione dei non massimi. Tecnica che elimina i riquadri ridondanti mantenendo solo quello con confidenza maggiore.
O
Object Tracking

Preferiti Vota permalink

Inseguimento di oggetti. Segue la posizione di uno o più oggetti attraverso i fotogrammi di un video.
Opening

Preferiti Vota permalink

Apertura morfologica. Erosione seguita da dilatazione, utile per rimuovere piccoli disturbi.
Optical Character Recognition Pipeline

Preferiti Vota permalink

Pipeline OCR. Sequenza di passi che individua, ritaglia e riconosce il testo presente in un'immagine.
Optical Flow

Preferiti Vota permalink

Flusso ottico. Stima il movimento apparente di pixel tra fotogrammi successivi di un video.
Optical Flow Lucas-Kanade

Preferiti Vota permalink

Flusso ottico di Lucas-Kanade. Metodo che stima il movimento di piccoli intorni di pixel assumendolo localmente costante.
ORB

Preferiti Vota permalink

Descrittore efficiente. Combinazione veloce e libera da brevetti di rilevatore di angoli e descrittore binario.
Otsu Thresholding

Preferiti Vota permalink

Sogliatura di Otsu. Metodo che sceglie automaticamente la soglia ottimale massimizzando la separazione tra classi.
P
Padding

Preferiti Vota permalink

Riempimento. Aggiunta di pixel ai bordi dell'immagine per controllare la dimensione dell'output convoluzionale.
Panoptic Segmentation

Preferiti Vota permalink

Segmentazione panottica. Unisce segmentazione semantica e di istanze etichettando ogni pixel sia per classe sia per istanza.
Patch Embedding

Preferiti Vota permalink

Embedding di patch. Conversione delle porzioni di immagine in vettori numerici per i Vision Transformer.
Perspective Transform

Preferiti Vota permalink

Trasformazione prospettica. Modifica un'immagine per correggere o simulare il punto di vista.
Photogrammetry

Preferiti Vota permalink

Fotogrammetria. Tecnica che ricostruisce misure e modelli 3D a partire da fotografie.
Pinhole Camera Model

Preferiti Vota permalink

Modello di camera stenopeica. Modello geometrico ideale che proietta i punti 3D attraverso un singolo foro.
Pixel

Preferiti Vota permalink

Pixel. Unità minima di un'immagine digitale, definita da una posizione e un valore di colore.
Point Cloud

Preferiti Vota permalink

Nuvola di punti. Insieme di punti 3D che rappresenta la superficie di oggetti o scene nello spazio.
Pooling

Preferiti Vota permalink

Sottocampionamento. Operazione che riduce la dimensione delle feature map aggregando valori vicini.
Positional Encoding

Preferiti Vota permalink

Codifica posizionale. Informazione aggiunta agli input per indicare la posizione spaziale delle patch.
Precision-Recall Curve

Preferiti Vota permalink

Curva precisione-richiamo. Grafico che mostra il compromesso tra precisione e capacità di trovare tutti gli oggetti.
PSNR

Preferiti Vota permalink

Rapporto segnale-rumore di picco. Metrica che misura la qualità di un'immagine ricostruita rispetto all'originale.
R
R-CNN

Preferiti Vota permalink

Rilevatore a regioni. Architettura che propone regioni candidate e le classifica con una rete convoluzionale.
RANSAC

Preferiti Vota permalink

Stima robusta. Algoritmo che adatta un modello ai dati ignorando i valori anomali tramite campionamento casuale.
Receptive Field

Preferiti Vota permalink

Campo recettivo. Porzione dell'immagine di ingresso che influenza un singolo valore in una feature map.
Rectification

Preferiti Vota permalink

Rettifica stereo. Allinea due immagini in modo che i punti corrispondenti stiano sulla stessa riga.
Region Growing

Preferiti Vota permalink

Crescita di regioni. Segmentazione che parte da pixel seme e aggrega i vicini simili.
Region of Interest

Preferiti Vota permalink

Regione di interesse. Porzione dell'immagine selezionata per l'analisi mirata.
Region Proposal Network

Preferiti Vota permalink

Rete di proposta regioni. Componente che genera rapidamente riquadri candidati dove cercare oggetti.
ResNet

Preferiti Vota permalink

Rete residua. Architettura con connessioni di salto che permette di addestrare reti molto profonde.
RetinaNet

Preferiti Vota permalink

Rilevatore one-stage. Modello che usa la focal loss per gestire lo sbilanciamento tra sfondo e oggetti.
RGB Channel

Preferiti Vota permalink

Canale RGB. Una delle tre componenti rosso, verde e blu che insieme formano un'immagine a colori.
ROI Align

Preferiti Vota permalink

Allineamento di regione. Versione precisa del ROI pooling che evita arrotondamenti, usata in Mask R-CNN.
ROI Pooling

Preferiti Vota permalink

Pooling di regione. Operazione che estrae feature di dimensione fissa da regioni candidate di varia grandezza.
S
Saliency Map

Preferiti Vota permalink

Mappa di salienza. Visualizzazione delle aree dell'immagine che attirano l'attenzione o influenzano la predizione.
SAM

Preferiti Vota permalink

Segmentazione universale. Modello che produce maschere di qualsiasi oggetto partendo da prompt come punti o riquadri.
Self-Attention

Preferiti Vota permalink

Auto-attenzione. Meccanismo che mette in relazione ogni elemento dell'input con tutti gli altri.
Semantic Segmentation

Preferiti Vota permalink

Segmentazione semantica. Assegna a ogni pixel dell'immagine la classe dell'oggetto a cui appartiene, senza distinguere istanze.
SIFT

Preferiti Vota permalink

Caratteristiche invarianti. Algoritmo che estrae punti chiave robusti a scala e rotazione per il matching tra immagini.
SLIC

Preferiti Vota permalink

Superpixel SLIC. Algoritmo efficiente che genera superpixel regolari raggruppando pixel per colore e posizione.
Sobel Operator

Preferiti Vota permalink

Operatore di Sobel. Filtro che evidenzia i bordi calcolando il gradiente di intensità lungo gli assi.
SSD

Preferiti Vota permalink

Rilevatore single-shot. Predice oggetti e classi in un unico passaggio usando feature map a più scale.
SSIM

Preferiti Vota permalink

Similarità strutturale. Metrica che valuta la qualità percepita confrontando struttura, luminanza e contrasto.
Stereo Vision

Preferiti Vota permalink

Visione stereoscopica. Stima la profondità confrontando due immagini riprese da punti di vista diversi.
Stride

Preferiti Vota permalink

Passo. Numero di pixel di cui il kernel si sposta a ogni applicazione durante la convoluzione.
Structure from Motion

Preferiti Vota permalink

Struttura dal movimento. Ricostruisce geometria 3D e posizioni della camera da una sequenza di immagini.
Super-Resolution

Preferiti Vota permalink

Aumento di risoluzione. Ricostruisce un'immagine ad alta risoluzione a partire da una versione a bassa risoluzione.
Superpixel

Preferiti Vota permalink

Superpixel. Raggruppamento di pixel adiacenti e simili che semplifica l'immagine in regioni coerenti.
SURF

Preferiti Vota permalink

Caratteristiche accelerate. Versione più veloce di SIFT che approssima i calcoli per estrarre descrittori robusti.
Swin Transformer

Preferiti Vota permalink

Trasformer a finestre. Vision Transformer gerarchico che calcola l'attenzione su finestre locali scorrevoli.
T
Template Matching

Preferiti Vota permalink

Confronto con modello. Tecnica che cerca in un'immagine la posizione che meglio corrisponde a un'immagine campione.
Text Detection

Preferiti Vota permalink

Rilevamento del testo. Localizzazione delle aree contenenti testo all'interno di un'immagine.
Thresholding

Preferiti Vota permalink

Sogliatura. Converte un'immagine in binaria separando i pixel sopra e sotto un valore di intensità.
Top-5 Accuracy

Preferiti Vota permalink

Accuratezza top-5. Metrica che considera corretta una predizione se la classe giusta è tra le prime cinque proposte.
Transposed Convolution

Preferiti Vota permalink

Convoluzione trasposta. Operazione che aumenta la risoluzione delle feature map, usata nei decoder.
Triangulation

Preferiti Vota permalink

Triangolazione. Determina la posizione 3D di un punto incrociando le sue proiezioni in più viste.
U
U-Net

Preferiti Vota permalink

Rete a U per segmentazione. Architettura con percorso di compressione ed espansione e connessioni skip, nata in ambito medico.
V
VGG

Preferiti Vota permalink

Rete VGG. Architettura profonda e regolare basata su piccoli kernel convoluzionali impilati.
Vision Transformer

Preferiti Vota permalink

Trasformer per immagini. Architettura che divide l'immagine in patch e le elabora con meccanismi di attenzione.
Visual Odometry

Preferiti Vota permalink

Odometria visiva. Stima il movimento della camera analizzando la sequenza di immagini riprese.
Volumetric Rendering

Preferiti Vota permalink

Rendering volumetrico. Tecnica che genera immagini accumulando colore e densità lungo i raggi nello spazio.
Voxel

Preferiti Vota permalink

Voxel. Equivalente tridimensionale del pixel, rappresenta un valore in una griglia di volume.
W
Watershed

Preferiti Vota permalink

Spartiacque. Algoritmo di segmentazione che tratta l'immagine come un rilievo e separa le regioni come bacini.
Y
YOLO

Preferiti Vota permalink

Rilevatore in tempo reale. Famiglia di modelli che individua oggetti in un solo passaggio sulla rete, molto veloce.
YUV Color Space

Preferiti Vota permalink

Spazio colore YUV. Modello che separa la luminanza dalle informazioni di crominanza, usato nei video.

A

B

C

D

E

F

G

H

I

K

L

M

N

O

P

R

S