Intelligenza Artificiale

NLP e LLM

Il linguaggio naturale per le macchine: NLP, modelli linguistici, token e prompt. I termini di LLM e AI generativa spiegati semplice.

150 termini

Preferiti Vota

A
Adapter

Preferiti Vota permalink

Modulo inserito. Piccolo strato aggiunto dentro il modello e addestrato per specializzarlo su un compito.
ALiBi

Preferiti Vota permalink

Bias di attenzione. Metodo che penalizza linearmente l'attenzione in base alla distanza tra i token.
Analisi lessicale

Preferiti Vota permalink

Studio del lessico. Esame delle unità lessicali di un testo per identificarne forma e funzione di base.
Analisi morfologica

Preferiti Vota permalink

Studio delle forme. Scomposizione delle parole nei loro morfemi per analizzarne radice, prefissi e suffissi.
Attention mask

Preferiti Vota permalink

Maschera di attenzione. Filtro che impedisce a un token di attendere posizioni non consentite come quelle future.
Attention weights

Preferiti Vota permalink

Pesi di attenzione. Coefficienti che indicano quanto ogni token influenza la rappresentazione di un altro.
B
Backtranslation

Preferiti Vota permalink

Retro-traduzione. Metodo di aumento dati che traduce un testo in un'altra lingua e poi di nuovo nella prima.
Bag of Words

Preferiti Vota permalink

Rappresentazione a sacco. Modello che conta le parole ignorando ordine e struttura sintattica del testo.
BART

Preferiti Vota permalink

Autoencoder denoising. Modello seq2seq che impara ricostruendo testo volutamente corrotto in fase di addestramento.
Batch dinamico

Preferiti Vota permalink

Raggruppamento variabile. Composizione di lotti di lunghezza simile per ridurre il riempimento inutile.
Beam search

Preferiti Vota permalink

Ricerca a fascio. Strategia che mantiene più sequenze candidate per trovare un'uscita complessivamente più probabile.
Benchmark linguistico

Preferiti Vota permalink

Banco di prova. Insieme standardizzato di compiti usato per confrontare le prestazioni dei modelli.
BERT

Preferiti Vota permalink

Encoder bidirezionale. Modello che apprende rappresentazioni leggendo il contesto a sinistra e a destra simultaneamente.
BERTScore

Preferiti Vota permalink

Similarità semantica. Metrica che valuta la qualità del testo confrontando embedding contestuali anziché parole esatte.
Bi-encoder

Preferiti Vota permalink

Codifica separata. Modello che vettorizza query e documenti indipendentemente per confronti rapidi su larga scala.
Bias linguistico

Preferiti Vota permalink

Distorsione del linguaggio. Tendenza del modello a riprodurre pregiudizi presenti nei dati di addestramento.
BLEU

Preferiti Vota permalink

Metrica di traduzione. Punteggio che confronta gli n-grammi dell'output con quelli di traduzioni di riferimento.
Byte Pair Encoding (BPE)

Preferiti Vota permalink

Algoritmo di tokenizzazione. Tecnica che fonde iterativamente le coppie di simboli più frequenti per costruire un vocabolario di subword.
C
Calibrazione

Preferiti Vota permalink

Affidabilità della confidenza. Corrispondenza tra la probabilità stimata dal modello e la reale correttezza.
Catastrophic forgetting

Preferiti Vota permalink

Dimenticanza catastrofica. Perdita delle competenze precedenti quando un modello viene riaddestrato su nuovi dati.
Causal masking

Preferiti Vota permalink

Mascheramento causale. Vincolo che permette a ogni token di guardare solo i token precedenti durante la generazione.
CBOW

Preferiti Vota permalink

Predizione del centro. Architettura di Word2Vec che predice una parola a partire dal suo contesto circostante.
Character Error Rate (CER)

Preferiti Vota permalink

Errore a caratteri. Variante del WER calcolata sui singoli caratteri anziché sulle parole.
Chunking

Preferiti Vota permalink

Segmentazione sintattica. Raggruppamento di parole adiacenti in unità non sovrapposte come sintagmi nominali.
Code-switching

Preferiti Vota permalink

Alternanza di codice. Passaggio tra lingue diverse all'interno della stessa frase o conversazione.
Constituency parsing

Preferiti Vota permalink

Analisi a costituenti. Tecnica che scompone una frase in sintagmi annidati secondo una grammatica.
Constrained decoding

Preferiti Vota permalink

Decodifica vincolata. Generazione forzata a rispettare uno schema o una grammatica predefinita.
Context length extension

Preferiti Vota permalink

Estensione del contesto. Tecniche che permettono a un modello di gestire sequenze più lunghe di quelle di addestramento.
Contrastive decoding

Preferiti Vota permalink

Decodifica contrastiva. Tecnica che migliora la qualità confrontando le uscite di un modello forte e uno debole.
Contrastive learning testuale

Preferiti Vota permalink

Apprendimento contrastivo. Addestramento che avvicina coppie simili e allontana coppie diverse nello spazio.
Coreference resolution

Preferiti Vota permalink

Risoluzione dei riferimenti. Identificazione delle espressioni che si riferiscono alla stessa entità in un testo.
Cross-attention

Preferiti Vota permalink

Attenzione incrociata. Meccanismo in cui il decoder attende le rappresentazioni prodotte dall'encoder.
Cross-encoder

Preferiti Vota permalink

Codifica congiunta. Modello che elabora insieme query e documento per stimarne la rilevanza con precisione.
Curriculum learning

Preferiti Vota permalink

Apprendimento graduale. Strategia che presenta esempi dal più semplice al più complesso durante l'addestramento.
D
Data contamination

Preferiti Vota permalink

Contaminazione dei dati. Presenza nei dati di addestramento di esempi del set di test, che falsa la valutazione.
Decoder

Preferiti Vota permalink

Blocco di decodifica. Componente che genera la sequenza di output a partire dalle rappresentazioni e dai token già prodotti.
Dense retrieval

Preferiti Vota permalink

Recupero denso. Ricerca che confronta embedding vettoriali invece di parole chiave esatte.
Dependency parsing

Preferiti Vota permalink

Analisi delle dipendenze. Tecnica che individua i legami grammaticali tra parole costruendo un albero di relazioni.
Detokenizzazione

Preferiti Vota permalink

Ricostruzione del testo. Processo inverso che riassembla i token in stringhe leggibili dall'utente.
Direct Preference Optimization

Preferiti Vota permalink

Ottimizzazione diretta. Metodo che allinea un modello alle preferenze umane senza addestrare un modello di ricompensa separato.
Distillazione della conoscenza

Preferiti Vota permalink

Trasferimento compatto. Tecnica in cui un modello piccolo impara a imitare le uscite di uno più grande.
Document chunking

Preferiti Vota permalink

Spezzettamento documenti. Suddivisione di testi lunghi in frammenti gestibili per indicizzazione e recupero.
E
ELECTRA

Preferiti Vota permalink

Rilevamento di token. Modello pre-addestrato a distinguere token reali da quelli sostituiti da un generatore.
ELMo

Preferiti Vota permalink

Embedding contestuali. Rappresentazioni di parole che cambiano in base alla frase, prodotte da reti ricorrenti profonde.
Embedding semantico

Preferiti Vota permalink

Vettore di significato. Rappresentazione numerica che colloca testi simili vicini in uno spazio multidimensionale.
Encoder

Preferiti Vota permalink

Blocco di codifica. Componente che trasforma l'input in una rappresentazione interna ricca di contesto.
Exact Match

Preferiti Vota permalink

Corrispondenza esatta. Metrica binaria che premia solo le risposte identiche al riferimento atteso.
F
F1 a livello di token

Preferiti Vota permalink

Bilanciamento token. Metrica che media precisione e richiamo sui token condivisi tra risposta e riferimento.
Faithfulness

Preferiti Vota permalink

Fedeltà al contesto. Grado in cui una risposta resta coerente con le fonti fornite senza inventare.
FastText

Preferiti Vota permalink

Embedding a sottoparole. Estensione di Word2Vec che rappresenta una parola come somma di n-grammi di caratteri.
Feed-forward network

Preferiti Vota permalink

Rete densa interna. Strato pienamente connesso applicato a ogni posizione dentro un blocco transformer.
Flash attention

Preferiti Vota permalink

Attenzione efficiente. Implementazione ottimizzata che calcola l'attenzione riducendo accessi alla memoria.
Function calling

Preferiti Vota permalink

Chiamata di funzione. Capacità di un modello di produrre l'invocazione strutturata di uno strumento esterno.
G
GloVe

Preferiti Vota permalink

Embedding globale. Modello che costruisce vettori di parole dalle statistiche di co-occorrenza dell'intero corpus.
GPT-2

Preferiti Vota permalink

Generatore autoregressivo. Modello decoder-only che ha mostrato la capacità di produrre testo coerente su larga scala.
Gradient accumulation

Preferiti Vota permalink

Accumulo dei gradienti. Tecnica che somma i gradienti di più mini-batch prima di aggiornare i pesi.
Greedy decoding

Preferiti Vota permalink

Decodifica avida. Strategia che sceglie sempre il token più probabile a ogni passo, senza esplorare alternative.
Grouped-query attention

Preferiti Vota permalink

Attenzione raggruppata. Variante che condivide chiavi e valori tra più teste per ridurre la memoria.
H
Hidden state

Preferiti Vota permalink

Stato nascosto. Rappresentazione interna prodotta da uno strato che codifica informazioni sul token.
Hybrid search

Preferiti Vota permalink

Ricerca ibrida. Combinazione di recupero denso e sparso per unire precisione semantica e lessicale.
HyDE

Preferiti Vota permalink

Documento ipotetico. Tecnica che genera una risposta fittizia per migliorare il recupero dei documenti.
J
Jailbreak

Preferiti Vota permalink

Aggiramento dei vincoli. Tecnica che induce il modello a ignorare le proprie regole di sicurezza.
K
KV cache

Preferiti Vota permalink

Memoria chiave-valore. Archivio dei tensori già calcolati che velocizza la generazione token dopo token.
L
Label smoothing

Preferiti Vota permalink

Ammorbidimento etichette. Tecnica che distribuisce parte della probabilità target per evitare eccessiva sicurezza.
Layer normalization

Preferiti Vota permalink

Normalizzazione di strato. Tecnica che stabilizza l'addestramento riscalando le attivazioni di ciascun token.
Lemmatizzazione

Preferiti Vota permalink

Riduzione al lemma. Tecnica che riporta le parole alla loro forma base canonica usando regole morfologiche e dizionari.
Llama

Preferiti Vota permalink

Famiglia open. Serie di modelli linguistici decoder-only rilasciati da Meta per ricerca e uso aperto.
LLM-as-a-judge

Preferiti Vota permalink

Modello giudice. Uso di un LLM per valutare automaticamente la qualità delle risposte di un altro modello.
Logit

Preferiti Vota permalink

Punteggio grezzo. Valore non normalizzato prodotto dal modello prima della trasformazione in probabilità.
Logit bias

Preferiti Vota permalink

Sbilanciamento dei logit. Regolazione manuale che aumenta o riduce la probabilità di token specifici.
Long-context model

Preferiti Vota permalink

Modello a contesto lungo. LLM capace di elaborare input molto estesi mantenendo coerenza tra parti distanti.
LoRA

Preferiti Vota permalink

Adattamento a basso rango. Tecnica che addestra piccole matrici aggiuntive lasciando congelati i pesi originali.
M
Masked Language Modeling

Preferiti Vota permalink

Predizione mascherata. Obiettivo di addestramento in cui il modello indovina parole nascoste nella frase.
Matrice di co-occorrenza

Preferiti Vota permalink

Conteggio di vicinanza. Tabella che registra quante volte due parole compaiono insieme in una finestra di contesto.
METEOR

Preferiti Vota permalink

Metrica allineata. Punteggio di traduzione che considera sinonimi, radici e ordine oltre alla corrispondenza esatta.
Min-p sampling

Preferiti Vota permalink

Soglia relativa. Campionamento che scarta i token sotto una frazione della probabilità del token più alto.
Mistral

Preferiti Vota permalink

Modello efficiente. LLM open che combina prestazioni elevate con dimensioni contenute e attenzione a finestra scorrevole.
Mixed precision

Preferiti Vota permalink

Precisione mista. Addestramento che combina formati a bassa e alta precisione per accelerare i calcoli.
Modello decoder-only

Preferiti Vota permalink

Solo decodifica. Architettura autoregressiva che genera testo predicendo un token alla volta, base dei modelli generativi.
Modello encoder-only

Preferiti Vota permalink

Solo codifica. Architettura che trasforma l'input in rappresentazioni, adatta a classificazione e comprensione.
Modello seq2seq

Preferiti Vota permalink

Sequenza a sequenza. Architettura con encoder e decoder che mappa una sequenza di input in una di output.
Multi-head attention

Preferiti Vota permalink

Attenzione multi-testa. Tecnica che esegue più attenzioni in parallelo per catturare relazioni diverse.
Multilinguismo

Preferiti Vota permalink

Capacità multilingue. Abilità di un modello di comprendere e generare testo in più lingue.
N
N-gram

Preferiti Vota permalink

Sequenza contigua. Gruppo di n elementi consecutivi, parole o caratteri, usato per modellare il linguaggio.
Negative sampling

Preferiti Vota permalink

Campionamento negativo. Tecnica che addestra usando esempi non correlati per definire i confini di similarità.
Next Sentence Prediction

Preferiti Vota permalink

Predizione della frase. Compito che insegna a un modello se due frasi si susseguono logicamente.
Normalizzazione del testo

Preferiti Vota permalink

Pulizia uniformante. Trasformazione del testo in forma standard come minuscole, accenti e punteggiatura coerenti.
O
One-hot encoding

Preferiti Vota permalink

Codifica sparsa. Rappresentazione in cui ogni parola è un vettore con un solo elemento attivo nel vocabolario.
P
Padding

Preferiti Vota permalink

Riempimento uniforme. Aggiunta di token fittizi per portare tutte le sequenze alla stessa lunghezza.
PEFT

Preferiti Vota permalink

Fine-tuning efficiente. Famiglia di tecniche che adatta un modello aggiornando solo una frazione dei parametri.
Perplexity

Preferiti Vota permalink

Misura di sorpresa. Indica quanto un modello è incerto nel predire una sequenza, più bassa è meglio.
Pooling delle rappresentazioni

Preferiti Vota permalink

Aggregazione dei vettori. Combinazione dei vettori dei token in un'unica rappresentazione, ad esempio per media.
POS tagging

Preferiti Vota permalink

Etichettatura grammaticale. Assegnazione a ogni parola della sua categoria sintattica come nome, verbo o aggettivo.
Positional encoding

Preferiti Vota permalink

Codifica posizionale. Informazione aggiunta agli embedding per indicare l'ordine dei token nella sequenza.
Prefix tuning

Preferiti Vota permalink

Prefisso addestrabile. Tecnica che antepone vettori appresi a ogni strato per condizionare il comportamento.
Prompt injection

Preferiti Vota permalink

Iniezione di istruzioni. Attacco che inserisce comandi malevoli nel testo per dirottare il comportamento del modello.
Prompt template linguistico

Preferiti Vota permalink

Schema di istruzione. Struttura riutilizzabile con segnaposto in cui inserire input variabili.
Prompt tuning

Preferiti Vota permalink

Ottimizzazione del prompt. Apprendimento di vettori di prompt continui lasciando il modello immutato.
Pruning

Preferiti Vota permalink

Potatura dei pesi. Eliminazione di parametri poco influenti per alleggerire e velocizzare il modello.
Q
QLoRA

Preferiti Vota permalink

LoRA quantizzato. Metodo che applica LoRA su un modello compresso a bassa precisione per ridurre la memoria.
Quantizzazione

Preferiti Vota permalink

Riduzione di precisione. Compressione che rappresenta i pesi con meno bit per risparmiare memoria e calcolo.
Query, Key, Value

Preferiti Vota permalink

Triade dell'attenzione. I tre vettori derivati da ogni token che determinano pesi e contenuto dell'attenzione.
R
ReAct

Preferiti Vota permalink

Ragiona e agisci. Schema che alterna passi di ragionamento e azioni verso strumenti esterni.
Red teaming

Preferiti Vota permalink

Test avversariale. Pratica di sollecitare un modello con input ostili per scoprirne le vulnerabilità.
Repetition penalty

Preferiti Vota permalink

Penalità di ripetizione. Aggiustamento che riduce la probabilità dei token già generati per evitare loop.
Reranking

Preferiti Vota permalink

Riordinamento dei risultati. Tecnica che riorganizza documenti recuperati secondo la rilevanza rispetto alla query.
Residual connection

Preferiti Vota permalink

Connessione residua. Scorciatoia che somma l'input di uno strato alla sua uscita per agevolare il flusso del gradiente.
Retrieval reranker

Preferiti Vota permalink

Filtro di rilevanza. Componente che affina i risultati di recupero ordinandoli per pertinenza fine.
RoBERTa

Preferiti Vota permalink

BERT ottimizzato. Variante addestrata più a lungo e su più dati, senza il compito di predizione della frase successiva.
RoPE

Preferiti Vota permalink

Rotazione posizionale. Tecnica che codifica la posizione ruotando i vettori query e key in funzione dell'indice.
Rotary embeddings

Preferiti Vota permalink

Codifica rotante. Tecnica che incorpora la posizione tramite rotazioni applicate ai vettori di attenzione.
ROUGE

Preferiti Vota permalink

Metrica di riassunto. Misura della sovrapposizione tra testo generato e riassunti di riferimento.
S
Sampling

Preferiti Vota permalink

Campionamento casuale. Generazione che estrae il token successivo secondo la distribuzione di probabilità del modello.
Self-attention

Preferiti Vota permalink

Auto-attenzione. Meccanismo in cui ogni token pesa la rilevanza di tutti gli altri token della stessa sequenza.
Self-consistency

Preferiti Vota permalink

Coerenza interna. Tecnica che genera più ragionamenti e sceglie la risposta più frequente tra essi.
Sentence embedding

Preferiti Vota permalink

Vettore di frase. Rappresentazione numerica che cattura il significato complessivo di un'intera frase.
SentencePiece

Preferiti Vota permalink

Tokenizzatore agnostico. Sistema che tratta il testo come flusso grezzo di byte o caratteri, senza dipendere da spazi o lingua specifica.
Similarità del coseno

Preferiti Vota permalink

Misura angolare. Indice che valuta la vicinanza tra due vettori in base all'angolo che li separa.
Skip-gram

Preferiti Vota permalink

Predizione del contesto. Architettura di Word2Vec che predice le parole di contorno data una parola centrale.
Sliding window attention

Preferiti Vota permalink

Attenzione a finestra. Meccanismo che limita ogni token ad attendere solo i vicini entro una finestra fissa.
Softmax

Preferiti Vota permalink

Normalizzazione probabilistica. Funzione che converte i logit in una distribuzione di probabilità sui token.
Sparse retrieval

Preferiti Vota permalink

Recupero sparso. Ricerca basata su corrispondenza di termini e pesi come nei modelli a parole chiave.
Special token

Preferiti Vota permalink

Token di controllo. Simbolo riservato come inizio sequenza o separatore che guida il comportamento del modello.
Speculative decoding

Preferiti Vota permalink

Decodifica speculativa. Tecnica che usa un modello piccolo per proporre token poi verificati dal modello grande.
Stemming

Preferiti Vota permalink

Riduzione alla radice. Tecnica che taglia i suffissi delle parole per ricondurle a una forma comune approssimata.
Step-back prompting

Preferiti Vota permalink

Prompt a ritroso. Strategia che invita il modello a generalizzare il problema prima di affrontarlo.
Stopwords

Preferiti Vota permalink

Parole vuote. Termini molto frequenti come articoli e preposizioni spesso rimossi perché poco informativi.
Structured output

Preferiti Vota permalink

Output strutturato. Generazione vincolata a un formato preciso come JSON conforme a uno schema.
Subword

Preferiti Vota permalink

Unità intermedia. Frammento di parola più piccolo del termine ma più grande del carattere, usato per gestire termini rari.
Subword regularization

Preferiti Vota permalink

Regolarizzazione subword. Tecnica che varia la tokenizzazione durante l'addestramento per maggiore robustezza.
Supervised Fine-Tuning

Preferiti Vota permalink

Affinamento supervisionato. Fase in cui il modello impara da coppie di istruzioni e risposte etichettate.
T
T5

Preferiti Vota permalink

Tutto testo-a-testo. Modello che riformula ogni compito linguistico come trasformazione da testo di input a testo di output.
Teacher forcing

Preferiti Vota permalink

Forzatura del docente. Tecnica che alimenta il token corretto invece di quello predetto durante l'addestramento.
TF-IDF

Preferiti Vota permalink

Pesatura dei termini. Misura che valorizza le parole frequenti in un documento ma rare nell'intera collezione.
Tokenizzazione a caratteri

Preferiti Vota permalink

Suddivisione minima. Approccio che spezza il testo nei singoli caratteri anziché in parole o subword.
Tokenizzazione a parole

Preferiti Vota permalink

Suddivisione lessicale. Approccio che separa il testo in parole intere usando spazi e punteggiatura.
Tokenizzazione di frase

Preferiti Vota permalink

Segmentazione in frasi. Suddivisione di un testo nelle sue singole frasi individuando i confini di senso.
Top-k sampling

Preferiti Vota permalink

Campionamento top-k. Tecnica che limita la scelta ai k token più probabili prima di campionare.
Toxicity detection

Preferiti Vota permalink

Rilevamento tossicità. Identificazione automatica di linguaggio offensivo o dannoso nei testi.
Tree of Thoughts

Preferiti Vota permalink

Albero di pensieri. Strategia che esplora più percorsi di ragionamento ramificati prima di concludere.
Truncation

Preferiti Vota permalink

Troncamento sequenza. Taglio del testo che eccede la lunghezza massima ammessa dal modello.
U
Unigram Language Model

Preferiti Vota permalink

Tokenizzazione probabilistica. Metodo che parte da un vocabolario ampio e rimuove i token meno utili secondo un modello unigramma.
V
Vocabolario di token

Preferiti Vota permalink

Insieme dei simboli. Elenco finito di unità testuali che un modello sa riconoscere e produrre.
Vocabolario fuori distribuzione

Preferiti Vota permalink

Parola sconosciuta. Termine non presente nel vocabolario, gestito con token speciali o subword.
W
Warmup del learning rate

Preferiti Vota permalink

Riscaldamento iniziale. Fase in cui il tasso di apprendimento cresce gradualmente all'inizio dell'addestramento.
Word Error Rate (WER)

Preferiti Vota permalink

Tasso di errore. Misura della trascrizione che conta inserimenti, cancellazioni e sostituzioni rispetto al riferimento.
Word sense disambiguation

Preferiti Vota permalink

Disambiguazione semantica. Scelta del significato corretto di una parola polisemica in base al contesto.
Word2Vec

Preferiti Vota permalink

Embedding di parole. Modello che apprende vettori densi associando parole a contesti tramite reti neurali superficiali.
WordPiece

Preferiti Vota permalink

Tokenizzazione a subword. Metodo usato da BERT che divide le parole in unità scelte massimizzando la verosimiglianza del corpus.
X
XLNet

Preferiti Vota permalink

Permutazione autoregressiva. Modello che predice i token considerando tutti gli ordini possibili della sequenza.

A

B

C

D

E

F

G

H

J

K

L

M

N

O

P

Q

R

S