modello nascosto di Markov
Modello statistico in cui il sistema da modellare viene assunto essere un processo di Markov con parametri sconosciuti; la difficoltà consiste nel determinare i parametri nascosti dai parametri osservabili. Un tale modello (HMM, Hidden Markov model) può essere considerato come la più semplice rete dinamica bayesiana. In un modello regolare di Markov, lo stato è direttamente visibile all’osservatore e quindi le probabilità di transizione da uno stato all’altro sono le uniche incognite. In un HMM, lo stato non è direttamente visibile, mentre sono visibili le variabili influenzate dagli stati. Tre aspetti fondamentali sono legati all’uso dei HMM. Il primo deriva dal fatto che dato i parametri del modello è necessario calcolare la probabilità della sequenza di output, e data la sequenza di output bisogna calcolare i valori delle probabilità degli stati nascosti (risolto con il back-forward algoritmo). Il secondo deriva dalla possibilità che dati i parametri del modello si trovi la sequenza di stati nascosti più probabile per generare una specifica sequenza di output (risolto con l’algoritmo di Viterbi). Infine il terzo problema consiste nel calcolare i parametri dell’HMM, dato un gruppo di sequenze di output (risolto con l’algoritmo di Baum-Welch). I modelli nascosti di Markov sono applicabili in molti campi: nel riconoscimento della parola; di movimento del corpo; di lettura ottica dei caratteri; di sintesi vocale. Nel campo della bioinformatica le applicazioni sono numerose: predizione delle regioni codificanti nella sequenza del genoma; modellizzazione delle famiglie di proteine; predizione degli elementi secondari della struttura dalle sequenze primarie della proteina. I modelli nascosti di Markov sono stati descritti per la prima volta in una serie di studi statistici di Leonard E. Baum e altri autori nella seconda metà degli anni Sessanta. Nella seconda metà degli anni Ottanta, si è cominciato ad applicare gli HMM all’analisi delle sequenze biologiche, in particolare quella del DNA.
→ Biosfera. Aspetti genomici dell’oceanografia microbica