text mining
<tèkst màiniṅ> locuz. sost. ingl., usata in it. al masch. – Acquisizione dinamica di nuovi elementi di conoscenza su un certo dominio attraverso l'applicazione di tecniche di e di information retrieval a testi non strutturati come pagine web, agenzie stampa, e-mail e così via, e più in generale a qualsiasi corpus di documenti. Con l’ausilio di mezzi statistici e linguistici, i sistemi di t. m. individuano strutture che mettono gli utenti in grado di riconoscere rapidamente le informazioni implicite contenute in un insieme di documenti. Nel caso limite può trattarsi di informazioni di cui l’utente ignorava l’esistenza. Tra gli obiettivi del t. m. vi possono essere per es. l’individuazione dei principali gruppi tematici contenuti nei documenti, la classificazione in categorie predefinite, l’estrazione di informazioni specifiche come nomi di persone o denominazioni di aziende, l’individuazione di tendenze temporali o di collegamenti nascosti tra determinati argomenti o autori, l’estrazione di concetti per la creazione di ontologie o tassonomie oppure l’elaborazione di tecniche di ottimizzazione per i motori di ricerca.