Università Cattolica del Sacro Cuore

Model-based clustering

I metodi di clustering basati sulla densità o sul modello (density-based/model-based clustering) rappresentano strumenti avanzati per l’identificazione di raggruppamenti nei dati. Questi metodi si basano sui modelli mistura, che costituiscono il framework probabilistico naturale per la modellizzazione di popolazioni eterogenee. La stima dei parametri viene effettuata mediante approcci statistici rigorosi: da un lato, mediante la massimizzazione della verosimiglianza nel contesto frequentista; dall’altro, tramite l’identificazione della distribuzione a posteriori nel contesto Bayesiano. Questi approcci non solo garantiscono una allocazione interpretabile, ma permettono anche di quantificarne l’incertezza. La ricerca si propone di sviluppare estensioni metodologiche per il density-based clustering in scenari complessi, come quelli che coinvolgono dati contaminati o ad alta dimensionalità, nonché in contesti dinamici e temporali.

Parole chiave e temi trattati:

Model-based clustering, Bayesian clustering, Finite mixture models, Markov chain Monte Carlo, EM algorithm, Outliers detection, Robust estimation, Dynamic clustering

Persone coinvolte:

Andrea Cappozzo, Lucia Paci, Federico Castelletti