2018
10 settembre 2018 ore 10,30
James M McGREE
School of Mathematical Sciences, Queensland University of Technology, Brisbane, Australia
Principles of Experimental Design for Big Data Analysis
Abstract: Big Datasets are endemic, but are often notoriously difficult to analyse because of their size, heterogeneity and quality. The purpose of this paper is to open a discourse on the potential for modern decision theoretic optimal experimental design methods, which by their very nature have traditionally been applied prospectively, to improve the analysis of Big Data through retrospective designed sampling in order to answer particular questions of interest. By appealing to a range of examples, it is suggested that this perspective on Big Data modelling and analysis has the potential for wide generality and advantageous inferential and computational properties. We highlight current hurdles and open research questions surrounding efficient computational optimisation in using retrospective designs, and in part this paper is a call to the optimisation and experimental design communities to work together in the field of Big Data analysis.
31 Maggio 2018 ore 10.00
Reti di relazioni tra individui e tra imprese. Il Rapporto annuale ISTAT 2018
Con la partecipazione di:
Giovanni MARSEGUERRA - Delegato Rettorale al Coordinamento dell'Offerta Formativa
Domenico BODEGA - Preside Facoltà di Economia, Università Cattolica del Sacro Cuore
Alessandro ROSINA - Direttore Dipartimento di Scienze Statistiche, Università Cattolica del Sacro Cuore
Giorgio ALLEVA - Presidente ISTAT
Guido MERZONI - Preside Facoltà Scienze Politiche e Sociali, Università Cattolica del Sacro Cuore
Cristina TAJANI - Assessore alle Politiche del Lavoro, Attività produttive, Commercio e Risorse Umane, Comune di Milano
Giulia RIVELLINI - Associato di Demografia e Statistica Sociale, Università Cattolica del Sacro Cuore
Valerio FIORESPINO - Capo Dipartimento DIRM, ISTAT
22 Maggio 2018 ore 12.30
LEONARDO EGIDI
Dipartimento DEAMS - Università di Trieste,
I tiri sono predittivi per il numero di reti nel calcio?
Abstract: La comune assunzione per modellare i risultati calcistici è che i goal segnati da entrambe le squadre seguono due distribuzioni di Poisson indipendenti, o qualche possibile generalizzazione che implica una correlazione positiva tra di loro. I dati sui goal sono solitamente utilizzati per stimare le abilità di attacco e difesa di ogni squadra. Tuttavia, queste abilità hanno una natura complessa e sono correlate con molte quantità inerenti al gioco. Un’ulteriore informazione disponibile, rilevante per stimare i parametri di attacco e difesa, sono i tiri, sia quelli realizzati che quelli concessi. A tale scopo proponiamo un modello che permetta di incorporare questa informazione in tre stadi per ogni partita e ogni squadra: numero di goal, numero di tiri nello specchio e numero di tiri totali. Abbiamo raccolto i dati storici per dieci stagioni di Premier League inglese, dalla stagione 2007-2008 a quella 2016-2017, e abbiamo applicato il modello accertando la sua bontà di adattamento tramite il controllo predittivo a posteriori. In secondo luogo, abbiamo ottenuto previsioni per partite future e messo a paragone le nostre probabilità a posteriori con quelle ottenute dalle agenzie di scommesse.
Key words: modelling football outcomes, shot, prediction
24 Aprile 2018 ore 12.30
LUIS CARVALHO
Boston University Arts & Sciences
Bayesian Network Regularized Regression for Crime Modeling
Abstract: We present a new methodology for functional network regression on node atributes using a Laplacian operator based on edge similarities as regularizer. We show how usual regularization penalties can be cast as prior distributions on regression coefficients under a Bayesian setup, and propose a computationally efficient EM fitting procedure. We discuss a specific application to modeling residential burglary in Boston using a hierarchical model with latent indicators for "hot zones" and a conditional zero-inflated negative binomial regression for crime rates. This is joint work with Liz Upton.
11 aprile 2018 ore 9.30
ALAN AGRESTI
Distinguished Professor Emeritus - University of Florida
Simple Ordinal Model Effect Measures
Abstract: We survey effect measures for models for ordinal categorical data that can be simpler to interpret that the model parameters. For describing the effect of an explanatory variable while adjusting for other explanatory variables, we present probability-based measures, including a measure of relative size and partial effect measures based on an instantaneous rate of change. We also survey summary measures of predictive power that are analogs of $R$-squared and multiple correlation measures for continuous response variables. We suggest new measures of effect and of predictive power, illustrate the new and existing measures for an example, and provide R code for implementing them. The talk is based on a recent paper with Claudia Tarantola.
29 gennaio 2018 ore 11.30
NICOLA LOPERFIDO
Dipartimento di Economia, Società, Politica - Università degli Studi di Urbino Carlo Bo
Skewness-Based Projection Pursuit
Abstract: Projection pursuit is a multivariate statistical technique aimed at finding interesting low-dimensional data projections. More precisely, it looks for the data projection which maximizes the projection pursuit index, that is a measure of its interestingness. Skewness, that is the third standardized cumulant, has some merits as a projection pursuit index. First, skewness is a valid projection pursuit index. Second, all distributions which are deemed uninteresting in the projection pursuit literature are symmetric. Third, for some distributions, projections maximizing skewness have a simple parametric interpretation. Finally, skewness is a mathematical concept with a simple graphical interpretation, and projection pursuit aims at making the most of visual perception as a tool for discovering data patterns. The talk will illustrate skewness-based projection pursuit from both the theoretical and the applied point of view.