|
|
# Appendice A: Metodologie Statistiche Dettagliate
|
|
# Appendice B: Metodologie Statistiche Dettagliate
|
|
|
|
|
|
|
|
## A.1 Analisi Statistica e Modelli di Distribuzione
|
|
## B.1 Analisi Statistica e Modelli di Distribuzione
|
|
|
|
|
|
|
|
### A.1.1 Analisi Statistica dei Singoli Attributi
|
|
### B.1.1 Analisi Statistica dei Singoli Attributi
|
|
|
|
|
|
|
|
Per ciascuno degli attributi selezionati è stata condotta un'analisi statistica **univariata** finalizzata a modellarne la distribuzione di probabilità.
|
|
Per ciascuno degli attributi selezionati è stata condotta un'analisi statistica **univariata** finalizzata a modellarne la distribuzione di probabilità.
|
|
|
|
|
|
| ... | @@ -11,7 +11,7 @@ La modellazione è stata effettuata separatamente per due regioni: |
... | @@ -11,7 +11,7 @@ La modellazione è stata effettuata separatamente per due regioni: |
|
|
* **Corpo della distribuzione:** Stimato con la **Empirical Cumulative Distribution Function (ECDF)**.
|
|
* **Corpo della distribuzione:** Stimato con la **Empirical Cumulative Distribution Function (ECDF)**.
|
|
|
* **Coda (valori estremi):** Stimata con la **Generalized Pareto Distribution (GPD)**.
|
|
* **Coda (valori estremi):** Stimata con la **Generalized Pareto Distribution (GPD)**.
|
|
|
|
|
|
|
|
#### A.1.1.1 Determinazione della Soglia (Peak Over Threshold - POT)
|
|
#### B.1.1.1 Determinazione della Soglia (Peak Over Threshold - POT)
|
|
|
|
|
|
|
|
La soglia che separa queste due regioni (corpo e coda) è stata determinata tramite un'analisi diagnostica **Peak Over Threshold (POT)** multi-criterio.
|
|
La soglia che separa queste due regioni (corpo e coda) è stata determinata tramite un'analisi diagnostica **Peak Over Threshold (POT)** multi-criterio.
|
|
|
|
|
|
| ... | @@ -34,7 +34,7 @@ Questo processo ha garantito che i parametri, stimati sui dati in eccesso, fosse |
... | @@ -34,7 +34,7 @@ Questo processo ha garantito che i parametri, stimati sui dati in eccesso, fosse |
|
|
| **Test QQ (Quantile-Quantile)** | *Confronto tra quantili empirici e teorici.* | Analisi visiva per confermare l'adeguatezza del modello sui quantili estremi. |
|
|
| **Test QQ (Quantile-Quantile)** | *Confronto tra quantili empirici e teorici.* | Analisi visiva per confermare l'adeguatezza del modello sui quantili estremi. |
|
|
|
| **Test PP (Probability-Probability)** | *Confronto tra probabilità empiriche e teoriche.* | Analisi visiva per confermare l'adeguatezza del modello sulla distribuzione di probabilità. |
|
|
| **Test PP (Probability-Probability)** | *Confronto tra probabilità empiriche e teoriche.* | Analisi visiva per confermare l'adeguatezza del modello sulla distribuzione di probabilità. |
|
|
|
|
|
|
|
|
#### Modello Ibrido e Popolazione Estrema
|
|
#### B.1.1.2 Modello Ibrido e Popolazione Estrema
|
|
|
|
|
|
|
|
Una volta definito il valore soglia più opportuno, è stata creata la **popolazione degli eventi estremi**, che include tutti gli eventi che superano la soglia per **almeno un attributo** (*filtro OR*). Di conseguenza, è stata definita la **matrice M** degli attributi degli eventi estremi, composta da **1702 elementi**.
|
|
Una volta definito il valore soglia più opportuno, è stata creata la **popolazione degli eventi estremi**, che include tutti gli eventi che superano la soglia per **almeno un attributo** (*filtro OR*). Di conseguenza, è stata definita la **matrice M** degli attributi degli eventi estremi, composta da **1702 elementi**.
|
|
|
|
|
|
| ... | @@ -49,13 +49,13 @@ Questa combinazione assicura che il modello sia statisticamente robusto su tutto |
... | @@ -49,13 +49,13 @@ Questa combinazione assicura che il modello sia statisticamente robusto su tutto |
|
|
|
|
|
|
|
---
|
|
---
|
|
|
|
|
|
|
|
## A.2 Modellazione della Dipendenza Multivariata (Vine Copula)
|
|
## B.2 Modellazione della Dipendenza Multivariata (Vine Copula)
|
|
|
|
|
|
|
|
Per modellare in modo accurato la distribuzione multivariata degli eventi estremi, è fondamentale catturare la complessa **struttura di dipendenza** tra gli attributi nella **Matrice M**. A causa della non-linearità e dell'asimmetria tipiche dei fenomeni estremi, non è efficace utilizzare modelli multivariati tradizionali.
|
|
Per modellare in modo accurato la distribuzione multivariata degli eventi estremi, è fondamentale catturare la complessa **struttura di dipendenza** tra gli attributi nella **Matrice M**. A causa della non-linearità e dell'asimmetria tipiche dei fenomeni estremi, non è efficace utilizzare modelli multivariati tradizionali.
|
|
|
|
|
|
|
|
Si è quindi fatto ricorso alla **Vine Copula (R-Vine)**, un modello gerarchico flessibile.
|
|
Si è quindi fatto ricorso alla **Vine Copula (R-Vine)**, un modello gerarchico flessibile.
|
|
|
|
|
|
|
|
### A.2.1 Fasi del Processo di Modellazione
|
|
### B.2.1 Fasi del Processo di Modellazione
|
|
|
|
|
|
|
|
1. **Trasformazione Spaziale Uniforme:**
|
|
1. **Trasformazione Spaziale Uniforme:**
|
|
|
* Il primo passo è la **trasformazione nello spazio uniforme $[0, 1]$** di ciascun attributo estremo.
|
|
* Il primo passo è la **trasformazione nello spazio uniforme $[0, 1]$** di ciascun attributo estremo.
|
| ... | @@ -65,7 +65,7 @@ Si è quindi fatto ricorso alla **Vine Copula (R-Vine)**, un modello gerarchico |
... | @@ -65,7 +65,7 @@ Si è quindi fatto ricorso alla **Vine Copula (R-Vine)**, un modello gerarchico |
|
|
2. **Scomposizione Gerarchica (R-Vine):**
|
|
2. **Scomposizione Gerarchica (R-Vine):**
|
|
|
* La Vine Copula scompone la dipendenza tra $N$ attributi in una serie di **copule binarie** attraverso **$N-1$ alberi gerarchici** ($T_1, T_2, \dots, T_{N-1}$).
|
|
* La Vine Copula scompone la dipendenza tra $N$ attributi in una serie di **copule binarie** attraverso **$N-1$ alberi gerarchici** ($T_1, T_2, \dots, T_{N-1}$).
|
|
|
|
|
|
|
|
### A.2.2 Struttura degli Alberi
|
|
### B.2.2 Struttura degli Alberi
|
|
|
|
|
|
|
|
* **Albero Iniziale ($T_1$):** Le copule binarie sono modellate direttamente tra le **coppie di variabili trasformate**.
|
|
* **Albero Iniziale ($T_1$):** Le copule binarie sono modellate direttamente tra le **coppie di variabili trasformate**.
|
|
|
* **Alberi Successivi:** I nodi rappresentano le densità di copula **condizionate** stimate nel livello precedente. Gli archi modellano la **dipendenza residua** condizionata da un sottoinsieme di altre variabili.
|
|
* **Alberi Successivi:** I nodi rappresentano le densità di copula **condizionate** stimate nel livello precedente. Gli archi modellano la **dipendenza residua** condizionata da un sottoinsieme di altre variabili.
|
| ... | @@ -74,7 +74,7 @@ Questo approccio permette di ottimizzare la selezione della **famiglia di copula |
... | @@ -74,7 +74,7 @@ Questo approccio permette di ottimizzare la selezione della **famiglia di copula |
|
|
|
|
|
|
|
---
|
|
---
|
|
|
|
|
|
|
|
## A.3 Generazione della Popolazione Sintetica di Eventi Estremi
|
|
## B.3 Generazione della Popolazione Sintetica di Eventi Estremi
|
|
|
|
|
|
|
|
Per ottenere un campione robusto che copra l'intera regione di interesse multivariata e consenta una stima stabile del **Tempo di Ritorno ($\text{T}_r$)**, è stata eseguita una simulazione **Monte Carlo** sulla struttura di dipendenza stimata.
|
|
Per ottenere un campione robusto che copra l'intera regione di interesse multivariata e consenta una stima stabile del **Tempo di Ritorno ($\text{T}_r$)**, è stata eseguita una simulazione **Monte Carlo** sulla struttura di dipendenza stimata.
|
|
|
|
|
|
| ... | @@ -88,11 +88,11 @@ Questa trasformazione inversa è condizionale: i valori $u$ che cadono **sotto l |
... | @@ -88,11 +88,11 @@ Questa trasformazione inversa è condizionale: i valori $u$ che cadono **sotto l |
|
|
|
|
|
|
|
---
|
|
---
|
|
|
|
|
|
|
|
## A.4 Definizione della Regione dello Spazio su cui Calcolare T$_r$
|
|
## B.4 Definizione della Regione dello Spazio su cui Calcolare T$_r$
|
|
|
|
|
|
|
|
L'obiettivo di questa fase è proiettare sia gli eventi osservati che quelli simulati nel **dominio dei Fattori**, in modo da definire una regione dello spazio multivariato su cui valutare la probabilità di superamento.
|
|
L'obiettivo di questa fase è proiettare sia gli eventi osservati che quelli simulati nel **dominio dei Fattori**, in modo da definire una regione dello spazio multivariato su cui valutare la probabilità di superamento.
|
|
|
|
|
|
|
|
### A.4.1 Analisi Fattoriale e Calcolo dei Pesi W
|
|
### B.4.1 Analisi Fattoriale e Calcolo dei Pesi W
|
|
|
|
|
|
|
|
La fase inizia con l'applicazione dell'**Analisi Fattoriale Esplorativa (EFA)** sulla Matrice degli Attributi **M** (eventi estremi originali). Per l'estrazione dei Fattori è stato impiegato il metodo di **Fattorizzazione Assiale Principale (Principal Axis Factoring - PAF)**, eseguito utilizzando la libreria *factor\_analyzer*.
|
|
La fase inizia con l'applicazione dell'**Analisi Fattoriale Esplorativa (EFA)** sulla Matrice degli Attributi **M** (eventi estremi originali). Per l'estrazione dei Fattori è stato impiegato il metodo di **Fattorizzazione Assiale Principale (Principal Axis Factoring - PAF)**, eseguito utilizzando la libreria *factor\_analyzer*.
|
|
|
|
|
|
| ... | @@ -101,7 +101,7 @@ Dopo l'estrazione iniziale dei Fattori tramite il metodo PAF, che assicura che i |
... | @@ -101,7 +101,7 @@ Dopo l'estrazione iniziale dei Fattori tramite il metodo PAF, che assicura che i |
|
|
La Rotazione Varimax è una tecnica di rotazione ortogonale che ha come obiettivo la massimizzazione della varianza dei *factor loadings* al quadrato per ciascun fattore. Poiché è una rotazione ortogonale, mantiene l'indipendenza lineare tra i fattori. Il suo ruolo primario è:
|
|
La Rotazione Varimax è una tecnica di rotazione ortogonale che ha come obiettivo la massimizzazione della varianza dei *factor loadings* al quadrato per ciascun fattore. Poiché è una rotazione ortogonale, mantiene l'indipendenza lineare tra i fattori. Il suo ruolo primario è:
|
|
|
|
|
|
|
|
* **Massima Semplificazione:** La rotazione ridefinisce gli assi dei fattori 1 e 2 in modo che ogni variabile originale (attributo) tenda ad avere *loadings* (pesi) **elevati solo su un singolo fattore** e *loadings* prossimi a zero sugli altri.
|
|
* **Massima Semplificazione:** La rotazione ridefinisce gli assi dei fattori 1 e 2 in modo che ogni variabile originale (attributo) tenda ad avere *loadings* (pesi) **elevati solo su un singolo fattore** e *loadings* prossimi a zero sugli altri.
|
|
|
* **Migliore Interpretabilità:** Questo processo crea una struttura dei fattori più pulita (**Simple Structure**), rendendo immediato capire quali attributi contribuiscono a definire in modo univoco un dato fattore (es. gli attributi di Intensità su Factor 1 e quelli di Estensione/Durata su Factor 2, come si evince dalla Tabella A.4.1).
|
|
* **Migliore Interpretabilità:** Questo processo crea una struttura dei fattori più pulita (**Simple Structure**), rendendo immediato capire quali attributi contribuiscono a definire in modo univoco un dato fattore (es. gli attributi di Intensità su Factor 1 e quelli di Estensione/Durata su Factor 2, come si evince dalla Tabella B.4.1).
|
|
|
|
|
|
|
|
| Attributo | Factor\_1 | Factor\_2 |
|
|
| Attributo | Factor\_1 | Factor\_2 |
|
|
|
| :--- | :--- | :--- |
|
|
| :--- | :--- | :--- |
|
| ... | @@ -115,7 +115,7 @@ La Rotazione Varimax è una tecnica di rotazione ortogonale che ha come obiettiv |
... | @@ -115,7 +115,7 @@ La Rotazione Varimax è una tecnica di rotazione ortogonale che ha come obiettiv |
|
|
| **$\text{P}_{3\text{h}}$** | 0.733 | 0.235 |
|
|
| **$\text{P}_{3\text{h}}$** | 0.733 | 0.235 |
|
|
|
| **$a_{\text{VOL}}$** | 0.341 | 0.908 |
|
|
| **$a_{\text{VOL}}$** | 0.341 | 0.908 |
|
|
|
| **$\text{P}_{\text{max}}$** | 0.880 | -0.123 |
|
|
| **$\text{P}_{\text{max}}$** | 0.880 | -0.123 |
|
|
|
| *Tabella A.4.1. Factor loadings* | | |
|
|
| *Tabella B.4.1. Factor loadings* | | |
|
|
|
|
|
|
|
|
Questo metodo calcola la **Matrice dei Pesi del Punteggio Fattoriale W** tramite un'analisi di regressione che fornisce la migliore stima lineare dei Fattori, utilizzando la struttura fattoriale ruotata.
|
|
Questo metodo calcola la **Matrice dei Pesi del Punteggio Fattoriale W** tramite un'analisi di regressione che fornisce la migliore stima lineare dei Fattori, utilizzando la struttura fattoriale ruotata.
|
|
|
|
|
|
| ... | @@ -145,7 +145,7 @@ $$ |
... | @@ -145,7 +145,7 @@ $$ |
|
|
|
|
|
|
|
La forte **collinearità** tra alcune variabili originali (come evidenziato dalla Matrice di Correlazione $R$) può portare alla singolarità o all'instabilità della matrice $R^{-1}$ e, di conseguenza, rendere la stima della Matrice dei Pesi $W$ instabile e non robusta. Per mitigare questo effetto, la lista originale di variabili è stata ridotta ai **10 attributi** che mostrano un equilibrio tra rilevanza fisica e intercorrelazione gestibile per l'analisi fattoriale.
|
|
La forte **collinearità** tra alcune variabili originali (come evidenziato dalla Matrice di Correlazione $R$) può portare alla singolarità o all'instabilità della matrice $R^{-1}$ e, di conseguenza, rendere la stima della Matrice dei Pesi $W$ instabile e non robusta. Per mitigare questo effetto, la lista originale di variabili è stata ridotta ai **10 attributi** che mostrano un equilibrio tra rilevanza fisica e intercorrelazione gestibile per l'analisi fattoriale.
|
|
|
|
|
|
|
|
La Matrice $W$ risultante, che proietta lo spazio delle 10 variabili nello spazio bidimensionale dei Fattori, è indicata in Tabella A.4.2.
|
|
La Matrice $W$ risultante, che proietta lo spazio delle 10 variabili nello spazio bidimensionale dei Fattori, è indicata in Tabella B.4.2.
|
|
|
|
|
|
|
|
| Attributo | Factor\_1 | Factor\_2 |
|
|
| Attributo | Factor\_1 | Factor\_2 |
|
|
|
| :--- | :--- | :--- |
|
|
| :--- | :--- | :--- |
|
| ... | @@ -159,7 +159,7 @@ La Matrice $W$ risultante, che proietta lo spazio delle 10 variabili nello spazi |
... | @@ -159,7 +159,7 @@ La Matrice $W$ risultante, che proietta lo spazio delle 10 variabili nello spazi |
|
|
| **$\text{P}_{3\text{h}}$** | 0.178 | 0.010 |
|
|
| **$\text{P}_{3\text{h}}$** | 0.178 | 0.010 |
|
|
|
| **$a_{\text{VOL}}$** | 0.002 | 0.289 |
|
|
| **$a_{\text{VOL}}$** | 0.002 | 0.289 |
|
|
|
| **$\text{P}_{\text{max}}$** | 0.255 | -0.133 |
|
|
| **$\text{P}_{\text{max}}$** | 0.255 | -0.133 |
|
|
|
| *Tabella A.4.2. Pesi complessivi dei punteggi fattoriali* | | |
|
|
| *Tabella B.4.2. Pesi complessivi dei punteggi fattoriali* | | |
|
|
|
|
|
|
|
|
| Attributo | Unicità ($u_{i}^{2}$) |
|
|
| Attributo | Unicità ($u_{i}^{2}$) |
|
|
|
| :--- | :--- |
|
|
| :--- | :--- |
|
| ... | @@ -173,9 +173,9 @@ La Matrice $W$ risultante, che proietta lo spazio delle 10 variabili nello spazi |
... | @@ -173,9 +173,9 @@ La Matrice $W$ risultante, che proietta lo spazio delle 10 variabili nello spazi |
|
|
| **$\text{P}_{3\text{h}}$** | 0.407 |
|
|
| **$\text{P}_{3\text{h}}$** | 0.407 |
|
|
|
| **$a_{\text{VOL}}$** | 0.059 |
|
|
| **$a_{\text{VOL}}$** | 0.059 |
|
|
|
| **$\text{P}_{\text{max}}$** | 0.210 |
|
|
| **$\text{P}_{\text{max}}$** | 0.210 |
|
|
|
| *Tabella A.4.3. Unicità* | |
|
|
| *Tabella B.4.3. Unicità* | |
|
|
|
|
|
|
|
|
### A.4.2 Calcolo degli Score Fattoriali F e F'
|
|
### B.4.2 Calcolo degli Score Fattoriali F e F'
|
|
|
|
|
|
|
|
La stessa matrice dei pesi $W$ viene utilizzata sia sugli eventi originali ($\mathbf{M}$) che sulla popolazione simulata ($\mathbf{M'}$):
|
|
La stessa matrice dei pesi $W$ viene utilizzata sia sugli eventi originali ($\mathbf{M}$) che sulla popolazione simulata ($\mathbf{M'}$):
|
|
|
|
|
|
| ... | @@ -203,7 +203,7 @@ Dove: |
... | @@ -203,7 +203,7 @@ Dove: |
|
|
|
|
|
|
|
---
|
|
---
|
|
|
|
|
|
|
|
## A.5 Analisi di Sensitività Spaziale del Tempo di Ritorno ($\text{T}_r$)
|
|
## B.5 Analisi di Sensitività Spaziale del Tempo di Ritorno ($\text{T}_r$)
|
|
|
|
|
|
|
|
Nei modelli idrologici tradizionali, il Tempo di Ritorno ($\mathbf{T}_r$) viene stimato localmente, utilizzando la serie storica di un singolo pluviometro. Questo studio, basato su eventi areali descritti da attributi multivariati e campionati su un'intera regione geografica (la Toscana), estende il concetto di $\mathbf{T}_r$ da puntuale a spaziale/multivariato.
|
|
Nei modelli idrologici tradizionali, il Tempo di Ritorno ($\mathbf{T}_r$) viene stimato localmente, utilizzando la serie storica di un singolo pluviometro. Questo studio, basato su eventi areali descritti da attributi multivariati e campionati su un'intera regione geografica (la Toscana), estende il concetto di $\mathbf{T}_r$ da puntuale a spaziale/multivariato.
|
|
|
|
|
|
| ... | @@ -211,7 +211,7 @@ Questo approccio solleva il **Problema del Campionamento Spaziale**: come è inf |
... | @@ -211,7 +211,7 @@ Questo approccio solleva il **Problema del Campionamento Spaziale**: come è inf |
|
|
|
|
|
|
|
L'obiettivo di questa analisi di sensitività è quantificare questa influenza. Il $\mathbf{T}_r$ di un evento estremo può infatti variare drasticamente a seconda che sia confrontato con la popolazione di eventi estremi di tutta la regione (un contesto globale) o solo con la popolazione estratta da un contesto locale (un'area ristretta attorno al suo baricentro).
|
|
L'obiettivo di questa analisi di sensitività è quantificare questa influenza. Il $\mathbf{T}_r$ di un evento estremo può infatti variare drasticamente a seconda che sia confrontato con la popolazione di eventi estremi di tutta la regione (un contesto globale) o solo con la popolazione estratta da un contesto locale (un'area ristretta attorno al suo baricentro).
|
|
|
|
|
|
|
|
### A.5.1 Procedura di Analisi Spaziale Iterativa
|
|
### B.5.1 Procedura di Analisi Spaziale Iterativa
|
|
|
|
|
|
|
|
Per un generico evento estremo osservato $\mathbf{e}$ con coordinate note del baricentro ($x_{Gp}, y_{Gp}$), il $\mathbf{T}_r$ viene testato iterativamente su una serie crescente di **raggi spaziali $R$**.
|
|
Per un generico evento estremo osservato $\mathbf{e}$ con coordinate note del baricentro ($x_{Gp}, y_{Gp}$), il $\mathbf{T}_r$ viene testato iterativamente su una serie crescente di **raggi spaziali $R$**.
|
|
|
|
|
|
| ... | | ... | |