| ... | ... | @@ -30,54 +30,8 @@ I collegamenti creati secondo i criteri di aggregazione spaziale e temporale fan |
|
|
|
|
|
|
|
## [B.2 Analisi Statistica e Modelli di Distribuzione](./AppendiceB_2.md)
|
|
|
|
|
|
|
|
### B.2.1 Analisi Statistica dei Singoli Attributi
|
|
|
|
|
|
|
|
Per ciascuno degli attributi selezionati è stata condotta un'analisi statistica **univariata** finalizzata a modellarne la distribuzione di probabilità.
|
|
|
|
|
|
|
|
La modellazione è stata effettuata separatamente per due regioni:
|
|
|
|
|
|
|
|
* **Corpo della distribuzione:** Stimato con la **Empirical Cumulative Distribution Function (ECDF)**.
|
|
|
|
* **Coda (valori estremi):** Stimata con la **Generalized Pareto Distribution (GPD)**.
|
|
|
|
|
|
|
|
#### B.2.1.1 Determinazione della Soglia (Peak Over Threshold - POT)
|
|
|
|
|
|
|
|
La soglia che separa queste due regioni (corpo e coda) è stata determinata tramite un'analisi diagnostica **Peak Over Threshold (POT)** multi-criterio.
|
|
|
|
|
|
|
|
La soglia finale è stata selezionata bilanciando due esigenze contrapposte:
|
|
|
|
1. Minimizzare il *bias* (utilizzando soglie sufficientemente alte).
|
|
|
|
2. Mantenere un numero sufficiente di eventi estremi per una stima robusta dei parametri GPD.
|
|
|
|
|
|
|
|
I **criteri essenziali** utilizzati per la validazione della soglia e l'adeguatezza del *fit* GPD includono:
|
|
|
|
* La stabilità del parametro di forma ($\xi$).
|
|
|
|
* La linearità della Mean Residual Life.
|
|
|
|
* L'aderenza statistica valutata con test **KS** (Kolmogorov–Smirnov).
|
|
|
|
|
|
|
|
Questo processo ha garantito che i parametri, stimati sui dati in eccesso, fossero robusti e rappresentativi del comportamento estremo degli attributi.
|
|
|
|
|
|
|
|
| Criterio | Metodo/Riferimento | Obiettivo |
|
|
|
|
| :--- | :--- | :--- |
|
|
|
|
| **Stabilità del Parametro di Forma** | *Grafico della stabilità rispetto al valore soglia.* | Assicurare che il parametro di forma ($\xi$) non sia influenzato da piccole variazioni della soglia. |
|
|
|
|
| **Linearità della MRL (Mean Residual Life)** | *Grafico della MRL.* | Verificare che la GPD sia un modello appropriato per i dati in eccesso. |
|
|
|
|
| **Test KS** (Kolmogorov–Smirnov) | *Confronto tra Funzione di Ripartizione (CDF) empirica e teorica.* | Valutare l'aderenza statistica del fit GPD alla distribuzione dei dati estremi. |
|
|
|
|
| **Test QQ (Quantile-Quantile)** | *Confronto tra quantili empirici e teorici.* | Analisi visiva per confermare l'adeguatezza del modello sui quantili estremi. |
|
|
|
|
| **Test PP (Probability-Probability)** | *Confronto tra probabilità empiriche e teoriche.* | Analisi visiva per confermare l'adeguatezza del modello sulla distribuzione di probabilità. |
|
|
|
|
|
|
|
|
#### B.2.1.2 Modello Ibrido e Popolazione Estrema
|
|
|
|
|
|
|
|
Una volta definito il valore soglia più opportuno, è stata creata la **popolazione degli eventi estremi**, che include tutti gli eventi che superano la soglia per **almeno un attributo** (*filtro OR*). Di conseguenza, è stata definita la **matrice M** degli attributi degli eventi estremi, composta da **1702 elementi**.
|
|
|
|
|
|
|
|
Per modellare la distribuzione completa di ciascuna variabile, è stato adottato un **approccio ibrido** per le distribuzioni marginali:
|
|
|
|
|
|
|
|
| Porzione della Distribuzione | Metodo di Modellazione | Obiettivo |
|
|
|
|
| :--- | :--- | :--- |
|
|
|
|
| **Corpo** (porzione centrale e più densa) | **ECDF** (non parametrico) | Massima aderenza ai dati osservati. |
|
|
|
|
| **Coda** (valori estremi) | **GPD** (metodo POT) | Stima robusta e possibilità di estrapolare eventi estremi. |
|
|
|
|
|
|
|
|
Questa combinazione assicura che il modello sia statisticamente robusto su tutto il *range* di valori, riuscendo a descrivere in maniera accurata la distribuzione degli eventi sotto-soglia, più frequenti, ma permettendo comunque di estrapolare eventi estremi dal campione tramite la GPD.
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
## B.3 Modellazione della Dipendenza Multivariata (Vine Copula)
|
|
|
|
## [B.3 Modellazione della Dipendenza Multivariata- *Vine Copula*](./AppendiceB_3.md)
|
|
|
|
|
|
|
|
Per modellare in modo accurato la distribuzione multivariata degli eventi estremi, è fondamentale catturare la complessa **struttura di dipendenza** tra gli attributi nella **Matrice M**. A causa della non-linearità e dell'asimmetria tipiche dei fenomeni estremi, non è efficace utilizzare modelli multivariati tradizionali.
|
|
|
|
|
| ... | ... | |