| ... | @@ -21,14 +21,14 @@ Il metodo POT (Peka Over Threshold), coem suggerisce il nome, si bassa sulla ana |
... | @@ -21,14 +21,14 @@ Il metodo POT (Peka Over Threshold), coem suggerisce il nome, si bassa sulla ana |
|
|
La parte metodologica più complessa riguarda proprio la scelta del valore ottimale di riferimento, qui denominata $u$, che deve essere sufficientmente grande da cosentire la selezione dei soli valori rappresentativi di fenomeni intensi (anche se non estremi), ma non troppo grande da ridurre eccessivamente la numerosità del campione di dati al dispora della soglie. Per risolvere questo problema si descriverà più avanti un criterio operativo specifico.
|
|
La parte metodologica più complessa riguarda proprio la scelta del valore ottimale di riferimento, qui denominata $u$, che deve essere sufficientmente grande da cosentire la selezione dei soli valori rappresentativi di fenomeni intensi (anche se non estremi), ma non troppo grande da ridurre eccessivamente la numerosità del campione di dati al dispora della soglie. Per risolvere questo problema si descriverà più avanti un criterio operativo specifico.
|
|
|
Denominando intanto con $X$ la variabile per la quale si vuole determinare la probabilità di estremo e con $u$ la suddetta soglia di riferimento (si veda figura sottostante), si può dimostrare che la probabilità di superamento di un certo valore $x$ (detta anche funzione di sopravvivenza), condizionata alla sola popolazione dei valori al di sopra della soglia $u$, segue la **legge di Pareto generalizzata**:
|
|
Denominando intanto con $X$ la variabile per la quale si vuole determinare la probabilità di estremo e con $u$ la suddetta soglia di riferimento (si veda figura sottostante), si può dimostrare che la probabilità di superamento di un certo valore $x$ (detta anche funzione di sopravvivenza), condizionata alla sola popolazione dei valori al di sopra della soglia $u$, segue la **legge di Pareto generalizzata**:
|
|
|
|
|
|
|
|
$$ \mathbb{P}[X \> x \mid X > u] = \left[ 1 + \frac{\xi (x - u)}{\psi_u} \right]^{-1/\xi} $$
|
|
$$ \\mathbb{P}[X \> x \mid X > u] = \left[ 1 + \frac{\xi (x - u)}{\psi_u} \right]^{-1/\xi} $$
|
|
|
|
|
|
|
|

|
|

|
|
|
|
|
|
|
|
Si noti come la distribuzione, dispenda, oltre che dalla soglia $u$, da ulteriori due parametri: il parametro di forma $\xi$ e il parametro di scala $\psi_u$; il secondo, come mostrato più avanti, mostra una forte dipendenza da $u$.
|
|
Si noti come la distribuzione, dispenda, oltre che dalla soglia $u$, da ulteriori due parametri: il parametro di forma $\xi$ e il parametro di scala $\psi_u$; il secondo, come mostrato più avanti, mostra una forte dipendenza da $u$.
|
|
|
Nota la forma della funzione di sopravvivenza, si può giungere alla determinazione del valore $X_T$ coriispondente ad un determinato tempo di ritorno $T$ (in anni), definendo innanzitutto la quantità $\zeta_u = \mathbb{P}[X > u]$, cioè la probabilità di superamento della soglia. Moltiplicandola per la probabilità condizionata di cui sopra, la **probabilità incondizionata** si può quindi scrivere come:
|
|
Nota la forma della funzione di sopravvivenza, si può giungere alla determinazione del valore $X_T$ coriispondente ad un determinato tempo di ritorno $T$ (in anni), definendo innanzitutto la quantità $\zeta_u = \\mathbb{P}[X > u]$, cioè la probabilità di superamento della soglia. Moltiplicandola per la probabilità condizionata di cui sopra, la **probabilità incondizionata** si può quindi scrivere come:
|
|
|
|
|
|
|
|
$$ \mathbb{P}[X \gt x] = \mathbb{P}[X \gt u] \mathbb{P}[X \gt x \mid X \gt u] = \zeta_u \left[ 1 + \frac{\xi (x - u)}{\psi_u} \right]^{-1/\xi} $$
|
|
$$ \\mathbb{P}[X \gt x] = \mathbb{P}[X \gt u] \mathbb{P}[X \gt x \mid X \gt u] = \zeta_u \left[ 1 + \frac{\xi (x - u)}{\psi_u} \right]^{-1/\xi} $$
|
|
|
|
|
|
|
|
Da tale espressione si può innanzitutto ricavare la quantità $X_m$ che viene mediamanete superata ogni $m$ osservazioni, che soddisfa la seguente relazione:
|
|
Da tale espressione si può innanzitutto ricavare la quantità $X_m$ che viene mediamanete superata ogni $m$ osservazioni, che soddisfa la seguente relazione:
|
|
|
|
|
|
| ... | @@ -46,7 +46,7 @@ Mettendo insieme le due ultime relazioni si può quindi ottenere la seguenete es |
... | @@ -46,7 +46,7 @@ Mettendo insieme le due ultime relazioni si può quindi ottenere la seguenete es |
|
|
|
|
|
|
|
$$ X_T = u + \frac{\psi_u}{\xi} \left[ (n_yT\zeta_u)^{\xi} - 1 \right] $$
|
|
$$ X_T = u + \frac{\psi_u}{\xi} \left[ (n_yT\zeta_u)^{\xi} - 1 \right] $$
|
|
|
|
|
|
|
|
In tale espressione rimane però ancora da valutare la probabilità $\zeta_u = \mathbb{P}[X > u]$; questa è ancora ragionevolemente approssimabile, contando il numero totale $n_u$ di osservazioni al di sopra della soglia $u$ e il numero toale $M$ di anni di osservazione, tramite la relazione:
|
|
In tale espressione rimane però ancora da valutare la probabilità $\zeta_u = \\mathbb{P}[X > u]$; questa è ancora ragionevolemente approssimabile, contando il numero totale $n_u$ di osservazioni al di sopra della soglia $u$ e il numero toale $M$ di anni di osservazione, tramite la relazione:
|
|
|
|
|
|
|
|
$$ n_y \zeta_u = \frac{n_u}{M} $$
|
|
$$ n_y \zeta_u = \frac{n_u}{M} $$
|
|
|
|
|
|
| ... | @@ -61,13 +61,13 @@ $$ X_T = u + \frac{\psi_u}{\xi} \left[ (\frac{n_uT}{M})^{\xi} - 1 \right] $$ |
... | @@ -61,13 +61,13 @@ $$ X_T = u + \frac{\psi_u}{\xi} \left[ (\frac{n_uT}{M})^{\xi} - 1 \right] $$ |
|
|
Nell'ipotesi serie geenrata da un processo aleatorio ergodico (cioè di processo in cui, anche se non stazionario, le proprietà del processo sono stimabili da un singola realizzazione, cioè una singola serie temproale osservata) si può assumere che il *trend* del valore atteso della variabile sia approssimabile dal *trend* osservato in una singola realizzazione, cioè nella serie temporale osservata (Wang _et al._, 2015). Analogamente per i valori attesi di funzioni della variabile, quali ad esempio il quadrato o altre potenze.
|
|
Nell'ipotesi serie geenrata da un processo aleatorio ergodico (cioè di processo in cui, anche se non stazionario, le proprietà del processo sono stimabili da un singola realizzazione, cioè una singola serie temproale osservata) si può assumere che il *trend* del valore atteso della variabile sia approssimabile dal *trend* osservato in una singola realizzazione, cioè nella serie temporale osservata (Wang _et al._, 2015). Analogamente per i valori attesi di funzioni della variabile, quali ad esempio il quadrato o altre potenze.
|
|
|
Sotto tale ipotesi, si assumono validi (sitimati come _trend_ nei valori osservati) i seguenti _trend_:
|
|
Sotto tale ipotesi, si assumono validi (sitimati come _trend_ nei valori osservati) i seguenti _trend_:
|
|
|
|
|
|
|
|
$$ \mathbb{E}[X] = \mu = a_1+b_1 t $$
|
|
$$ \\mathbb{E}[X] = \mu = a_1+b_1 t $$
|
|
|
|
|
|
|
|
$$ \mathbb{E} \left[ X^2 \right] = a_2+b_2 t $$
|
|
$$ \\mathbb{E} \left[ X^2 \right] = a_2+b_2 t $$
|
|
|
|
|
|
|
|
allora:
|
|
allora:
|
|
|
|
|
|
|
|
$$ \sigma = \left( \mathbb{E} \left[ X^2 \right] - \mathbb{E}[X] ^ 2 \right) ^ {1/2} = \left( a_2+b_2 t - a_1^2 - 2 a_1 b_1 t - b_1^2 t^2 \right) ^ {1/2}$$
|
|
$$ \sigma = \left( \\mathbb{E} \left[ X^2 \right] - \\mathbb{E}[X] ^ 2 \right) ^ {1/2} = \left( a_2+b_2 t - a_1^2 - 2 a_1 b_1 t - b_1^2 t^2 \right) ^ {1/2}$$
|
|
|
|
|
|
|
|
$$ \frac{d\sigma}{dt} = \frac{1}{2} \left( a_2+b_2 t - a_1^2 - 2 a_1 b_1 t - b_1^2 t^2 \right) ^ {-1/2} \left( b_2 - 2 a_1 b_1 -2 b_1^2 t \right) $$
|
|
$$ \frac{d\sigma}{dt} = \frac{1}{2} \left( a_2+b_2 t - a_1^2 - 2 a_1 b_1 t - b_1^2 t^2 \right) ^ {-1/2} \left( b_2 - 2 a_1 b_1 -2 b_1^2 t \right) $$
|
|
|
|
|
|
| ... | | ... | |