|
Un frattale per le quotazioni del petrolio
Lo scopo di questo lavoro è di cercare proprietà nascoste all'interno di una serie di dati ad elevata frequenza. In modo particolare, si cerca di capire se il caso, che regna sovrano dietro ogni fluttuazione economica, può essere in una certa misura controllato e studiato, attraverso analisi statistiche di variabili nascoste. A tale scopo ho analizzato una serie temporale di dati, rappresentanti ventuno anni (1986 - 2007) di quotazione giornaliera del prezzo del petrolio in dollari per barile, al NYSE (New York Stock Exchange), ossia la borsa valori americana. Il grafico sotto riportato ne rappresenta l'andamento, dove per serie temporale è stata scelta la sequenza cumulativa formata da ogni singolo giorno di quotazione.
Come risulta evidente da una prima analisi del grafico, l'andamento delle fluttuazioni si presenta abbastanza irregolare e poco predicibile. E' ben evidente il forte rialzo avutosi in concomitanza con l'ultima, in orine temporale, invasione dell'Iraq da parte degli USA, ma anche brevi e repentini rialzi e ribassi dovuti a vari fattori di influenza esterna (aumento della richiesta - fenomeno cinese; aumento della produzione da parte dell'OPEC, ecc...). L'idea è quella di individuare una qualche variabile nascosta che sia in grado di evidenziare, in modo inequivocabile, le influenze esterne sulle fluttuazioni del prezzo del petrolio e, quindi, sancire la non efficienza del mercato dandone una certa forma di governabilità statistica. La presenza di fattori influenzanti l'andamento casuale della quotazione denota, come già detto, la non efficienza del mercato, ed è questo uno degli obiettivi da raggiungere con questa breve ricerca, al fine di dare un certo grado di scientificità ai fenomeni che osserviamo. Considero, quindi, la serie temporale di dati non più come prezzi che oscillano ma come un puro e semplice flusso di dati, da studiare ovviamente con mezzi statistici. Il primo passo è quello di considerare una prima variabile nascosta, chiamata ritorno del prezzo, generata dai logaritmi naturali delle variazioni del prezzo in due istanti successivi, mantenendo la scala temporale originaria. Indico questa variabile con r(t), in quanto variabile dipendente esclusivamente dal tempo. La variabile viene definita in modo iterativo su n - 1 passi successivi, corrispondenti agli n - 1 intervalli temporali, nel modo seguente:
r(ti) = ln Z(ti+1) - ln Z(ti), dove i = 1, ... , n-1
dove ho indicato con Z(t) il prezzo del petrolio al tempo t. La variabile appena definita presenta un piccolo problema, cioè è distribuita rispetto ad un valore medio che non coincide con lo zero. Solo per una questione di convenienza statistica, risulta utile normalizzare tale variabile in modo da allineare la sua media con lo zero. In questo modo ottengo una nuova variabile gemella, che chiamo ritorno normalizzato, e che, indicata con nr(t), è definita in questo modo:
nr(ti) = r(ti) - < r(ti) >, dove i = 1, ... , n-1
dove ho indicato con < r(ti) > il valor medio dei ritorni su tutta la serie temporale. La figura seguente mostra le fluttuazioni temporali di questa nuova variabile.
Nel grafico in figura sono ben visibili le fluttuazioni "estreme", corrispondenti a bruschi salti del valore del prezzo del petrolio in istanti di tempo immediatamente successivi. E' importante, a questo punto, capire se queste fluttuazioni anomale abbiano o meno delle autocorrelazioni, cioè se a seguito di una di essa se ne verificano delle altre, in un modo non proprio casuale, ma legate alla "storia" delle precedenti. Per far ciò è indispensabile studiare l'andamento temporale della funzione di autocorrelazione dei ritorni normalizzati, alla ricerca di effetti di "memoria", tipici nei mercati non del tutto efficienti; se questi fenomeni esistono, cercherò di descriverli attraverso mezzi statistici. La funzione di autocorrelazione ha una forma abbastanza complicata e, facendone uso solo per puro scopo funzionale, non ne tratterò la teoria in questo studio. Ciò che però è interessante e che quindi non può essere omesso, è il risultato sorprendente e del tutto inaspettato che deriva dall'analisi qualitativa del grafico di questa funzione, mostrato nella seguente figura:
Questo grafico particolare mi dice che la funzione di autocorrelazione "cade" istantaneamente a zero e, quindi, non è presente alcuna autocorrelazione nella serie temporale dei ritorni normalizzati; ciò significa che ogni fluttuazione sarebbe fine a sé stessa e tutte le altre avrebbero esistenze indipendenti dalle precedenti. Tutto ciò sarebbe altresì indice di un mercato perfettamente efficiente, che non risente di influenze esterne, le cui fluttuazioni del prezzo sono del tutto casuali. E' chiaro che tutto ciò sembrerebbe contraddire l'evidenza. Ho scelto di operare questa analisi statistica sul prezzo petrolio proprio perché è ben noto a tutti come i fattori esterni ne influenzino in modo non banale le quotazioni. Per assicurami di aver svolto bene l'analisi della funzione di autocorrelazione, ricorro ad un metodo alternativo. Utilizzo la Detrended Fluctuation Analysis (descritta ampiamente in questo sito nella sezione dedicata) che è un algoritmo capace di "scovare" autocorrelazioni anche minime, se ce ne sono, in una qualsiasi serie temporale. Tale metodo, per la cronaca, trova grande utilizzo in medicina, in particolare negli studi di cardiologia. L'analisi DFA per la nostra serie temporale dei ritorni normalizzati, stima un valore per l'esponente di Hurst pari a 0.55 ± 0.03, ossia la serie temporale è quasi totalmente scorrelata e non presenta effetti di memoria significativi. Il moto Browniano corrispondente non è frazionario, ma classico: gli incrementi della variabile nr(t) sono distribuiti secondo una legge di distribuzione gaussiana, cioè fortemente casuali. La figura seguente mostra la stima dell'esponente di Hurst effettuato con un fit lineare robusto.
Credo sia interessante, a questo punto, costruire un random walk utilizzando gli incrementi della variabile nr(t), per ricavare da esso alcune utili informazioni, che magari a prima vista ci sono sfuggite, ma anche in vista di ciò che farò più avanti. Un random walk è, come dice il termine stesso, una sorta di passeggiata i cui tratti hanno ampiezza e direzione casuale, ma non troppo. Infatti, se gli incrementi dei passi successivi sono del tutto casuali il moto browniano (altro nome del random walk) risultante si dice classico; se ci sono effetti significativi di memoria, invece, il moto è detto frazionario (termine che deriva dalla dimensione geometrica tipica frattale; si veda l'articolo sui frattali nella sezione scuola -> materiale didattico). Il random walk è stato costruito in modo iterativo nel seguente modo:
X(t) = X(t-1) ± s Y(t) = Y(t-1) ± nr(t-1)
dove s indica la deviazione standard della serie nr(t). Si vede chiaramente che, mentre l' ampiezza dei passi X(t) è fissata, quella dei passi Y(t) dipende dalla fluttuazione temporale della variabile nr(t). In fine c'è da dire che il segno ± è assegnato in modo arbitrario e uniforme (è il segno derivante da una serie casuale di numeri compresi tra -1 e 1, distribuiti uniformemente con varianza unitaria e media nulla). Il moto bidimensionale risultante è quello mostrato in figura.
Questo moto è simile a quello risultante dall'unione di microspostamenti di piccoli insetti che si muovono saltellando sulla superficie di uno specchio d'acqua (Einstein fu il primo ad osservare tale moto e a darne una descrizione matematica). Da questo strano moto riesco a ricavare delle importanti osservazioni. Sono ben visibili delle macchie più scure, corrispondenti a zone in cui le fluttuazioni del prezzo, tornando al petrolio, sono state contenute, quindi abbastanza casuali. Queste aree le chiamo "zone stocastiche". Dall'analisi del moto ricaviamo altresì quelle informazioni che la funzione di autocorrelazione non ci ha dato, cioè che queste zone stocastiche sono anche abbastanza separate le une dalle altre, intervallate da zone maggiormente rade, che denotano la presenza di bruschi spostamenti della variabile nr(t) che, almeno a livello qualitativo, non sembrano essere del tutto casuali. Nella figura seguente sono messe in evidenza le zone stocastiche sopra citate.
Mi risulta evidente che devo cercare una nuova variabile nascosta per avere uno studio più dettagliato della situazione, ma senza allontanarmi troppo dalla variabile nr(t), che mi ha dato comunque una gran quantità di informazioni, specialmente per quanto riguarda lo studio del random walk. Provo, a questo punto, a considerare i valori assoluti delle n-1 variabili nr(t), visto che mi danno ancora una volta una misura quantitativa delle fluttuazioni del prezzo del petrolio, anche se esclusivamente positive. Non mi interessa più sapere se il prezzo è calato o aumentato, ma solo che ha subito un cambiamento. Definisco la mia nuova variabile, che chiamo ritorno assoluto normalizzato e che indico con anr(t), nel modo seguente:
anr(t) = | nr(t) |
dove | ... | indica l'operatore "valore assoluto". Il grafico di questa nuova variabile, in funzione del tempo, si presenta come in figura:
Si vedono ancora le fluttuazioni ma, a differenza di prima, questa volta sono tutte concentrate nel semipiano positivo dei valori. Apparentemente non dovrebbe cambiare nulla, ma le sorprese sono sempre dietro l'angolo. Rifaccio tutta l'analisi statistica condotta in precedenza, ma avendo come oggetto di studio la mia nuova variabile. Calcolo la sua funzione di autocorrelazione e ne analizzo il grafico in figura:
Direi che è cambiato veramente tanto. Questa volta la funzione di autocorrelazione non presenta il "crash" immediato sullo zero, ma decade in modo molto lento; addirittura presenta effetti di memoria molto persistenti per tutta la durata del tempo di osservazione, anche se il tutto, come è logico che sia, decade col trascorrere del tempo. E' evidente che ogni fluttuazione successiva risente in modo non trascurabile da quelle precedenti, denotando una inefficienza di mercato molto più in accordo con la realtà di quanto non lo fosse la variabile nr(t). Per una ulteriore verifica, controllo la consistenza della funzione di autocorrelazione attraverso l'analisi DFA. In effetti la presenza di memoria long-range è confermata anche in questo caso, ottenendo come stima dell'esponente di Hurst il valore 0.86 ± 0.02 che dimostra una persistenza molto significativa. Nella figura seguente viene mostrato il robusto fit lineare:
Ora cerco di ottenere ulteriori nuove informazioni dall'analisi del random walk, costruito, come in precedenza, sulla base della nuova variabile anr(t). Il nuovo moto browniano si presenta frazionario, a differenza del precedente, come mostrato in figura:
Anche in questo caso sono presenti diverse zone stocastiche, in cui gli addensamenti sono più folti, ma c'è qualcosa di nuovo e che prima non si notava. Nella figura seguente ho evidenziato delle nuove zone in cui fanno la loro comparsa dei fenomeni di autosimilarità, tipici di oggetti geometrici frattali (si veda la sezione dedicata nel sito), cioè la presenza di uguali formazioni in scale diverse:
L'autosimilarità presente in questo moto browniano mi dice cose di rilevanza notevole. La presenza di strutture simili in scale differenti indicano effetti simili in periodi temporali diversi, anche se sotto l'influenza di eventi diversi. In questo modo risulta abbastanza predicibile la reazione del mercato in presenza di eventi di una certa portata (lo si sapeva, ma ora c'è una base statistica molto forte). Il mercato è poco efficiente perché non sempre, addirittura quasi mai come nel caso del petrolio, le fluttuazioni dei prezzi sono governate esclusivamente dal caso, cioè da fenomeni aleatori, ma risentono in modo non banale dalla "storia" precedente. Queste stesse caratteristiche, con parametri leggermente diversi nella forma, ma simili nella sostanza, li ho riscontrati anche analizzando dieci anni di quotazione del titolo azionario Benetton Group. Ciò mi ha portato alla convinzione che il comportamento riscontrato per il petrolio è abbastanza generalizzabile e può essere messo in relazione, ad esempio, con oggetti matematici ben noti e controllabili come possono essere i frattali (e non è cosa di poco conto se pensiamo che attraverso i frattali può essere descritta una notevole quantità di fenomeni naturali, come il comportamento di alcune cellule sottoposte a stimolazioni esterne). In fine mi sento di concludere anche che la variabile aleatoria anr(t) è adatta a descrivere l'efficienza del mercato, in accordo con quanto viene osservato nella realtà.
prof Valerio Curcio 15/10/2007
|