Dnešní akciové trhy jsou jako jedna velká spolupracující změť žížalek (čti křivek). Stačí hlasité bouchnutí do stolu a všechny žížalky se vydají jedním směrem. Chceme najít takové žížalky, které spolu tak úplně nespolupracují.

Při vývoji strategií jsme narazili na potřebu rozdělit podklady dle korelace. Jde nám především o vytvoření koše podkladů, které spolu nekorelují. Máme strategii, kterou chceme obchodovat na více podkladech a bylo by chybou zvolit si podklady, které spolu silně korelují.

Vybrali jsme Personův korelační koeficient

Pearsonův korelační koeficient v sobě obsahuje normalizaci obou vstupních vektorů. S normalizací jsme delší dobu bojovali. Ostatní normalizace, které jsme zkoušeli, nám dávaly vždy v jistém smyslu divné výsledky. Tato normalizace se chová alespoň předvídatelně. Výslední matice pak mají jednoduchou interpretaci.

U delších časových období může být problém s tím, že se korelace s časem změní. Proto jsme počítali korelační koeficienty i pro každý rok zvlášť.

Nejde o dlouhodobý trend podkladů

Záměr korelačních matic je mnohem hlubší, než rozlišit podklady dle jejich dlouhodobého chování (nárůst/pokles), jak by se mohlo při prvním pohledu do grafů zdát.

Kdyby nám šlo o kategorizaci jednotlivých podkladů dle dlouhodobého trendu, stačilo by nám proložit vývoj ceny podkladů lineární funkcí. Tím bychom získali nejhrubší dlouhodobý trend. Srovnáním lineárních koeficientů dlouhodobých trendů (po normalizaci) bychom pak vlastně získali korelační koeficienty mezi různými podklady. Nebo by stačilo spočítat průměrný denní pohyb ceny podkladu. O to nám ale nešlo.

Porovnáváme denní rozdíly cen, ne ceny samotné

Většinou řešíme nesměrové strategie s délkou obchodů dny až týdny. Kratší pozice mají nižší riziko. Testovat krátkodobé korelace podkladů má pro nás větší smysl než kategorizace podkladů dle dlouhodobých trendů. Z tohoto důvodu jsme použili denní rozdíly cen, ne ceny samotné. Rozdíl v těchto přístupech se nejlépe projeví na příkladu:

Nechť máme nesměrovou obchodní strategii, složenou z opcí s expirací 2 dny. Dále nechť máme dva podklady, kterých časový vývoj cen je dán následujícími vektory:

v1 = [1, 1, 1, 1, 2, 3, 3]
v2 = [1, 2, 3, 3, 3, 3, 3]

Cena prvního podkladu tedy byla na začátku konstantní a pak na konci vyrostla z hodnoty 1 na hodnotu 3. Cena druhého podkladu vzrostla už na začátku a pak se až do konce držela na konstantní úrovni.

Když spočítáme korelační koeficient přímo z cen podkladů, vyjde nám cca +0.5. To je logické, protože oba podklady vzrostly. Když ale spočteme nejprv derivace:

v1d = [0, 0, 0, 1, 1, 0]
v2d = [1, 1, 0, 0, 0, 0]

Korelace vyjde cca -0,5. To je znovu očekávané, protože cena obou podkladů se sice zvýšila, ale ne ve stejnou dobu.

Nyní si představme situaci, kdy potřebujeme sestavovat vyvážené obchodní portfolio. Tedy takové, které je složené ze vzájemně nekorelovaných podkladů. Na základě prvního koeficientu (+0.5) bychom řekli, že podklady jsou korelované a tedy v portfoliu oba být nesmí. Jenomže v případě nesměrové strategie by to byla chyba. Podklad v1 je totiž pro nesměrové strategie ziskový v první polovině času – a právě v tu dobu je neziskový ten druhý. Opačná situace platí v druhé polovině. Podklady by tedy ve společném portfoliu nesměrové strategie být mohly a měly.

Nicméně, v korelacích cen podkladů je také schovaná informace. Taky jsme s ní chvilku pracovali, ale nakonec jsme jako vhodnější nástroj zvolili právě korelaci denních změn. Kromě výše popsaného důvodu jsme měli i další:

  1. Korelace cen podkladů jsou velmi citlivé na větší cenové skoky. Nejlíp je to vidět, když se dají vedla sebe 2 grafy, kde jsou vynesené všechny datové body – na jednom grafu cena podkladu 1 vs. cena podkladu 2, a na druhém grafu derivace ceny podkladu 1 vs derivace ceny podkladu 2. Výsledné grafy vypadají asi takto:

    Dva podklady můžou být ve vzájemné pozitivní korelaci třeba 1 rok. Ale pak, když se v ceně udělá větší skok, a cena jednoho podkladu se posune výrazně jinam, celkový korelační koeficient po 2 letech může vyjít záporný (i kdyby i v druhém roce byla korelace mezi podklady kladná) – viz graf DVN-BK. V případě velkého cenového skoku se v grafu derivací cen objeví jenom jeden bod, který je výrazně vzdálený od ostatních (kdyby tento bod dělal potíže, bylo by asi jednoduché ho odfiltrovat).
  2. Při pohledu na více takových dvojic grafů jsme zjistili, že vypadají různě a rozhodně nepřipomínají normální rozdělení. Na druhou stranu grafy denních derivací cen vypadají ukázkově jako 2D normální rozdělení protažené v některém směru. Přesně pro takové případy je vhodné použít korelační koeficient. Když se korelační koeficient použije na data, která nemají normální rozdělení, může být spíše zavádějící, než užitečný. Viz například příklady z Wikipedie:

Korelační matice denních změn ceny akcií

Normalizované korelační koeficienty denních rozdílů cen za období 2013-2017

Velká většina testovaných akcií je ve vzájemné pozitivní korelaci. Tedy, když trhy rostou (klesají), tak roste (klesá) současně většina akcií. Zohlednění vzájemných korelací při výběru akcií není jednoduché.

Korelační matice jsou hezká pomůcka, ale v jednom čísle pro dvojici akcií se zdaleka nedá vystihnout celá informace o vzájemných korelacích. Pořádné vyhodnocení a zahrnutí korelací do výběru podkladů není vůbec triviální záležitost. Korelogramy mají v sobě mnohem více informací, než prosté jedno číslo, ale je těžké z tolika grafů vyčíst nějakou užitečnou informaci.

Autor studie: RNDr. Peter Matvija, Ph.D.

Kategorie: Blog