Kedves Publikáló! Keresse letölthető elektronkus könyv, CD/DVD szerződésünket, vagy kérjen egyedi ajánlatot emailben! tollforgato.lap@gmail.com
Statisztikai, ökonometriai elemzéssel (reményeim szerint) megfejtettem a rejtélyt! Vak tyúk is…
Nyugdíjas üzemmérnök vagyok, a statisztikai és ökonometriai elemzésekbe autodidakta módon ástam bele magam.
Évek óta megszállottan kutatom a Covid-19 világjárvány keletkezésének és lefolyásának okait, elsősorban a világhálón rendelkezésre álló adatok ökonometriai elemzésével. Nehezen hihető, de talán rájöttem a megoldásra.
A következtetéseimet a végén kezdem, a levélben a legfontosabb megállapításaimat sorolom fel, az elemzést és a kapcsolódó teszteket és a bizonyító grafikonokat a csatolt mellékletben tüntetem fel.
Forrásaim:
https://www.worldometers.info/coronavirus/
https://www.eupedia.com/europe/european_y-dna_haplogroups.shtml
Összegzés a megjelölt források elemzésével
A Covid-19 világjárvány a Föld kontinensei közül világviszonylatban Európát veszélyeztette a legnagyobb mértékben, ami az átlagos lélekszám-arányos halálozást, de főleg a megbetegedés-arányos halálozást (halál/eset) illeti.
A világjárvány a Föld 220 országa közül a Közép-Kelet-Európai, Balkáni, Balti országokat, belértve Oroszországot és Moldovát is veszélyeztette a legnagyobb mértékben, ami az átlagos halálozást illeti.
A világjárvány a Föld 220 országa közül Ukrajna szomszédait, és az attól dél-nyugatra fekvő Balkáni országokat valamint magát Ukrajnát veszélyeztette a legnagyobb mértékben, ami a halálozást illeti.
A világjárvány a Balkáni, Balti országok közül Bosznia-Hercegovinát, Litvániát, a Közép-Kelet-Európai országok közül a V4-országokat és Romániát veszélyeztette a legnagyobb mértékben, ami a halálozást illeti.
A világjárvány világviszonylatban Bosznia-Hercegovinát, Bulgáriát és Magyarországot veszélyeztette a legnagyobb mértékben, ami az átlagos halálozást illeti. Egyedül Peru mortalitási mutatói rosszabbak az említetteknél, de részletes vizsgálatomat csak az európai országokra terjesztettem ki. Erről majd később tennék említést.
Rábukkantam egy genetikai szignifikanciára, amit az interneten elérhető különböző elemző tanulmányok a járvány 2020-as I. félévi lefutását követően, feltűnő gyorsasággal a férfiak Y kromoszómájának
R1b haplocsoportjával hoztak összefüggésbe úgy a megbetegedés, mint a halálozás mértékét illetően.
Ámde!
A megállapítás csak 2020 tavaszára, a járvány első hullámára igaz, hiszen az (eltekintve Kínától) főleg csak a Nyugat-Európai, Dél-Európai- és Skandináv országokat sújtotta abban az időszakban. A későbbiek során más haplocsoportok vizsgálatával nem találkoztam az interneten elérhető tanulmányok között, azóta sincs ilyen dolgozat vagy elemzés.
A járvány európai lefutását egészen annak "kifulladásáig",2023-ig elemeztem. Nem kizárt, hogy túlértékelem "felfedezésemet", de – így 70 fölött - nincs mire várnom, meg kell osztanom.
A Covid-19 világjárvány interneten elérhető mutatóival https://www.worldometers.info/coronavirus/
és az európai országok férfi lakossága Y kromoszómájának haplocsoportjaival https://www.eupedia.com/europe/european_y-dna_haplogroups.shtml
az alábbi táblázatot hoztam létre. A táblázatban valamennyi európai ország haplocsoportjainak átlagát és Covid-19 mutatóinak átlagát tüntettem fel országos bontásban. Összesen 40 európai ország 10 haplocsoportjának és 6 Covid-mutatójának összefüggéseit elemeztem, kiegészítve az országok lélekszámával, népsűrűségével és az országok Ukrajnától mért távolságával. Jobb híján Kijev és 39 főváros légvonalban számított távolságát használtam.
Kollinearitást, multikollinearitást, heteroszkedaszticást, regressziót is vizsgáltam az excel- és elsősorban a Gretl ökonometriai szoftver OLS (Legkisebb Négyzetek Módszere) használatával. Ennek tudásanyaga nincs teljes mértékben a birtokomban, autodidakta módon ástam bele magam a módszertanokba, így tévedés előfordulhat.
A világjárvány interneten hozzáférhető mutatóinak vizsgálata és elemzése alapján az a feltételezésem (hipotézisem), hogy Európában a Covid-járvány alakulását, különösen a megbetegedés-arányos halálozás (halál/eset) mértékét a
- férfi "Y" kromoszóma I2a és E1b1b haplocsoportjának országonkénti összege és annak aránya,
- a regionalitás, az országoknak a kontinensen belüli földrajzi elhelyezkedése és az Európában uralkodó szélirány,
- a lélekszámarányos megbetegedés (eset/lélekszám) országonkénti mértéke, (ami szorosan összefügg a tesztelés mértékével!),
- az európai országok Ukrajnától mért távolsága (km légvonalban – jobb híján - a fővárosok között) együtt határozza meg.
(Utóbbi magyarázó változót a modell tesztelése során alkalmaztam, a Gretl grafikonjai között fel fogom tüntetni.)
A regresszió analízis és a Gretl OLS modelljei lefuttatásának végeredményeképpen a megbetegedés-arányos halálozás (halál/eset függő változó) szórásnégyzetének közel 70,00%-át magyarázza meg az a modell, amelyben a magyarázó (független változók) az I2a+E1b1b haplocsoport aránya, valamint a lélekszámarányos megbetegedés mértéke.
Ez esetünkben (keresztmetszeti regresszió vizsgálat) nagyon nagy mértékű összefüggésre, szignifikanciára utal.
Magának a regressziónak az értéke: R = 84%, R2=71%, korrigált R2=69%.
A tesztelés során a modellből kimaradt (de vizsgált!) mutatók (független változók) közül az Ukrajnától mért távolságot találtam még olyannak, amely szignifikáns módon befolyásolja a megbetegedés-arányos halálozást.
A melléklet grafikonjai között valamennyit fel fogom tüntetni, egészen elképesztő az összefüggések feltárulása!
Arra kérem Önt, hogy ökonomiai elemzésekben, a Gretl OLS programjának használatában járatos szakember közreműködésével szíveskedjék leellenőrizni megállapításaim helyességét és kérnék arról egy visszajelzést is.
Szívesen állok személyesen is rendelkezésre, amennyiben az egyszerűsítheti egy-egy megállapítás forrásának megtalálását, értelmezését, a nem tudományos részletességű és felépítésű tanulmányom saját magyarázatát.
Alább jelenítem meg a Gretl program OLS módszer regresszió analízisének legjobb modelljét, amely – mostani tudásom szerint – teljes egészében megfelel a regresszió számítás elvárt követelményeinek.
Ceteris paribus, minden más tényező válzozatlanul hagyása mellett amennyiben egy egységgel (%) változik az
I2a+E1b1b %-os aránya, 2, 02361 fővel változik a halál/megbetegedés (tehát a halál/eset ) mutató. Magyarul minél nagyobb a két haplocsoport (I2a+E1b1b) aránya, elegye, keveréke, annál nagyobb a halálozás mértéke, hiszen az előjele pozitív.
Ceteris paribas, minden más tényező változatlanul hagyása mellet, amennyiben egy egységgel növekszik a megbetegedés/lélekszám mutató, -3,04697e-06 fővel csökken a halál/eset mutató, Magyarul minél nagyobb az eset/lélekszám, annál kisebb a halálozás mértéke, hiszen az előjele negatív.
Itt érdemes megemlíteni azt a rendkívül fontos tényt, hogy bár a legjobb modellünkben nem szerepel a lélekszámarányos tesztelés mértéke, azonban a háttérben, a többi független változó között, a modellek vizsgálata során górcső alá került, de nem került be a legjobb modellbe. Nem hagyhatjuk figyelmen kívül a tesztelés mértékének közvetett hatását! Minél több tesztet végez egy ország, értelemszerűen annál többen akadnak fenn betegként a teszten, így közvetve befolyásolja a megbetegedés/lélekszám mutatót akár pozitív, akár negatív irányba. Jó példa erre a táblázatból Ausztria és Dánia brutális mértékű tesztelése, ahol több mint húsz millió (20.000.000) tesztet végeztek el lélekszámarányosan. A másik véglet Bosznia-Hercegovina, ahol mindössze 580.040 tesztet végeztek el lélekszámarányosan, azaz 40-szer kevesebbet, mint a fent említett két országban.
A pontdigram, a korrelácóanalízis és a regresszió-számítás után megállapítható, hogy a lélekszámarányos- illetve megbetegedés arányos halálozás tekintetében a Közép-Kelet Európai és Balkáni országokat 2-3 szoros mértékben sújtotta a világjárvány. mindeközben a Dél-Európai, a Közép-Nyugat Európai és a Skandi-Balti régiókban a 2020-as év első hullámától eltekintve nem okozott kiemelkedő mortalitást. Ugyanezekben a - nevezzük - nyugati országokban az E1b1b és I2a haplocsoport jelenléte jóval alacsonyabb. A férfiak halálozási aránya Európában átlagosan kétszerese volt a nőkénél, ám keleten jóval magasabb szinten. Az un. "többlethalálozási mutató" ugyanezt a tendenciát követte a keleti országokban. Ellenben északon, nyugaton és délen átlagosan háromszor annyi lélekszámarányos tesztet végeztek, mint Közép-Kelet-Európában és a Balkánon. (Lásd: táblázatok.)
A rendkívül magas (vagy alacsony) lélekszámarányos tesztelés mértéke befolyásolja a megbetegedések számát, hiszen értelemszerűen többen (kevesebben) akadnak fenn a vizsgálat során. A megbetegedés-arányos mortalitást ellenben (látszólag) csökkenti, hiszen annak kiszámításánál a nevezőbe nagyobb szám kerül, így a hányados (halálozás) ennek megfelelően kisebb lehet a valóságnál. Fordítva is igaz: a túlságosan alacsony lélekszámarányos tesztelés csökkenti a lejelentett megbetegedések számát, ezáltal a halálozást (látszólag) növeli, hiszen annak kiszámításánál a nevezőbe kisebb szám kerül. (Megj: ez pl. a nagy lélekszámú afrikai országokra jellemző. A Közel-Keleti, Észak-Afrikai, Dél-Amerikai és a karibi térség országait külön vizsgáltam, de részletes haplocsoport adatok ismeretének hiányában nem tudtam teljeskörűen elvégezni. Számításaim szerint ezeknél az országoknál csak az E1b1b haplocsoport jelenléte játszik meghatározó szerepet a halálozás tekintetében.
A világ valamennyi országának halálozási mutatóit is figyelembe véve megállapítható, hogy a valós összefüggések kialakításához a lélekszámarányos halálozás és a megbetegedésarányos halálozás mértékét együtt kell vizsgálni, hiszen külön-külön vizsgálva a lélekszámarányos tesztelés mértéke torzíthatja a valós mortalitási mutatókat akár pozitív, akár negatív irányban.
Ha együtt vizsgáljuk a két halálozási mutatót, akkor az alábbi megállapításokra juthatunk.
A világjárvány lefolyásakor a legveszélyeztetettebb földrész Európa volt.
A kontinensen belül az Ukrajnával szomszédos országokban, illetve a Közép-Kelet Európai- és a Balkáni országokban volt a legmagasabb a két halálozási mutató.
2022. februárjában, az ukrajnai háború kirobbanásakor Oroszországban kiemelkedően magas volt a napi megbetegedések száma, február 11-én 203 949 fő napi új esetet regisztráltak!
A Gretl program OLS becslő függvényével létrehozott legjobb modell részletes bemutatása a Covid-19 európai mutatóinak és a haplo csoportok adatainak elemzésével. A vizsgált mutató (függő változó )
a megbetegedés-arányos halálozás (halál/eset), amely a haplocsoportok függvényében sokkal pontosabban ábrázolja a járvány hatását, mint a lélekszámarányos halálozás (halál/lélekszám).
A legjobb regressziós modell, amelyben az Eset/lélekszám és az I2a+E1b1b független változók közel 70%-os mértékben magyarázzák a halál/megbetegedésszám (halál/eset) függő változót. A modellben két olyan független változó „nem fért be” az elemzés során, amelyek közvetve ugyan, de befolyásolják a halál/eset mutatószámot. Az egyik ilyen lélekszámarányos tesztelés mértéke, a másik a (mint később kiderült) a távolság km.
A regressziós maradékok a kiinduló táblázat sorrendjében 1-től 40-ig mutatják az országok tényleges és becsült halál/megbetegedés közötti különbséget, azaz szórását a nulla vonalhoz, a null hipotézishez képest. A szórás a Balkáni országokban a legnagyobb úgy pozitív, mint negatív irányban. A Közép-Kelet Európai országok közül Magyarország (14. a sorban) eltérése a legnagyobb, mégpedig pozitív irányban. Tehát ebben a legjobbnak elemzett modellben Magyarország esetében nagyobb a tényleges halál/eset, mint annak a program szerinti becsül értéke.
A regressziós maradékok az országok feltüntetésével
Gretl OLS regresszió
Model 1: OLS, using observations 1-40
Dependent variable: halal__eset
Heteroskedasticity-robust standard errors, variant HC1
A független változók között nincs kollinearitási probléma
Variance Inflation Factors
Minimum possible value = 1.0
Values > 10.0 may indicate a collinearity problem
Eset__lelekszam 1,197
I2a__E1b1b 1,197
VIF(j) = 1/(1 - R(j)^2), where R(j) is the multiple correlation coefficient
between variable j and the other independent variables
Belsley-Kuh-Welsch collinearity diagnostics:
variance proportions
lambda cond const Eset__le~ I2a__E1b~
2,817 1,000 0,005 0,006 0,024
0,157 4,230 0,033 0,067 0,937
0,025 10,570 0,961 0,927 0,039
lambda = eigenvalues of inverse covariance matrix (smallest is 0,0252181)
cond = condition index
note: variance proportions columns sum to 1.0
According to BKW, cond >= 30 indicates "strong" near linear dependence,
and cond between 10 and 30 "moderately strong". Parameter estimates whose
variance is mostly associated with problematic cond values may themselves
be considered problematic.
Count of condition indices >= 30: 0
Count of condition indices >= 10: 1
Variance proportions >= 0.5 associated with cond >= 10:
const Eset__le~
0,961 0,927
Halál/eset range-mean plot (tartomány-átlag diagram)