Korelacio: Malsamoj inter versioj

[kontrolita revizio][nekontrolita versio]
Enhavo forigita Enhavo aldonita
eNeniu resumo de redakto
Aldono de paragrafo pri matrico de korelacio
Linio 7:
Kalkuli koeficienton de korelacio inter du nombraj variabloj estas serĉi resumi la ligon, kiu ekzistas inter la variabloj per [[rekto]]. Oni ial nomas ĝin ''lineara alĝustigo''.
 
Kiel kalkuli la parametrojn de tia rekto? per minimumigo de la eraro, kiun ni kulpas fare de la reprezento de la ligo inter niaj variabloj per tia rekto. La formala [[kriterio]] ofte uzata, sed ne la ununura, estas minimumigi la sumon de ĉiuj kvadratoj de enhavantaj eraroj. Oni ial nomas ĝin ''alxustgoalĝustigo laŭ la [[metodo de kvadrataj minimumoj]]''. La rekto rezultigata de tia alĝustigo nomiĝas ''rekto de [[regreso (statistiko)|regreso]]''.
 
== Lineara korelaciokoeficiento de Pearson ==
Linio 14:
 
Kiam oni studas du [[hazarda variablo|hazardajn variabojn]] ''X'' kaj ''Y'' pri statistika [[statistika loĝantaro| loĝantaro]], komune uzata metodo estas per la ''korelaciokoeficiento de Pearson'', kies nomo devenas de la metodo kreita de la brita matematikisto ''Karl Pearson''. Tiu koeficiento simboliĝas per <math>\rho_{XY} \ </math>, kaj kalkuliĝas per la sekvanta matematika [[esprimo (matematiko)|esprimo]]:
:::<math>\rho_{XY} = \mathrm{kor} (X,Y) = \frac{\sigma_{XY}}{\sigma_X \cdot \sigma_Y} = \frac{
\operatorname{E} [(X-\mu)(Y-\nu)] }{
\sqrt{\operatorname{E} [(X-\mu)^2]} \cdot \sqrt{\operatorname{E} [(Y-\nu)^2]}
Linio 119:
 
Ĉi tiuj ekzemploj indikas ke la korelaciokoeficiento, kiel statistika resumo, ne permesas anstataŭigi vidan ekzamenon de la [[dateno]]j.
 
== Matrico de korelacio ==
 
La matrico de korelacio de ''n'' hazardaj variabloj ''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> estas la ''n''&nbsp; × &nbsp;''n'' [[matrico]], kies ''i'',''j'' elemento estas kor(''X''<sub>''i''</sub>,&nbsp;''X''<sub>''j''</sub>). Se la korelacio estas taksita per linearaj korelaciokoeficientoj, la matrico de korelacio estas la sama ol la [[matrico de varianco-kunvarianco]] de la ''normigitaj hazardaj variabloj'': ''X''<sub>''i''</sub> / &sigma;(''X''<sub>''i''</sub>) for ''i'' = 1,&nbsp;...,&nbsp;''n''. Tio validas pri ambaŭ matrico de korelacioj de loĝantaro (tiel "&sigma;" estas la loĝantara [[norma diferenco]]), kaj la matrico de specimenaj korelacioj (tiel "&sigma;" estas la specimena norma diferenco). Konsekvence, ĉiu estas nepre [[pozitive difinita matrico|pozitive duondifinita matrico]].
 
La matrico de korelacio estas ankaŭ [[simetria matrico|simetria]], ĉar la korelacio inter ''X''<sub>''i''</sub> kaj ''X''<sub>''j''</sub> estas la sama ol la korelacio inter ''X''<sub>''j''</sub> kaj &nbsp;''X''<sub>''i''</sub>.
 
== Vidu ankaŭ ==