Корелација

Шта је корелација:

Корелација значи сличност или однос између две ствари, људи или идеја . То је сличност или еквивалентност која постоји између две различите хипотезе, ситуације или објеката.

У области статистике и математике, корелација се односи на меру између две или више сродних варијабли.

Термин корелација је женска именица која потиче од латинског корелата.

Ријеч корелација може бити замијењена синонимима као што су: релација, једнаџба, нексус, кореспонденција, аналогија и веза.

Коефицијент корелације

У статистици, Пеарсонов коефицијент корелације (р), који се такође назива коефицијент корелације производа-тренутак, мери однос између две варијабле унутар исте метричке скале.

Функција коефицијента корелације је да одреди интензитет односа који постоји између познатих скупова података или информација.

Вредност коефицијента корелације може варирати између -1 и 1, а добијени резултат одређује да ли је корелација негативна или позитивна.

За тумачење коефицијента потребно је знати да 1 значи да је корелација између варијабли савршено позитивна и -1 значи да је савршена негативна . Ако је коефицијент једнак 0, то значи да варијабле не зависе једна од друге.

У статистици постоји и Спеарманов коефицијент корелације, који носи ово име у част статистичара Цхарлеса Спеармана. Функција овог коефицијента је мјерење интензитета односа између двије варијабле, било да су линеарне или не.

Спеарманова корелација служи за процјену да ли се интензитет односа између двије анализиране варијабле може мјерити монотоном функцијом (математичка функција која чува или инвертира почетни однос реда).

Израчунавање Пеарсоновог коефицијента корелације

Метод 1) Израчунавање Пеарсоновог коефицијента корелације помоћу коваријансе и стандардне девијације.

Где?

С КСИ је коваријанца;

С к и С и представљају стандардну девијацију варијабли к и и.

У овом случају, рачунање подразумијева прво проналажење коваријанције између варијабли и стандардне девијације сваке од њих. Тада је коваријанца подељена множењем стандардних девијација.

Често, изјава већ даје или стандардне девијације варијабли, или коваријанцу између њих, само примјеном формуле.

Метод 2) Израчунавање Пеарсоновог коефицијента корелације са сировим подацима (без коваријанце или стандардне девијације).

Са овом методом, најизравнија формула је следећа:

На пример, под претпоставком да имамо податке са н = 6 опсервација две варијабле: ниво глукозе (и) и старост (к), прорачун следи следеће кораке:

Корак 1) Направите табелу са постојећим подацима: и, к, и и додајте празне колоне за ки, к² и и²:

Корак 2: Помножите к и и да попуните колону "ки". На пример, у реду 1 имамо: к1и1 = 43 × 99 = 4257.

Корак 3: Подигните вриједности ступца к и забиљежите резултате у ступцу к². На пример, у првој линији имаћемо к 1 2 = 43 × 43 = 1849.

Корак 4: Урадите исто као у кораку 3, сада користите и ступац и забиљежите квадрат ваших вриједности у и² ступцу. На пример, у првом реду имаћемо: и 1 2 = 99 × 99 = 9801.

Корак 5: Набавите збир свих бројева колона и поставите резултат у подножје ступца. На пример, збир колоне Аге Кс је једнак 43 + 21 + 25 + 42 + 57 + 59 = 247.

Корак 6: Користите горњу формулу за добијање коефицијента корелације:

Дакле, имамо:

Спеарманов коефицијент корелације

Израчунавање Спеармановог коефицијента корелације је нешто другачије. За ово морамо да организујемо наше податке у следећој табели:

1. Након што смо изговорили 2 пара података, морамо их увести у табелу. На пример:

2. У колони "Рангирање А" класификујемо опсервације које су у "Датуму А" на растући начин, са "1" је најнижа вриједност у колони, ен (укупан број запажања), највиша вриједност у ступцу "Датум А" ". У нашем примеру то је:

3. Исто чинимо да добијемо рубрику "Рангирање Б", сада користећи примедбе у колони "Дата Б": \ т

4. У колони "д" стављамо разлику између два рангирања (А - Б). Овде сигнал није важан.

5. Повећајте сваку вредност у колони "д" и забележите у колони д²:

6. Додајте све податке из ступца "д²". Ова вредност је Σд². У нашем примеру Σд² = 0 + 1 + 0 + 1 = 2

7. Сада користимо Спеарманову формулу:

У нашем случају, н је једнако 4, јер посматрамо број редова података (који одговара броју опажања).

8. Коначно, замјењујемо податке у претходној формули:

Линеарна регресија

Линеарна регресија је формула која се користи за процјену могуће вриједности варијабле (и) када су познате вриједности других варијабли (к). Вредност "к" је независна или објашњавајућа променљива и "и" је зависна варијабла или одговор.

Линеарна регресија се користи за проверу како вредност "и" може да варира као функција променљиве "к". Линија која садржи вредности провере варијанце назива се линија линеарне регресије.

Ако експланаторна варијабла "к" има једну вриједност, регресија ће се назвати једноставна линеарна регресија .