Ha a Google Táblázatokat két adatkészlettel dolgozza fel, érdemes lehet összehasonlítani a kettőt annak meghatározásával, hogy az egyik milyen mértékben befolyásolja a másikat.
A korrelációk betekintést nyújthatnak abba, hogy van-e prediktív kapcsolat az x és y síkok között, de nem feltétlenül jelzik az ok-okozati összefüggést. Így használhatja a Google Táblázatokat az adatok összefüggéseinek azonosítására.
Mi a korreláció, és mire használhatod?
Ha két változó korrelál, az egyik meghatározhatja, hogy egy változó hogyan hat a másikra. De nagyon fontos megjegyezni, hogy a korreláció ebben az esetben nem jelenti a támaszkodást; csak azt mutatja, hogy két változó milyen szorosan és gyorsan hasonlít egymáshoz vagy kapcsolódik egymáshoz.
A statisztikai mérőszámok segítik az adatelemzés mögöttes trendek megértését. A korreláció a leggyakrabban használt statisztikai mérőszámok közé tartozik, és meghatározza, hogy két változó mennyire szorosan összefügg vagy függő.
A korrelációs együttható megértése a Google Táblázatokban
A Google Táblázatokban a korrelációs együtthatót a CORREL függvény segítségével számítják ki. A korrelációs együttható annak mérőszámaként szolgál, hogy az adathalmazok milyen szorosan kapcsolódnak egymáshoz. Használható a Pearson-szorzat-pillanat korrelációs együttható (r) lekérésére, ha két változó adatkészlettel rendelkezik. Ha többet szeretne megtudni erről az együtthatóról, akkor többet olvashat ebben az útmutatóban Statisztikák a Leardnál.
A három korrelációs mérőszám egyikével találkozhatunk. Minden mérés másképp határozza meg a változók közötti kapcsolatokat. Értéke -1 és +1 között van:
- -1 tökéletes negatív korrelációt jelöl: Ha egy korreláció korrelációs együtthatója -0,9 vagy annál kisebb, akkor azt erősen negatívnak mondják. Ez azt jelzi, hogy az adatok korrelálnak. Azonban az x változó folyamatosan növekszik, míg az y változó folyamatosan csökken.
- A 0 azt jelenti, hogy nincs kapcsolat: A változók nem korrelálnak, ha a korrelációs együttható nagyobb, mint 0,01, de kisebb, mint 0,1, mivel az egyes változók között nincs észrevehető kapcsolat. Függetlenek egymástól.
- A +1 tökéletes pozitív korrelációt jelez: Ha egy korreláció együtthatója 0,9 és 1 közé esik, akkor az erősen pozitívnak minősül. Ez azt jelzi, hogy a két változókészletben növekedés történt.
Egy együttható legmagasabb értéke az 1-es korrelációs együttható lehetett. Ha a korrelációs érték 1, az azt jelenti, hogy ha az adatokat ábrázolná, akkor az egyenes vonal létrehozásához teljesen igazodna.
Ha még mindig egy kicsit elveszett, ne aggódjon. Elmagyarázzuk a CORREL függvény szintaxisát, majd belemerülünk néhány valós példába, hogy segítsünk jobban megérteni. A legjobb illeszkedés vonalainak megértése és hogyan készítsünk trendvonalakat a Google Táblázatokban segíteni fog ebben.
CORREL függvény szintaxisa a Google Táblázatokban
=CORREL(adat_y, adat_x)
Bontsuk ezt részekre, és jobban megértsük, mit jelent minden kifejezés:
- =CORREL: Ez a Google Sheet függvény, amely meghatározza az r-t (az adatkészlet Pearson termék-pillanat korrelációs együtthatóját).
- adat_y: Ez a függő adatokat tartalmazó cellacsoportra vagy az adott cellák értéktartományára vonatkozik.
- adatok x: Ez vagy hivatkozás a független adatokat tartalmazó cellák tömbjére, vagy az adott cellák értéktartományára.
Ha az adatpontokat ábrázolná, a data_y az Y tengely, a data_x pedig az X tengely lenne. Észre fogja venni, hogy kétféleképpen lehet megadni az adattartományt. Akár referenciacella-tartomány, akár egyenes adatbevitel a függvényben választható.
A legtöbb esetben előnyösebb a referenciacella-tartomány használata. Ennek az az oka, hogy a táblázat valószínűleg már tartalmazza az Ön adatait. Referenciacellatartomány használatával elkerülhető a túlzott gépelés, amely felhasználói hibához vezethet.
CORREL függvénypéldák a Google Táblázatokban
Nézzünk meg néhány példát, hogy megértsük, hogyan kell használni a CORREL függvényt a Google Táblázatokban.
1. példa: Erős pozitív korreláció
Az első példa esetében tegyük fel, hogy az ingatlaniparban dolgozunk. Az alábbi táblázatban láthatjuk az Ön által értékesített földterületek hektárjainak felosztását, valamint a különböző földek eladott egységeinek számát a Google-táblázatában.
- Ha egy munkalapot követ, akkor először írja be a változók adatait a táblázatba, az alábbiak szerint:
- Kattintson a cellára C2
- típus =CORREL(
- Ezután folytatja a data_y beírását, ami esetünkben a hivatkozott cellatartomány A2:A6, majd írjon be egy vesszőt.
- Folytassa a data_x beírásával, amelyre esetünkben a következőképpen hivatkozunk B2:B6.
- Záró zárójellel fejezzük be, az alábbi ábrán látható módon:
- Végül nyomja meg Belép hogy visszaadja a cellában lévő két adat korrelációs együtthatóját C2.
A fent bemutatott példával 0,90-es korrelációs együtthatót kaptunk, ami erős pozitív korreláció, mivel értéke 0,9 és 1 közé esik. Ezért ez azt jelzi, hogy y változásával x is lényegében összehasonlítható módon változik.
Az alábbiakban egy XY szórási grafikonon látható példaminta adataink láthatók. Mint látható, a legjobb illeszkedés vonala közel van a grafikon adatpontjaihoz, ami alátámasztja azt az elképzelést, hogy az ábrák erősen korrelálnak.
Többet megtudhat róla XY szórásdiagramok létrehozása a Google Táblázatokban másik cikkünkben.
2. példa: Gyenge negatív korreláció
Ezúttal az „x és y változó” általánosabb példáját fogjuk használni a táblázatunkban. Szándékosan beépítettünk számokat a negatív korreláció bemutatására, amelyet a CORREL függvény az alábbiakban demonstrál:
Az y és x változók között nincs szoros kapcsolat, így az eredmény, amit az előző példánál kisebb korrelációs együtthatót kapunk. Az általunk elért eredmény -0,47. Ez azonban nem jelenti azt, hogy egyáltalán ne lenne összefüggés. Nézzünk meg még egyszer egy legmegfelelőbb sort, hogy megértsük.
Amint a szórásdiagramon látható, az adatpontok távolabb vannak a legjobb illeszkedés vonalától. Ezért kevesebb a korreláció, mint az első példában, de nincs semmi. Azt is észre fogja venni, hogy a legjobban illeszkedő vonal csökken. Ez negatív korrelációt mutat, az egyik érték csökken, ha a másik nő.
3. példa: Nincs kapcsolat
Itt van egy teljesen véletlenszerű számkészlet. Röviden érintsük meg ismét a CORREL funkció használatát:
- Írja be a Cellába C2 a CORREL képlet
- Érveink a következők A2:A10 és B2:B10
- Nyomja meg az Enter billentyűt
A C2-n visszaadott érték 0,02. Ha egy korrelációs együttható 0,01 és 0,1 közé esik, akkor azt állapítjuk meg, hogy a kérdéses változók nem korrelálnak, mivel nincs közöttük észrevehető kapcsolat. A változók közötti kapcsolatok teljesen függetlenek.
Az alábbiakban ugyanennek az ábrázolása látható egy szórási grafikonon. A legjobb illeszkedés vonala majdnem lapos, ami csekély korrelációt jelez a két adatkészlet között.
Könnyen korrelálja adatait a Google Táblázatokban
A korreláció kihívást jelenthet, ha nem sokat foglalkozol vele a középiskolában. Ez az útmutató minden alapelvvel foglalkozik, de továbbra is használnia kell a CORREL funkciót a Google Táblázatokban, hogy frissen tartsa az elméjében.
Ez egy hatékony funkció, mivel segít elkerülni a szóródási grafikonok készítését, és gyorsan megtalálja a trendeket az adatokban. Ennek ellenére ne féljen diagramokat hozzáadni, hogy segítsen a többi felhasználónak jobban megérteni a táblázatokban szereplő adatokat.