A Pandas egy nyílt forráskódú Python-könyvtár, amelyet elsősorban adatkezelésre és -elemzésre használnak. A NumPy könyvtárra épül, és nagy teljesítményű, könnyen használható adatstruktúrákat és adatelemző eszközöket biztosít a Python programozási nyelvhez.

Ebből a cikkből megtudhatja, hogyan hajthat végre 6 alapvető műveletet a Pandákkal.

Pandák példái segítségével

A cikkben szereplő példákat olyan számítási jegyzetfüzetekkel futtathatja, mint pl Jupyter jegyzetfüzet, Google Colabstb. A példákat úgy is futtathatja, hogy interaktív módban közvetlenül beírja a kódot a Python interpreterbe.

Ha meg szeretné tekinteni a cikkben használt teljes forráskódot, a Python Notebook fájlt innen érheti el. GitHub adattár.

1. Hogyan importáljunk pandákat pd-ként és nyomtassuk ki a verziószámot

Használnia kell a import kulcsszó bármely Python könyvtár importálásához. A pandákat jellemzően a pd álnév. Ezzel a megközelítéssel hivatkozhat a Pandas csomagra mint pd ahelyett pandák.

import pandákat pd-ként
nyomtatás (pd.__verzió__)
instagram viewer

Kimenet:

1.2.4

2. Hogyan készítsünk sorozatot a Pandákban

A Pandas Series egy egydimenziós tömb, amely bármilyen típusú adatot tartalmaz. Olyan, mint egy oszlop a táblázatban. Létrehozhat sorozatot numpy tömbök, numpy függvények, listák, szótárak, skalárértékek stb. használatával.

A sorozatok értékei indexszámukkal vannak ellátva. Alapértelmezés szerint az első érték indexe 0, a második érték indexe 1, és így tovább. A saját címkék elnevezéséhez használja a index érv.

Hogyan készítsünk üres sorozatot

s = pd. Sorozat (dtype='float64')
s

Kimenet:

Series([], dtype: float64)

A fenti példában egy üres sorozat a úszó adattípus jön létre.

Hogyan készítsünk sorozatot a NumPy tömb használatával

import pandákat pd-ként
import numpy mint np
d = np.array([1, 2, 3, 4, 5])
s = pd. sorozat (d)
s

Kimenet:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Összefüggő: NumPy műveletek kezdőknek

Hogyan készítsünk sorozatot a lista használatával

d = [1, 2, 3, 4, 5]
s = pd. sorozat (d)
s

Kimenet:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Hogyan készítsünk sorozatot indexel

Ahhoz, hogy indexet tartalmazó sorozatot hozzon létre, a index érv. Az indexek számának meg kell egyeznie a sorozat elemeinek számával.

d = [1, 2, 3, 4, 5]
s = pd. Sorozat (d, index=["egy", "kettő", "három", "négy", "öt"])
s

Kimenet:

egy 1
kettő 2
három 3
négy 4
öt 5
dtype: int64

Hogyan készítsünk sorozatot szótár segítségével

A szótár kulcsai a sorozat címkéivé válnak.

d = {"egy": 1,
"kettő": 2,
"három": 3,
"négy": 4,
"öt": 5}
s = pd. sorozat (d)
s

Kimenet:

egy 1
kettő 2
három 3
négy 4
öt 5
dtype: int64

Sorozat létrehozása skaláris érték használatával

Ha skaláris értékkel szeretne sorozatot létrehozni, meg kell adnia a index érv.

s = pd. Sorozat (1, index = ["a", "b", "c", "d"])
s

Kimenet:

egy 1
b 1
c 1
d 1
dtype: int64

3. Hogyan hozzunk létre adatkeretet a Pandasban

A DataFrame egy kétdimenziós adatstruktúra, amelyben az adatok sorok és oszlopok formájában vannak egymáshoz igazítva. A DataFrame létrehozható szótárak, listák, szótárlista, numpy tömbök stb. használatával. A valós világban a DataFrame-eket a meglévő tárhelyek, például CSV-fájlok, Excel-fájlok, SQL-adatbázisok stb. felhasználásával hozzák létre.

A DataFrame objektum számos attribútumot és metódust támogat. Ha többet szeretne megtudni róluk, tekintse meg a hivatalos dokumentációt pandas adatkeret.

Üres adatkeret létrehozása

df = pd. DataFrame()
nyomtatás (df)

Kimenet:

Üres DataFrame
Oszlopok: []
Index: []

Hogyan hozzunk létre egy DataFrame-et a lista használatával

listObj = ["MUO", "technológia", "egyszerűsített"]
df = pd. DataFrame (listObj)
nyomtatás (df)

Kimenet:

 0
0 MUO
1 technológia
2 egyszerűsítve

DataFrame létrehozása az ndarray/Lists szótár használatával

batmanData = {'Film neve': ['Batman kezdődik', 'The Dark Knight', 'The Dark Knight Rises'],
„Megjelenés éve”: [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
nyomtatás (df)

Kimenet:

 Film neve Megjelenés éve
0 Batman kezdődik 2005
1 A sötét lovag 2008
2 A sötét lovag felemelkedése 2012

Hogyan hozzunk létre egy DataFrame-et a listák listájával

adatok = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (adatok, oszlopok = ['Név', 'Roll No.'])
nyomtatás (df)

Kimenet:

 Névtekercs sz.
0 Alex 601
1 Bob 602
2 Katalin 603

Hogyan hozzunk létre egy DataFrame-et a szótárak listájával

data = [{'Név': 'Alex', 'Roll No.': 601},
{'Név': 'Bob', 'Roll No.': 602},
{'Név': 'Cataline', 'Tekercsszám': 603}]
df = pd. DataFrame (adat)
nyomtatás (df)

Kimenet:

 Névtekercs sz.
0 Alex 601
1 Bob 602
2 Katalin 603

Összefüggő: Hogyan alakíthatunk át egy listát szótárrá Pythonban

DataFrame létrehozása a zip() függvény használatával

Használja a postai irányítószám() függvény a listák egyesítéséhez Pythonban.

Név = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = lista (zip (Név, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Név', 'Roll No.'])
nyomtatás (df)

Kimenet:

 Névtekercs sz.
0 Alex 601
1 Bob 602
2 Katalin 603

4. CSV-adatok olvasása a Pandasban

A „vesszővel elválasztott értékek” (CSV) fájl egy elválasztott szövegfájl, amely vesszőt használ az értékek elválasztására. A CSV-fájlt a read_csv() módszer pandákban. Ha a teljes DataFrame-et ki szeretné nyomtatni, használja a to_string() módszer.

Ebben és a következő példákban ez CSV fájl a műveletek elvégzésére fogják használni.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.to_string())

Kimenet:

5. A DataFrame-ek elemzése a head(), a tail() és az info() metódusok használatával

Adatok megtekintése a head() módszerrel

Az fej() módszer az egyik legjobb módja a DataFrame gyors áttekintésének. Ez a metódus visszaadja a fejlécet és a sorok meghatározott számát, felülről kezdve.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.head (10))

Kimenet:

Ha nem adja meg a sorok számát, a rendszer az első 5 sort adja vissza.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.head())

Kimenet:

Az adatok megtekintése a tail() módszerrel

Az farok() metódus visszaadja a fejlécet és a sorok meghatározott számát, alulról kezdve.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.tail (10))

Kimenet:

Ha nem adja meg a sorok számát, a rendszer az utolsó 5 sort adja vissza.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.tail())

Kimenet:

Hogyan szerezhet információkat az adatokról

Az info() metódusok a DataFrame rövid összefoglalását adják vissza, beleértve a dtype indexet és a dtypes oszlopot, a nem null értékeket és a memóriahasználatot.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.info())

Kimenet:

6. JSON-adatok olvasása a Pandasban

JSON (JavaScript Otárgy Notation) egy könnyű adatcsere-formátum. A JSON-fájlt a read_json() módszer pandákban. Ha a teljes DataFrame-et ki szeretné nyomtatni, használja a to_string() módszer.

Az alábbi példában ez JSON fájl a műveletek elvégzésére szolgál.

Összefüggő: Mi az a JSON? A laikusok áttekintése

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
nyomtatás (df.to_string())

Kimenet:

Frissítse Python-tudását beépített függvényekkel és módszerekkel

A funkciók segítenek lerövidíteni a kódot és javítani annak hatékonyságát. Funkciók és módszerek, mint pl csökkenti(), hasított(), felsorol(), eval(), kerek()stb. robusztussá és könnyen érthetővé teheti a kódot. Mindig jó tudni a beépített funkciókról és módszerekről, mivel ezek nagymértékben leegyszerűsíthetik a programozási feladatokat.

RészvényCsipogEmail
20 Python-függvény, amit tudnia kell

A Python Standard Library számos olyan funkciót tartalmaz, amelyek segítik a programozási feladatokat. Ismerje meg a leghasznosabbakat, és hozzon létre robusztusabb kódot.

Olvassa el a következőt

Kapcsolódó témák
  • Programozás
  • Piton
  • Webfejlesztés
  • Programozás
  • Adatelemzés
A szerzőről
Yuvraj Chandra (69 publikált cikk)

Yuvraj az indiai Delhi Egyetem számítástechnikai egyetemi hallgatója. Szenvedélyesen rajong a Full Stack webfejlesztésért. Amikor nem ír, a különböző technológiák mélységeit kutatja.

Továbbiak Yuvraj Chandra-tól

Iratkozzon fel hírlevelünkre

Csatlakozzon hírlevelünkhöz műszaki tippekért, ismertetőkért, ingyenes e-könyvekért és exkluzív ajánlatokért!

Kattintson ide az előfizetéshez