A Pandas egy nyílt forráskódú Python-könyvtár, amelyet elsősorban adatkezelésre és -elemzésre használnak. A NumPy könyvtárra épül, és nagy teljesítményű, könnyen használható adatstruktúrákat és adatelemző eszközöket biztosít a Python programozási nyelvhez.
Ebből a cikkből megtudhatja, hogyan hajthat végre 6 alapvető műveletet a Pandákkal.
Pandák példái segítségével
A cikkben szereplő példákat olyan számítási jegyzetfüzetekkel futtathatja, mint pl Jupyter jegyzetfüzet, Google Colabstb. A példákat úgy is futtathatja, hogy interaktív módban közvetlenül beírja a kódot a Python interpreterbe.
Ha meg szeretné tekinteni a cikkben használt teljes forráskódot, a Python Notebook fájlt innen érheti el. GitHub adattár.
1. Hogyan importáljunk pandákat pd-ként és nyomtassuk ki a verziószámot
Használnia kell a import kulcsszó bármely Python könyvtár importálásához. A pandákat jellemzően a pd álnév. Ezzel a megközelítéssel hivatkozhat a Pandas csomagra mint pd ahelyett pandák.
import pandákat pd-ként
nyomtatás (pd.__verzió__)
Kimenet:
1.2.4
2. Hogyan készítsünk sorozatot a Pandákban
A Pandas Series egy egydimenziós tömb, amely bármilyen típusú adatot tartalmaz. Olyan, mint egy oszlop a táblázatban. Létrehozhat sorozatot numpy tömbök, numpy függvények, listák, szótárak, skalárértékek stb. használatával.
A sorozatok értékei indexszámukkal vannak ellátva. Alapértelmezés szerint az első érték indexe 0, a második érték indexe 1, és így tovább. A saját címkék elnevezéséhez használja a index érv.
Hogyan készítsünk üres sorozatot
s = pd. Sorozat (dtype='float64')
s
Kimenet:
Series([], dtype: float64)
A fenti példában egy üres sorozat a úszó adattípus jön létre.
Hogyan készítsünk sorozatot a NumPy tömb használatával
import pandákat pd-ként
import numpy mint np
d = np.array([1, 2, 3, 4, 5])
s = pd. sorozat (d)
s
Kimenet:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Összefüggő: NumPy műveletek kezdőknek
Hogyan készítsünk sorozatot a lista használatával
d = [1, 2, 3, 4, 5]
s = pd. sorozat (d)
s
Kimenet:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Hogyan készítsünk sorozatot indexel
Ahhoz, hogy indexet tartalmazó sorozatot hozzon létre, a index érv. Az indexek számának meg kell egyeznie a sorozat elemeinek számával.
d = [1, 2, 3, 4, 5]
s = pd. Sorozat (d, index=["egy", "kettő", "három", "négy", "öt"])
s
Kimenet:
egy 1
kettő 2
három 3
négy 4
öt 5
dtype: int64
Hogyan készítsünk sorozatot szótár segítségével
A szótár kulcsai a sorozat címkéivé válnak.
d = {"egy": 1,
"kettő": 2,
"három": 3,
"négy": 4,
"öt": 5}
s = pd. sorozat (d)
s
Kimenet:
egy 1
kettő 2
három 3
négy 4
öt 5
dtype: int64
Sorozat létrehozása skaláris érték használatával
Ha skaláris értékkel szeretne sorozatot létrehozni, meg kell adnia a index érv.
s = pd. Sorozat (1, index = ["a", "b", "c", "d"])
s
Kimenet:
egy 1
b 1
c 1
d 1
dtype: int64
3. Hogyan hozzunk létre adatkeretet a Pandasban
A DataFrame egy kétdimenziós adatstruktúra, amelyben az adatok sorok és oszlopok formájában vannak egymáshoz igazítva. A DataFrame létrehozható szótárak, listák, szótárlista, numpy tömbök stb. használatával. A valós világban a DataFrame-eket a meglévő tárhelyek, például CSV-fájlok, Excel-fájlok, SQL-adatbázisok stb. felhasználásával hozzák létre.
A DataFrame objektum számos attribútumot és metódust támogat. Ha többet szeretne megtudni róluk, tekintse meg a hivatalos dokumentációt pandas adatkeret.
Üres adatkeret létrehozása
df = pd. DataFrame()
nyomtatás (df)
Kimenet:
Üres DataFrame
Oszlopok: []
Index: []
Hogyan hozzunk létre egy DataFrame-et a lista használatával
listObj = ["MUO", "technológia", "egyszerűsített"]
df = pd. DataFrame (listObj)
nyomtatás (df)
Kimenet:
0
0 MUO
1 technológia
2 egyszerűsítve
DataFrame létrehozása az ndarray/Lists szótár használatával
batmanData = {'Film neve': ['Batman kezdődik', 'The Dark Knight', 'The Dark Knight Rises'],
„Megjelenés éve”: [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
nyomtatás (df)
Kimenet:
Film neve Megjelenés éve
0 Batman kezdődik 2005
1 A sötét lovag 2008
2 A sötét lovag felemelkedése 2012
Hogyan hozzunk létre egy DataFrame-et a listák listájával
adatok = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (adatok, oszlopok = ['Név', 'Roll No.'])
nyomtatás (df)
Kimenet:
Névtekercs sz.
0 Alex 601
1 Bob 602
2 Katalin 603
Hogyan hozzunk létre egy DataFrame-et a szótárak listájával
data = [{'Név': 'Alex', 'Roll No.': 601},
{'Név': 'Bob', 'Roll No.': 602},
{'Név': 'Cataline', 'Tekercsszám': 603}]
df = pd. DataFrame (adat)
nyomtatás (df)
Kimenet:
Névtekercs sz.
0 Alex 601
1 Bob 602
2 Katalin 603
Összefüggő: Hogyan alakíthatunk át egy listát szótárrá Pythonban
DataFrame létrehozása a zip() függvény használatával
Használja a postai irányítószám() függvény a listák egyesítéséhez Pythonban.
Név = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = lista (zip (Név, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Név', 'Roll No.'])
nyomtatás (df)
Kimenet:
Névtekercs sz.
0 Alex 601
1 Bob 602
2 Katalin 603
4. CSV-adatok olvasása a Pandasban
A „vesszővel elválasztott értékek” (CSV) fájl egy elválasztott szövegfájl, amely vesszőt használ az értékek elválasztására. A CSV-fájlt a read_csv() módszer pandákban. Ha a teljes DataFrame-et ki szeretné nyomtatni, használja a to_string() módszer.
Ebben és a következő példákban ez CSV fájl a műveletek elvégzésére fogják használni.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.to_string())
Kimenet:
5. A DataFrame-ek elemzése a head(), a tail() és az info() metódusok használatával
Adatok megtekintése a head() módszerrel
Az fej() módszer az egyik legjobb módja a DataFrame gyors áttekintésének. Ez a metódus visszaadja a fejlécet és a sorok meghatározott számát, felülről kezdve.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.head (10))
Kimenet:
Ha nem adja meg a sorok számát, a rendszer az első 5 sort adja vissza.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.head())
Kimenet:
Az adatok megtekintése a tail() módszerrel
Az farok() metódus visszaadja a fejlécet és a sorok meghatározott számát, alulról kezdve.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.tail (10))
Kimenet:
Ha nem adja meg a sorok számát, a rendszer az utolsó 5 sort adja vissza.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.tail())
Kimenet:
Hogyan szerezhet információkat az adatokról
Az info() metódusok a DataFrame rövid összefoglalását adják vissza, beleértve a dtype indexet és a dtypes oszlopot, a nem null értékeket és a memóriahasználatot.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nyomtatás (df.info())
Kimenet:
6. JSON-adatok olvasása a Pandasban
JSON (JavaScript Otárgy Notation) egy könnyű adatcsere-formátum. A JSON-fájlt a read_json() módszer pandákban. Ha a teljes DataFrame-et ki szeretné nyomtatni, használja a to_string() módszer.
Az alábbi példában ez JSON fájl a műveletek elvégzésére szolgál.
Összefüggő: Mi az a JSON? A laikusok áttekintése
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
nyomtatás (df.to_string())
Kimenet:
Frissítse Python-tudását beépített függvényekkel és módszerekkel
A funkciók segítenek lerövidíteni a kódot és javítani annak hatékonyságát. Funkciók és módszerek, mint pl csökkenti(), hasított(), felsorol(), eval(), kerek()stb. robusztussá és könnyen érthetővé teheti a kódot. Mindig jó tudni a beépített funkciókról és módszerekről, mivel ezek nagymértékben leegyszerűsíthetik a programozási feladatokat.
A Python Standard Library számos olyan funkciót tartalmaz, amelyek segítik a programozási feladatokat. Ismerje meg a leghasznosabbakat, és hozzon létre robusztusabb kódot.
Olvassa el a következőt
- Programozás
- Piton
- Webfejlesztés
- Programozás
- Adatelemzés
Yuvraj az indiai Delhi Egyetem számítástechnikai egyetemi hallgatója. Szenvedélyesen rajong a Full Stack webfejlesztésért. Amikor nem ír, a különböző technológiák mélységeit kutatja.
Iratkozzon fel hírlevelünkre
Csatlakozzon hírlevelünkhöz műszaki tippekért, ismertetőkért, ingyenes e-könyvekért és exkluzív ajánlatokért!
Kattintson ide az előfizetéshez