A Python, mint nyelv, mérhetetlenül értékes, különösen akkor, ha strukturált adatokkal szeretne dolgozni. Mivel az emberek sok adatot tárolnak Excel-fájlokban, elengedhetetlen, hogy több fájlt konszolidáljon, hogy időt és energiát takarítson meg.
A Python pontosan ezt teszi lehetővé; nem számít, hány Excel-fájlt szeretne kombinálni, viszonylag egyszerűen megteheti. A könyvtárak és a harmadik féltől származó erőforrások skálájának köszönhetően importálhatja és használhatja a Python sokoldalú eszközeit az ajánlattételhez.
Ebben az útmutatóban telepítenie kell és használnia kell a Pandas könyvtárakat, hogy adatokat importáljon a Pythonba, mielőtt konszolidálja azokat.
Telepítse a Pandas Libraries alkalmazást a Pythonban
A Pandas egy harmadik féltől származó könyvtár, amelyet telepíthet a Pythonban. Néhány IDE-ben már Pandák vannak telepítve.
Ha egy IDE verzió amihez nem tartozik előre telepített Panda, biztos lehetsz benne, hogy közvetlenül a Pythonban telepítheted.
A Pandák telepítése a következőképpen történik:
pip install pandák
Ha Jupyter Notebookot használ, a Pandákat közvetlenül a következővel telepítheti PIP parancs. Leginkább, ha telepítette a Jupytert az Anacondával, nagy az esélye annak, hogy a Pandák már rendelkezésre állnak közvetlen használatra.
Ha nem tudja hívni a Pandákat, a fenti paranccsal közvetlenül telepítheti őket.
Excel fájlok kombinálása Pythonnal
Először is létre kell hoznia egy mappát a kívánt helyen az összes Excel-fájllal. Ha a mappa készen áll, elkezdheti írni a kódot a könyvtárak importálásához.
Ebben a kódban két változót fog használni:
- Pandák: A Pandas könyvtár adatkereteket biztosít az Excel fájlok tárolására.
- OS: A könyvtár hasznos adatok olvasásához a gép mappájából
A könyvtárak importálásához használja az alábbi parancsokat:
Pandák importálása pd-ként
OS importálása
- Importálás: Python szintaxis, amelyet a Python könyvtárak importálására használnak
- Pandák: A könyvtár neve
- pd: A könyvtárnak adott álnevet
- OS: Egy könyvtár a rendszermappa eléréséhez
Miután importálta a könyvtárakat, hozzon létre két változót a bemeneti és kimeneti fájl elérési útjának tárolására. A bemeneti fájl elérési útja szükséges a fájlok mappájának eléréséhez. A kimeneti fájl elérési útja szükséges, mivel a kombinált fájl oda lesz exportálva.
Ha Pythont használ, győződjön meg róla, hogy a fordított perjelet módosítsa előre perjelre (\ nak nek /)
input_file_path = "C:/Felhasználók/gaurav/OneDrive/Desktop/Excel-fájlok/"
output_file_path = "C:/Felhasználók/gaurav/OneDrive/Desktop/"
Hozzáfűzi a / végén is az ösvények befejezéséhez.
A mappa fájljai listában érhetők el. Hozzon létre egy listát a bemeneti mappa összes fájlhivatkozásának tárolásához a segítségével listdir funkció a OS könyvtár.
Ha nem biztos abban, hogy a könyvtárban milyen funkciók érhetők el, használhatja a dir függvényt a könyvtár nevével. Például a listdir függvény pontos verziójának ellenőrzéséhez a következő parancsot használhatja:
dir (OS)
A kimenet az operációs rendszer könyvtárában elérhető összes kapcsolódó funkciót tartalmazza. A listdir függvény egyike a könyvtárban elérhető számos funkció közül.
Hozzon létre egy új változót a mappából származó bemeneti fájlok tárolásához.
excel_file_list = os.listdir (bemeneti_fájl_útvonal)
Nyomtassa ki ezt a változót a mappában tárolt fájlok nevének megtekintéséhez. A nyomtatási funkció használata után a mappában tárolt összes fájl megjelenik.
nyomtatás (excel_file_list)
Ezután új adatkeretet kell hozzáadnia az egyes Excel-fájlok tárolásához. Képzeljünk el egy adatkeretet adatok tárolására szolgáló tárolóként. Itt van az adatkeret létrehozásának parancsa.
df = pd. DataFrame()
- df: Változó a DataFrame értékének tárolására
- pd: Alias a Panda könyvtár
- DataFrame: Adatkeret hozzáadásának alapértelmezett szintaxisa
A beviteli mappában három található .xlsx fájlokat ebben a példában. A fájlnevek a következők:
Fájl1_excel.xlsx
Fájl2_excel.xlsx
Fájl3_excel.xlsx
Az egyes fájlok megnyitásához ebből a mappából egy ciklust kell futtatnia. A ciklus futni fog a fent létrehozott listában szereplő összes fájlra.
A következőképpen teheti meg:
az excel_file_listben található excel_files esetén:
Ezután ellenőrizni kell a fájlok kiterjesztését, mivel a kód csak az XLSX fájlokat nyitja meg. Ezen fájlok ellenőrzéséhez használhat egy Ha nyilatkozat.
Használja a végződik funkció erre a célra, az alábbiak szerint:
az excel_file_listben található excel_files esetén:
if excel_files.endswith(.xlsx"):
- excel_files: Lista az összes fájlértékkel
- végződik: A fájlok kiterjesztésének ellenőrzésére szolgáló funkció
- (.xlsx"): Ez a karakterlánc értéke attól függően változhat, hogy mit szeretne keresni
Most, hogy azonosította az Excel-fájlokat, létrehozhat egy új adatkeretet a fájlok egyenkénti olvasásához és tárolásához.
az excel_file_listben található excel_files esetén:
if excel_files.endswith(.xlsx"):
df1 = pd.read_excel (bemeneti_fájl_útvonal+excel_fájlok)
- df1: Új adatkeret
- pd: Panda könyvtár
- read_excel: A Pandas könyvtárban található Excel-fájlok olvasására szolgáló funkció
- input_file_path: A fájlok tárolására szolgáló mappa elérési útja
- excel_files: A for ciklusban használt bármely változó
A fájlok hozzáfűzésének megkezdéséhez használja a mellékel funkció.
az excel_file_listben található excel_files esetén:
if excel_files.endswith(.xlsx"):
df1 = pd.read_excel (bemeneti_fájl_útvonal+excel_fájlok)
df = df.append (df1)
Végül, most, hogy az összevont adatkeret készen áll, exportálhatja azt a kimeneti helyre. Ebben az esetben az adatkeretet XLSX-fájlba exportálja.
df.to_excel (output_file_path+"Consolidated_file.xlsx")
- df: Exportálandó adatkeret
- felülmúlni: Az adatok exportálására használt parancs
- output_file_path: Meghatározott elérési út a kimenet tárolására
- Consolidated_file.xlsx: Az összevont fájl neve
Most pedig nézzük a végső kódot:
A #Pandas adatkeretként szolgál az Excel fájlok kezelésére
import pandákat pd-ként
import os# módosítsa a perjelet „\”-ről „/”-re, ha Windows-eszközöket használ
input_file_path = "C:/Felhasználók/gaurav/OneDrive/Desktop/Excel-fájlok/"
output_file_path = "C:/Felhasználók/gaurav/OneDrive/Desktop/"#hozzon létre egy listát a bemeneti mappa összes fájlhivatkozásának tárolásához az operációs rendszer könyvtárának listdir funkciójával.
#A könyvtár tartalmának megtekintéséhez (például a listdir függvényhez használhatja a könyvtár nevében a dir függvényt).
#A tartalom listázásához használja a könyvtárat (könyvtár_neve).excel_file_list = os.listdir (bemeneti_fájl_útvonal)
#nyomtassa ki a mappában tárolt összes fájlt a lista meghatározása után
excel_file_list#Ha minden fájl megnyílik, használja a hozzáfűzés funkciót a több fájlban tárolt adatok összevonásához
#hozzon létre egy új, üres adatkeretet az Excel fájlok importálásához
df = pd. DataFrame()#Futtasson le egy for ciklust a lista egyes fájljainak végigjátszásához
az excel_file_listben található excel_files esetén:
#csak az .xlsx utótag fájlokat ellenőrizze
if excel_files.endswith(.xlsx"):
#hozzon létre egy új adatkeretet az egyes Excel-fájlok olvasásához/megnyitásához a fent létrehozott fájlok listájából
df1 = pd.read_excel (bemeneti_fájl_útvonal+excel_fájlok)
#hozzáfűz minden fájlt az eredeti üres adatkerethez
df = df.append (df1)
#vigye át a végső kimenetet egy Excel (xlsx) fájlba a kimeneti útvonalon
df.to_excel (output_file_path+"Consolidated_file.xlsx")
Python használata több Excel-munkafüzet kombinálásához
A Python's Pandas kiváló eszköz kezdőknek és haladóknak egyaránt. A könyvtárat széles körben használják azok a fejlesztők, akik szeretnék elsajátítani a Pythont.
Még ha kezdő is vagy, óriási hasznot húzhat, ha megtanulja a Pandák árnyalatait és a könyvtár használatát a Pythonban.
Ismerje meg a Pandákat ezekkel a kezdő műveletekkel.
Olvassa el a következőt
- Programozás
- Piton
- Microsoft Excel
- Táblázat
Gaurav Siyal két éves írási tapasztalattal rendelkezik, számos digitális marketingcégnek ír és szoftver-életciklus-dokumentumokat írt.
Iratkozzon fel hírlevelünkre
Csatlakozzon hírlevelünkhöz műszaki tippekért, ismertetőkért, ingyenes e-könyvekért és exkluzív ajánlatokért!
Kattintson ide az előfizetéshez