Az Instagram az egyik legnépszerűbb közösségi oldal, több milliárd felhasználóval. A diákoktól a hírességekig mindenkinek van Instagram-fiókja. Az Instagram nyilvános adatai rendkívül értékesek lehetnek a vállalkozások, marketingszakemberek és magánszemélyek számára. Bárki felhasználhatja ezeket az adatokat adatelemzés végrehajtására, célzott marketingre és betekintések generálására.
A Python segítségével olyan automatizált eszközt hozhat létre, amely kivonja az Instagram-adatokat.
A szükséges könyvtárak telepítése
Instaloader egy Python-könyvtár, amellyel nyilvánosan elérhető adatokat nyerhet ki az Instagramból. Hozzáférhet olyan adatokhoz, mint a képek, videók, felhasználónév, sz. bejegyzések száma, követők száma, követők száma, életrajza stb. az Instaloader segítségével. Vegye figyelembe, hogy az Instaloader semmilyen módon nem áll kapcsolatban az Instagrammal, nem engedélyezi, karbantartja vagy támogatja.
Az instaloader pip segítségével történő telepítéséhez futtassa a következő parancsot:
csipog telepítés telepítő
Biztos van pip telepítve van a rendszerére külső Python-könyvtárak telepítéséhez.
Ezután telepítenie kell a Pandas Python könyvtárat. A Pandas egy Python-könyvtár, amelyet elsősorban adatkezelésre és adatelemzésre használnak. A telepítéshez futtassa a következő parancsot:
csipog telepítés pandák
Most készen áll a kód beállítására és az adatok Instagramból való lekérésére.
A kód beállítása
Az Instagram adatlekérő eszköz beállításához importálnia kell az Instaloader Python könyvtárat, és létre kell hoznia egy példányt az Instaloader osztályból. Ezt követően meg kell adnia annak a profilnak az Instagram-fogóját, amelyből az adatokat kinyerni szeretné.
Az Instagram Extractor Python kód elérhető a GitHub adattár és az MIT licence alapján ingyenesen használható.
import telepítő
# Az Instaloader osztály példányának létrehozása
bot = telepítő. Instaloader()
# A profil betöltése egy Instagram fogantyúból
profil = telepítő. Profile.from_username (bot.context, 'Cristiano')
nyomtatás(profil)
Ez egy jó első lépés az alapok működésének ellenőrzéséhez. Jelentős adatokat kell látnia hiba nélkül:
Adatok kinyerése a profilból
Értékes, nyilvánosan elérhető adatokat nyerhet ki, mint például a felhasználónév, 2. sz. A bejegyzések közül a követők száma, a követők száma, az életrajz, a felhasználói azonosító és a külső URL az Instaloader használatával mindössze néhány sornyi kóddal. Csak a profil Instagram-fogóját kell megadnia.
import telepítő
import pandák mint pd# Az Instaloader osztály példányának létrehozása
bot = telepítő. Instaloader()
# Profil betöltése Instagram fogantyúból
profil = telepítő. Profile.from_username (bot.context, 'leomessi')
nyomtatás("Felhasználónév: ", profile.username)
nyomtatás("Felhasználói azonosító: ", profile.userid)
nyomtatás("Hozzászólások száma: ", profile.mediacount)
nyomtatás("Követők száma: ", profile.followers)
nyomtatás("Következő szám: ", profile.followees)
nyomtatás("Bio: ", profile.biography)
nyomtatás("Külső URL: ", profile.external_url)
Sok profilinformációt kell látnia a megadott fogantyúból:
E-mailek kinyerése az életrajzból
Az e-mail címeket bármely profil Insta-életrajzából kivonhatja reguláris kifejezések. Importálnia kell a Pythonokat újra könyvtárat, és adja át az e-mail ellenőrzéséhez szükséges reguláris kifejezést paraméterként a re.findall() módszer:
import telepítő
import újra
# Instaloader osztály példányának létrehozása
bot = telepítő. Instaloader()
profil = telepítő. Profile.from_username (bot.context, "jólét")
nyomtatás("Felhasználónév: ", profile.username)
nyomtatás("Bio: ", profile.biography)
emails = re.findall (r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", profile.biography)
print("E-mailek kicsomagolva tól től az életrajz:")
nyomtatás(e-mailek)
A szkript mindent kinyomtat, amit e-mail címként felismer az életrajzban:
A legnépszerűbb keresési eredmények adatainak kinyerése
Ha bármit keres az Instagramon, számos találatot kap, beleértve a felhasználóneveket és a hashtageket. A legnépszerűbb keresési eredményeket a get_profiles() és get_hashtags() mód. Csak a keresési lekérdezést kell megadnia a telepítő. TopSearchResults() módszer. Ezenkívül ismételheti és kinyomtathatja/tárolhatja az egyes eredményeket.
import telepítő
# Az Instaloader osztály példányának létrehozása
bot = telepítő. Instaloader()# Adja meg itt a keresési lekérdezést
search_results = telepítő. TopSearchResults (bot.context, 'zene')# Iteráció a kivont felhasználónevek felett
számárafelhasználónévban benKeresési eredmények.get_profiles():
nyomtatás(felhasználónév)
# Iteráció a kivont hashtagek felett
számárakettőskeresztban benKeresési eredmények.get_hashtags():
nyomtatás(kettőskereszt)
A kimenet tartalmazni fog minden egyező felhasználónevet és hashtaget:
Fiók követőinek és követőinek kinyerése
Az Instaloader segítségével kivonhatja egy fiók követőit, valamint azokat, amelyeket maga követ. Az adatok lekéréséhez meg kell adnia egy Instagram-felhasználónevet és jelszót.
Soha ne használja személyes fiókjait adatok kinyerésére az Instagramból, mivel ez ideiglenesen vagy véglegesen kitilthatja a fiókját.
Az Instaloader osztály példányának létrehozása után meg kell adnia felhasználónevét és jelszavát. Ez azért van így, hogy a bot az Ön fiókjával bejelentkezhessen az Instagramba, és lekérje a követők és követők adatait.
Ezután meg kell adnia a célprofil Instagram-fogóját. A get_followers() és get_followees() módszerek kivonják a követőket és a követőket. A követők és követők felhasználónevét a követő.felhasználónév és followee.username tulajdonságait ill.
Ha az eredményeket CSV-fájlban szeretné tárolni, először konvertálnia kell az adatokat egy Pandas DataFrame objektummá. Használja a pd. DataFrame() metódussal egy listaobjektumot DataFrame-mé konvertálhat.
Végül exportálhatja a DataFrame objektumot CSV-fájlba a to_csv() módszer. Át kell adni a fájlnév.csv ennek a metódusnak a paramétereként, hogy az exportált adatokat CSV-fájlformátumban kapja meg.
Csak a fióktulajdonosok láthatják az összes követőt és követőt. Ezzel vagy bármely más módszerrel nem tudja kivonni az összes követői és követői adatot.
# Könyvtárak importálása
import telepítő
import pandák mint pd# Az Instaloader osztály példányának létrehozása
bot = telepítő. Instaloader()
bot.login (user="Felhasználóneved", passwd="A jelszavad")# Profil betöltése Instagram fogantyúból
profil = telepítő. Profile.from_username (bot.context, 'Your_target_account_insta_handle')# Az összes követő felhasználónevének lekérése
követők = [follower.username a követőhöz a profile.get_followers()]# Az adatok konvertálása DataFrame-be
Followers_df = pd. DataFrame (követők)# Az eredmények tárolása CSV-fájlban
followers_df.to_csv('követők.csv', index=hamis)# Az összes következő felhasználónevének lekérése
Follows = [followee.username a követett számára a profile.get_followees()]# Az adatok konvertálása DataFrame-be
followings_df = pd. DataFrame (következő)
# Az eredmények tárolása CSV-fájlban
Follows_df.to_csv('következőek.csv', index=hamis)
Bejegyzések letöltése Instagram-fiókból
Ismételten, ha bármilyen fiókból szeretne bejegyzéseket letölteni, meg kell adnia egy felhasználónevet és jelszót. Ez azért van, hogy a bot az Ön fiókjával bejelentkezhessen az Instagramba. A bejegyzések összes adatát lekérheti a get_posts() módszer. Az egyes bejegyzéseket pedig iterálhatja és letöltheti a download_post() módszer.
# Könyvtárak importálása
import telepítő
import pandák mint pd# Hozzon létre egy példányt az Instaloader osztályból
bot = telepítő. Instaloader()
bot.login (user="Felhasználóneved",passwd="A jelszavad")# Profil betöltése Instagram fogantyúból
profil = telepítő. Profile.from_username (bot.context, 'Your_target_account_insta_handle')# Egy objektum összes bejegyzésének lekérése
hozzászólások = profile.get_posts()
# Az egyes bejegyzések iterálása és letöltése
indexhez, bejegyzés felsorolásban (bejegyzések, 1):
bot.download_post (post, target=f"{profil.felhasználónév_{index}")
Kaparja le a webet Python használatával
Az adat- vagy webkaparás az egyik leggyakoribb módja annak, hogy hasznos információkat nyerjünk ki az internetről. A kinyert adatokat marketingre, tartalomkészítésre vagy döntéshozatalra használhatja fel.
A Python az előnyben részesített nyelv az adatlegyűjtéshez. Az olyan könyvtárak, mint a BeautifulSoup, a Scrapy és a Pandas, leegyszerűsítik az adatok kinyerését, elemzését és megjelenítését.