Az Internet Movie Database (IMDb) a legnagyobb online adatbázis, amely filmekkel, televíziós sorozatokkal, házi videókkal, videojátékokkal és streaming tartalommal kapcsolatos információkat tartalmaz. Az online adatbázis több millió pontos rekordot tartalmaz, amelyek segítségével adatelemzést végezhet.
A Cinemagoer (korábbi nevén IMDbPY) egy Python könyvtár az IMDb filmadatbázis adatainak kezelésére és lekérésére. Hozzáférhet olyan adatokhoz filmekről, emberekről és cégekről, amelyeket további elemzésekhez használhat fel.
A szükséges könyvtárak telepítése
Telepítenie kell a mozilátogató Python könyvtár eléréséhez IMDb adatbázis. A könyvtár telepítéséhez futtassa a következő parancsot a parancssorban:
csipog telepítés mozilátogató
Biztos van pip telepítve van a rendszerére külső Python-könyvtárak telepítéséhez.
A projektben használt kód elérhető a GitHub adattár és az MIT licence alapján ingyenesen használható.
IMDb adatok kinyerése Python használatával
A kódban való felhasználás előtt importálnia kell a mozilátogató könyvtárat.
tól től imdb import Mozilátogató
ia = Cinemagoer()
A fenti kód importálja a mozilátogató könyvtárat, és létrehozza a mozilátogató osztály példányát.
Filmek keresése
Adott (vagy hasonló) címû filmeket kereshet a segítségével search_movie() módszer. Például, ha olyan filmeket szeretne keresni, amelyeknek a címe "rock", akkor a következő kódot kell futtatnia:
tól től imdb import Mozilátogató
# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()
# Olyan filmek keresése, amelyek nevében rock szerepel
filmek = ia.search_movie('szikla')
nyomtatás(filmek[0])
Ennek ki kell nyomtatnia az első talált filmet, például:
A filmet az IMDb azonosítója alapján szerezheti be. Ezután további információkat nyerhet ki, például a rendezők neveit és a műfajokat. Neked kell lapozzon a listán egyéni információkhoz jutni.
tól től imdb import Mozilátogató
# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()# Film beszerzése IMDb azonosító alapján
film = ia.get_movie('0468569')
nyomtatás(film)# A film rendezői nevének kinyomtatása
nyomtatás('Rendezők:')filmben rendezőnek['rendezők']:
print (igazgató['név'])# a film műfajainak kinyomtatása
nyomtatás('Műfajok:')
műfajhoz a filmben['műfajok']:
nyomtatás(műfaj)
A kimenetben látnia kell az adott film nevét, rendezőjét és műfaját:
Személy keresése
A segítségével kereshet embereket search_person() módszer. Ha például a "Heath" kifejezésre szeretne keresni, akkor a következő kódot kell futtatnia:
tól től imdb import Mozilátogató
# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()
# Olyan emberek keresése, akiknek a nevében Heath szerepel
persons = ia.search_person('Pusztaság')
nyomtatás(személyek[0])
Megjelenik az első találati személy neve, akit a keresés talál:
Cégek keresése
A cégeket a segítségével keresheti search_company() módszer. Ha például az "Univerzális" kifejezésre szeretne keresni, akkor a következő kódot kell futtatnia:
tól től imdb import Mozilátogató
# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()
# Olyan cégek keresése, amelyek nevében Universal szerepel
cégek = ia.search_company('Egyetemes')
nyomtatás(cégek)
Megjelenik azon cégek listája, amelyek nevében szerepel a Universal.
Személy- és cégadatokat is lekérhet az azonosítójával.
tól től imdb import Mozilátogató
# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()# Személyi adatok beszerzése azonosító alapján
személy = ia.get_person('0005132')
nyomtat (személy['név'])
nyomtat (személy['születési dátum'])
# Vállalati adatok lekérése azonosító alapján
cég = ia.get_company('0005073')
nyomtatás (cég['név'])
A kimenet megmutatja a személy adatait és a cég nevét:
Felső és alsó filmek keresése
A legjobb 250 és az alsó 100 film adatait lekérheti a segítségével get_top250_movies() és get_bottom100_movies() módszerek, ill.
tól től imdb import Mozilátogató
# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()# A legjobb 250 film megtalálása
top = ia.get_top250_movies()
nyomtatás(top[0])
# Az alsó 100 film megtalálása
bottom = ia.get_bottom100_movies()
nyomtatás(alsó[0])
Válaszul megjelenik a legjobb film és a legrosszabb film neve:
A mozilátogató könyvtár más módszereket is kínál, mint pl get_top250_tv(), get_popular100_movies(), és get_top250_indian_movies().
Az adatelemzés az adatok értékelése analitikai vagy statisztikai eszközök segítségével információ kinyerésére. Az adatelemzés népszerűsége napról napra nő. Ma már vállalkozások, marketingcégek és sportcsapatok használják. Az adatelemzés teljes folyamata magában foglalja a célok meghatározását, a kérdések feltevését, az adatgyűjtést, az adattisztítást, az adatelemzést és az eredmények megállapítását.
Adatkészleteket szerezhet projektjeihez Python-könyvtárak (például Cinemagoer) vagy online platformokon (például Kaggle) keresztül. Az olyan teljes nyelvek mellett, mint a Python és az R, más eszközöket is használhat, például a Microsoft Excelt, a Tableau-t és a Stata-t az adatok elemzéséhez.