Az Internet Movie Database (IMDb) a legnagyobb online adatbázis, amely filmekkel, televíziós sorozatokkal, házi videókkal, videojátékokkal és streaming tartalommal kapcsolatos információkat tartalmaz. Az online adatbázis több millió pontos rekordot tartalmaz, amelyek segítségével adatelemzést végezhet.

A Cinemagoer (korábbi nevén IMDbPY) egy Python könyvtár az IMDb filmadatbázis adatainak kezelésére és lekérésére. Hozzáférhet olyan adatokhoz filmekről, emberekről és cégekről, amelyeket további elemzésekhez használhat fel.

A szükséges könyvtárak telepítése

Telepítenie kell a mozilátogató Python könyvtár eléréséhez IMDb adatbázis. A könyvtár telepítéséhez futtassa a következő parancsot a parancssorban:

csipog telepítés mozilátogató

Biztos van pip telepítve van a rendszerére külső Python-könyvtárak telepítéséhez.

A projektben használt kód elérhető a GitHub adattár és az MIT licence alapján ingyenesen használható.

IMDb adatok kinyerése Python használatával

A kódban való felhasználás előtt importálnia kell a mozilátogató könyvtárat.

tól től imdb import Mozilátogató
ia = Cinemagoer()

A fenti kód importálja a mozilátogató könyvtárat, és létrehozza a mozilátogató osztály példányát.

Filmek keresése

Adott (vagy hasonló) címû filmeket kereshet a segítségével search_movie() módszer. Például, ha olyan filmeket szeretne keresni, amelyeknek a címe "rock", akkor a következő kódot kell futtatnia:

tól től imdb import Mozilátogató

# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()

# Olyan filmek keresése, amelyek nevében rock szerepel
filmek = ia.search_movie('szikla')
nyomtatás(filmek[0])

Ennek ki kell nyomtatnia az első talált filmet, például:

A filmet az IMDb azonosítója alapján szerezheti be. Ezután további információkat nyerhet ki, például a rendezők neveit és a műfajokat. Neked kell lapozzon a listán egyéni információkhoz jutni.

tól től imdb import Mozilátogató

# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()

# Film beszerzése IMDb azonosító alapján
film = ia.get_movie('0468569')
nyomtatás(film)

# A film rendezői nevének kinyomtatása
nyomtatás('Rendezők:')

filmben rendezőnek['rendezők']:
print (igazgató['név'])

# a film műfajainak kinyomtatása
nyomtatás('Műfajok:')

műfajhoz a filmben['műfajok']:
nyomtatás(műfaj)

A kimenetben látnia kell az adott film nevét, rendezőjét és műfaját:

Személy keresése

A segítségével kereshet embereket search_person() módszer. Ha például a "Heath" kifejezésre szeretne keresni, akkor a következő kódot kell futtatnia:

tól től imdb import Mozilátogató

# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()

# Olyan emberek keresése, akiknek a nevében Heath szerepel
persons = ia.search_person('Pusztaság')
nyomtatás(személyek[0])

Megjelenik az első találati személy neve, akit a keresés talál:

Cégek keresése

A cégeket a segítségével keresheti search_company() módszer. Ha például az "Univerzális" kifejezésre szeretne keresni, akkor a következő kódot kell futtatnia:

tól től imdb import Mozilátogató

# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()

# Olyan cégek keresése, amelyek nevében Universal szerepel
cégek = ia.search_company('Egyetemes')
nyomtatás(cégek)

Megjelenik azon cégek listája, amelyek nevében szerepel a Universal.

Személy- és cégadatokat is lekérhet az azonosítójával.

tól től imdb import Mozilátogató

# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()

# Személyi adatok beszerzése azonosító alapján
személy = ia.get_person('0005132')
nyomtat (személy['név'])
nyomtat (személy['születési dátum'])

# Vállalati adatok lekérése azonosító alapján
cég = ia.get_company('0005073')
nyomtatás (cég['név'])

A kimenet megmutatja a személy adatait és a cég nevét:

Felső és alsó filmek keresése

A legjobb 250 és az alsó 100 film adatait lekérheti a segítségével get_top250_movies() és get_bottom100_movies() módszerek, ill.

tól től imdb import Mozilátogató

# A Cinemagoer osztály példányának létrehozása
ia = Cinemagoer()

# A legjobb 250 film megtalálása
top = ia.get_top250_movies()
nyomtatás(top[0])

# Az alsó 100 film megtalálása
bottom = ia.get_bottom100_movies()
nyomtatás(alsó[0])

Válaszul megjelenik a legjobb film és a legrosszabb film neve:

A mozilátogató könyvtár más módszereket is kínál, mint pl get_top250_tv(), get_popular100_movies(), és get_top250_indian_movies().

Az adatelemzés az adatok értékelése analitikai vagy statisztikai eszközök segítségével információ kinyerésére. Az adatelemzés népszerűsége napról napra nő. Ma már vállalkozások, marketingcégek és sportcsapatok használják. Az adatelemzés teljes folyamata magában foglalja a célok meghatározását, a kérdések feltevését, az adatgyűjtést, az adattisztítást, az adatelemzést és az eredmények megállapítását.

Adatkészleteket szerezhet projektjeihez Python-könyvtárak (például Cinemagoer) vagy online platformokon (például Kaggle) keresztül. Az olyan teljes nyelvek mellett, mint a Python és az R, más eszközöket is használhat, például a Microsoft Excelt, a Tableau-t és a Stata-t az adatok elemzéséhez.