Ingyenes adatokat keres adatelemzési készségeinek gyakorlásához? Íme néhány a legnépszerűbb webhelyek közül, amelyeket érdemes megnézni.

Akár piackutatást végez, akár elemzőként portfólióját építi fel, akár betekintést szeretne nyerni piaci elérése bővítésére, az értékes és megbízható adatok elengedhetetlenek a megalapozott döntéshozatalhoz.

Az ingyenes, megbízható és hozzáférhető adatok internetes keresése azonban kihívásokkal jár. Ez a cikk csökkenti az adatvadászatot, mivel bemutatja néhány legnépszerűbb webhelyet, ahol ingyenes adatokhoz férhet hozzá.

A Google Trends a Google által kifejlesztett ingyenes szolgáltatás, amely szűrés nélküli adatmintákat biztosít a felhasználóknak a Google-nak küldött keresési kérésekről. Míg ez a szolgáltatás 2004-től napjainkig jeleníti meg az idősoros adatokat globális és városi szinten is, nem jeleníti meg a keresőmotor felhasználóinak személyes adatait.

Korlátozhatja az adatokat úgy is, hogy kategóriákra, nyelvekre, entitásokra vagy elemekre összpontosítson

felkapott keresések a Google-on a Google Trends segítségével. Példák a rendelkezésre álló adatokra: napi keresési trendek és valós idejű keresési trendek, amelyek az elmúlt hét nap adatait mutatják.

A FiveThirtyEight egy adatújságírási webhely, amely adatokat tartalmaz a közvélemény-kutatások elemzéséről, a sportról, a popkultúráról, a politikáról, a tudományról és a gazdasági eseményekről.

A webhely nagyszerűsége az, hogy letöltheti az adatokat a webhelyükről vagy a sajátjukról hivatalos GitHub adattár és használja a sajátját adatvizualizációs eszközök lenyűgöző adatújságírási látványelemek létrehozásához közönsége számára. Néhány példa a rendelkezésre álló érdekes adatokra: a világbajnokság előrejelzései és 2022-23 NHL előrejelzési adatok.

A BuzzFeed News egy amerikai legfrissebb hírek és eredeti jelentési platform, amely mindenről beszámol az újságírástól, a technológiától, a szórakoztatástól, a hírességekről szóló híreken, a kultúrán és a barkácsoláson át az egészségügyig és a politikáig.

A GitHubon a BuzzFeed News elérhetővé és elérhetővé teszi adatkészletét, eszközeit és elemzését a BuzzFeed hírszobájában, nyílt forráskódú. Egy példa tartalmazza a FBI NICS lőfegyver-háttér-ellenőrzési adatok.

A Data.gov az Egyesült Államok kormányának nyílt adatokkal foglalkozó webhelye, amely több mint 250 000 nyilvánosan elérhető, jól dokumentált adatkészletet tárol nemzetközi és több szövetségi kormányhivataltól. A kezdeményezés mögött az volt az ötlet, hogy nyitott és átlátható kormányt alakítsunk ki.

A weboldalról téma és ügynökség vagy szervezet alapján érheti el az adatokat. Néhány példa a Data.gov oldalon található adatokra: országos diákhitel adatrendszer és elektromos járművek népességi adatai.

A Kaggle a Google által megvásárolt nyilvános adatok játszótere, amely adatkészletek széles skáláját kínálja különböző témákban. Ez a közösségi platform lehetővé teszi a kódok megosztását, a tanulást, az adatszakértőkkel való együttműködést és a készségfejlesztést. A Kaggle adattudományi versenyeknek is otthont ad, ahol különféle díjakat nyerhet.

Ez az útmutató a kezdőknek szóló útmutató a Kaggle használatának megkezdéséhez az adattudományhoz. Példa erre a Globális YouTube-statisztika 2023.

Az EarthData a NASA adatkezdeményezése, amely 1994-től napjainkig a földi adatok tárházaként szolgál. A távoli műhold információiból a Föld légkörére, óceánjaira és szárazföldi hidroszférájára vonatkozó adatokhoz kaphat adatokat.

Böngészhet a különböző témák között, és hozzáférhet például az adatokhoz szélsőséges hőség adatok. Azonban fel kell fedeznie A NASA planetáris adatrendszere nem földi adatokhoz.

Az IMDb adatokat szolgáltat filmekről, tévésorozatokról, házi videókról, podcastokról, videojátékokról, streaming információkról és hírességekről. Egy példa az IMDb nem kereskedelmi adatkészletek.

Az AWS Public Dataset egy olyan webhely, amely több mint 3000 adatkészletet tartalmaz, amelyek az AWS-szolgáltatásokon keresztül nyilvánosan elérhetőek. Az itt található adatkészletek többsége projektalapú. Néhány közé tartozik a rák genom atlasz és Foldingathome COVID-19 adatkészletek.

Az Inside Airbnb egy őrző webhely, amelyet Murray Cox indított el. Ez a weboldal nyilvánosan elérhető adatokból származik Airbnb, egy platform, amely pénztárcabarát szobákat kínál a felhasználóknak világszerte. Az ezen a webhelyen található információkat felhasználhatja olyan elemzések elvégzésére, mint a Montreal bérleti elemzése.

A Google Dataset Search a Google által létrehozott adatkészlet-kereső, amely több mint 20 millió adatkészletet tárol. A keresőmotorjukhoz hasonlóan szinte bármiről szerezhet adatokat. Jó példa erre a Kanadai nemzeti hosszú távú vízminőség-ellenőrzési adatok.

Az UC Irvine Machine Learning Repository 624 adatkészlet otthona a gépi tanulási közösség számára a világon. Ennek a webhelynek jó hírneve van a közösségben, mivel az adatkészletek a megfelelő gépi tanulási feladatok alapján vannak kategorizálva. Példa erre a Írisz adatkészlet, egy híres osztályozási és klaszterezési modell adatkészlet.

A Datahub mint platform számos adatkészlettel rendelkezik, amelyek a témák széles skáláját fedik le, mint például a 10 éves amerikai államkötvény hozamok (hosszú távú kamatláb). Az adatok mellett olyan adateszközöket és eszközkészleteket is megjelenítenek, amelyek az adatokkal foglalkozó szakemberek számára bejöhetnek.

Ez az első webhely a listánkon, amely kizárólagos egészségügyi adatokat tartalmaz. A Global Health Observatory adattárként szolgál, amely több mint 1000 mutató egészségügyi statisztikáit jeleníti meg a WHO 194 tagállamában. Az adatokat rögzítjük, hogy nyomon kövessék e tagállamok előrehaladását az SDG-célok felé. Az adatok témájának, kategóriájának, metaadatainak és mutatóinak szűrésével kaphat adatokat.

Ez a platform valóban niche-alapú. Olyan kutatási adatokat és piaci intelligencia információkat jelenít meg, mint a hétvégi kasszaadatok és a kapcsolódó adatok az Egyesült Királyság filmiparáról.

A GitHub több, mint több millió együttműködési és nyílt forráskódú projekt otthona. A platform számos adattárat is tartalmaz, amelyek célja ingyenes, nyilvános és nyílt forráskódú adatkészletek tárolása. Még A BuzzFeedNews nyílt forráskódú GitHub-tárral rendelkezik.

További példák a Félelmetes nyilvános adatkészletek tárháza és egyáltalán felemeli az adathalmazt. Te is hozzájárulni ezekhez a nyílt forráskódú projektekhez a GitHubon.

A Data.world egy adatközösségi és együttműködési platform, amely adatprojekteket és adatkészleteket tárol. Míg néhány adatkészlet fizetős, főként a platformon lévő adatok, például Hétfői átalakítás 2021/W16: havi légi utasok Amerikában, ingyenesek, és egyszerűen letölthetők helyben, vagy elérhetők az API-jukon keresztül.

A Világbank Open Data a globális gazdasági és fejlesztési adatok katalógusa. Böngészheti és szűrheti az adatokat, például a globális statisztikák az egészséges táplálkozás költségeiről és megfizethetőségéről mutató és ország szerint.

A Nasdaq Data Link minden pénzügyi, gazdasági és alternatív adathoz használható. Olyan adatokhoz férhet hozzá, mint a Amerikai szövetségi tartalék adatközlések táblázaton, például Excelen vagy API-n keresztül.

A NYC Taxi és Limousine Commission adatplatformja rögzíti és tárolja az olyan információkat, mint pl sárga és zöld taxizási rekordok New Yorkban. Az a nagyszerű ebben a webhelyben, hogy mindenről információt tartalmaz, a fel- és leszállástól a taxizónáig és az utazási árakig.

Az Academic Torrents több mint 127,15 TB kutatási adatot tartalmazó adatkatalógus. Mint mondják, kutatók és kutatók számára építették.

Fedezze fel és tanuljon

Remélhetőleg ezzel a listával olyan adatokhoz juthat, amelyek alakíthatják üzleti környezetét, ösztönözhetik a piackutatást, versenyelőnyre tehetnek szert, és segítenek az egyedi adatportfólió ingyenes felépítésében. Tehát ragadja meg a lehetőségeket, fedezze fel, és vegyen részt egy kevésbé kihívást jelentő adatvadászatban.