Ennek az útmutatónak a segítségével akadályozza meg, hogy webhelyét az OpenAI bejárói lekaparják.
Míg a felhasználók szeretik a ChatGPT-t a jelenleg tárolt információmennyiség miatt, ugyanez nem mondható el a webhelytulajdonosokról.
Az OpenAI ChatGPT bejárókat használ a webhelyek lekaparására, de ha Ön webhelytulajdonos, és nem szeretné, hogy az OpenAI bejárója hozzáférjen webhelyéhez, íme néhány dolog, amit megtehet ennek megakadályozása érdekében.
Hogyan működik az OpenAI feltérképezése?
A webrobot (más néven pók vagy keresőrobot) egy automatizált program, amely információkat keres az interneten. Ezután úgy állítja össze ezeket az információkat, hogy a keresőmotorja könnyen hozzáférjen hozzá.
A webrobotok minden releváns URL minden oldalát indexelik, általában azokra a webhelyekre összpontosítva, amelyek relevánsabbak a keresési lekérdezések szempontjából. Tegyük fel például, hogy egy adott Windows-hibát keres a Google-on. A keresőmotoron belüli webrobot átvizsgálja az összes olyan webhely URL-jét, amelyet a Windows-hibák témájában hitelesebbnek tart.
Az OpenAI webrobotját GPTBot-nak hívják, és ennek megfelelően Az OpenAI dokumentációja, ha a GPTBot hozzáférést biztosít webhelyéhez, az AI-modell biztonságosabbá és pontosabbá válhat, és még az AI-modell képességeit is bővítheti.
Hogyan akadályozható meg, hogy az OpenAI feltérképezze webhelyét
A legtöbb más webrobothoz hasonlóan a GPTBot is blokkolható, hogy hozzáférjen a webhelyéhez a webhely módosításával. robots.txt protokoll (más néven robotok kizárási protokollja). Ezt a .txt fájlt a webhely szervere tárolja, és ez szabályozza, hogy a webrobotok és más automatizált programok hogyan viselkedjenek az Ön webhelyén.
Íme egy rövid lista arról, hogy mi a robot.txt a fájl képes:
- Teljesen blokkolhatja a GPTBot webhely elérését.
- Egy URL-ből csak bizonyos oldalakat tudja megakadályozni, hogy a GPTBot hozzáférjen.
- Meg tudja mondani a GPTBot-nak, hogy mely linkeket követheti, és melyeket nem.
A következőképpen szabályozhatja, hogy a GPTBot mit tehet a webhelyén:
Teljesen blokkolja a GPTBotot, hogy hozzáférjen webhelyéhez
- Állítsa be a robot.txt fájlt, majd szerkessze bármely szövegszerkesztő eszközzel.
- Adja hozzá a GPTBotot a webhelyéhez robots.txt alábbiak szerint:
User-agent: GPTBot
Disallow: /
Csak bizonyos oldalak blokkolása a GPTBot általi hozzáféréstől
- Állítsa be a robot.txt fájlt, majd szerkessze azt a kívánt szövegszerkesztő eszközzel.
- Adja hozzá a GPTBotot a webhelyéhez robots.txt alábbiak szerint:
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/
Ne feledje azonban, hogy megváltoztatja a robot.txt fájl nem visszamenőleges megoldás, és a GPTBot által esetleg már összegyűjtött információk nem lesznek visszaállíthatók.
Az OpenAI lehetővé teszi a webhelytulajdonosok számára, hogy letiltsák a feltérképezést
Amióta robotokat használnak az AI-modellek betanításához, a webhelyek tulajdonosai keresik a módját, hogyan őrizzék meg adataik titkosságát.
Egyesek attól tartanak, hogy a mesterséges intelligencia modellek alapvetően ellopják a munkájukat, sőt a webhelylátogatások számának csökkenését annak tulajdonítják, hogy a felhasználók ma már anélkül jutnak hozzá információikhoz, hogy fel kellene keresniük a webhelyüket.
Összességében az Ön döntése, hogy teljesen blokkolja-e az AI chatbotokat a webhelyek vizsgálatában.