Fedezze fel az OpenAI API erejét és az általa kínált lehetőségeket.

A ChatGPT generatív ereje indulása óta őrületet váltott ki a technológiai világban. Az AI intuíciójának megosztása érdekében az OpenAI 2023. március 1-jén kiadta a ChatGPT és a Whisper API-kat, hogy a fejlesztők felfedezhessék és az alkalmazáson belül felhasználhassák.

Az OpenAI API-i számos értékes végpontot tartalmaznak, amelyek megkönnyítik az AI-integrációt. Fedezzük fel az OpenAI API-k erejét, hogy megtudjuk, milyen előnyökkel járhatnak.

Mire képes az OpenAI API?

A OpenAI API egy csomó segédprogramot csomagol a programozóknak. Ha az alkalmazáson belüli mesterséges intelligenciát naponta kívánja szállítani, az OpenAI megkönnyíti az életét a következő képességekkel.

Csevegés

Az OpenAI API csevegés befejezési végpontja segít a végfelhasználónak természetes, emberbarát interaktív munkamenetet létrehozni egy virtuális asszisztenssel a GPT-3.5-turbó modell segítségével.

A háttérben az API-hívás szerepkörökből és tartalomból álló üzenettömböt használ. A felhasználói oldalon a tartalom a virtuális asszisztens számára egy utasításkészlet, amely bevonja a felhasználót, míg a modell számára a tartalom a válasz.

instagram viewer

A legfelső szintű szerepkör a rendszer, ahol meghatározhatja a virtuális asszisztens általános funkcióját. Például, amikor a programozó valami olyasmit mond a rendszernek, hogy „Te egy segítőkész virtuális asszisztens vagy”, azt várod tőle, hogy a tanulási képességén belül különböző kérdésekre válaszoljon.

Miután azt mondta, hogy „segítőkész virtuális asszisztens”, a következőképpen zajlott az egyik parancssori csevegésünk a GPT-3.5-turbó modellel:

Még a modell teljesítményét is javíthatja olyan paraméterek megadásával, mint a hőmérséklet, a jelenlét-büntetés, a frekvencia-büntetés stb. Ha valaha is használta a ChatGPT-t, már tudja, hogyan működik az OpenAI csevegés-kiegészítő modellje.

Szöveg befejezése

A szövegkiegészítő API a fejlett GPT-3.5 modelleken alapuló társalgási, szövegbeillesztési és szövegkiegészítő funkciókat biztosít.

A szövegkiegészítési végpontban a bajnok modell a text-davinci-003, amely lényegesen intuitívabb, mint a GPT-3 természetes nyelvi modellek. A végpont elfogadja a felhasználói felszólítást, lehetővé téve a modell számára, hogy természetes módon válaszoljon, és emberbarát szöveggel fejezze be az egyszerűtől az összetett mondatig.

Bár a szövegkiegészítő végpont nem olyan intuitív, mint a csevegési végpont, egyre jobb lesz – ahogy növeli a text-davinci-003 modellhez biztosított szövegjogkivonatokat.

Például kaptunk néhány félkész befejezést, amikor a modellt hét max_tokenre helyeztük:

A max_tokens 70-re növelése azonban koherensebb gondolatokat generált:

Beszéd-szöveg

Az OpenAI átírási és fordítási végpontjaival hangbeszédet írhat át és fordíthat le. A beszéd-szöveg végpontok a Whisper v2-large modellen alapulnak, amelyet nagy léptékű gyenge felügyelettel fejlesztettek ki.

Az OpenAI szerint azonban nincs különbség a Whisper modell és a nyílt forráskódú modell között. Így végtelen lehetőségeket kínál a többnyelvű átíró és fordító mesterséges intelligencia integrálására az alkalmazásba.

A végpont használata egyszerű. Mindössze annyit kell tennie, hogy el kell látnia a modellt egy hangfájllal, és felhívja a openai. Audio.fordítani vagy openai. Hang.átirat végpontja annak lefordításához vagy átírásához. Ezek a végpontok legfeljebb 25 MB fájlméretet fogadnak el, és támogatják a legtöbb hangfájltípust, beleértve az mp3, mp4, MPEG, MPGA, m4a, wav és webm fájlokat.

Szöveg összehasonlítás

Az OpenAI API szöveg-összehasonlítási végpontja a szövegek közötti kapcsolatot méri a text-embedding-ada-002 modell segítségével, amely egy második generációs beágyazási modell. A beágyazási API ezt a modellt használja a szövegek közötti kapcsolat értékelésére két vektorpont távolsága alapján. Minél nagyobb a különbség, annál kevésbé kapcsolódnak egymáshoz az összehasonlított szövegek.

A beágyazási végpont szövegcsoportosítást, különbségeket, relevanciát, ajánlásokat, érzéseket és osztályozást tartalmaz. Ráadásul token kötetenként fizet.

Bár az OpenAI dokumentációja szerint használhatja a többi első generációs beágyazó modellt is, az előbbi jobb olcsóbb áron. Az OpenAI azonban arra figyelmeztet, hogy a beágyazási modell társadalmi elfogultságot mutathat bizonyos emberekkel szemben, amint azt a tesztek is bizonyították.

Kód befejezése

A kódkiegészítési végpont az OpenAI Codex-re épül, amely egy természetes nyelvet és több milliárd nyilvános tárolóból származó kódsort használó modellkészlet.

A végpont korlátozott bétaverzióban elérhető, és az írástól kezdve ingyenes, és számos modern programozási nyelv támogatását kínálja, beleértve a JavaScriptet, a Pythont, a Go-t, a PHP-t, a Ruby-t, a Shell-t, a TypeScript-et, a Swift-et, a Perl-t és az SQL-t.

A code-davinci-002 vagy code-cushman-001 modellnél a kódkiegészítési végpont automatikusan beszúrhat kódsorokat vagy kódblokkokat forgathat fel a felhasználói promptból. Míg az utóbbi modell gyorsabb, az előbbi a végpont erőgépe, mivel kódbeillesztéseket tartalmaz az automatikus kódkiegészítéshez.

Létrehozhat például egy kódblokkot úgy, hogy a célnyelvi megjegyzésben egy promptot küld a végpontnak.

Íme néhány válasz, amit kaptunk, amikor megpróbáltunk kódblokkot generálni Pythonban és JavaScriptben a terminálon keresztül:

Képgenerálás

Ez az OpenAI API egyik legintuitívabb funkciója. A DALL.E képmodell alapján az OpenAI API képfunkciói végpontokat tartalmaznak a természetes nyelvi promptokból történő képváltozatok generálásához, szerkesztéséhez és létrehozásához.

Bár még nem rendelkezik olyan fejlett funkciókkal, mint a felskálázás, mivel még béta állapotban van, skálázatlan kimenetei lenyűgözőbbek, mint a generatívé művészeti modellek, mint a Midjourney és stabil diffúzió.

A képgenerálás végpontjának elérésekor csak egy promptot, képméretet és képszámot kell megadnia. A képszerkesztési végpont azonban megköveteli, hogy a többi paraméter mellett a szerkeszteni kívánt képet és a szerkesztési pontot jelölő RGBA-maszkot is tartalmazzon.

A variációs végpont viszont csak a célképet, a változatszámot és a kimeneti méretet igényli. A cikk írásakor az OpenAI béta képvégpontjai csak a 256x256, 512x512 és 1024x1024 képpont tartományba eső négyzet alakú kereteket képesek elfogadni.

Ezzel a végponttal létrehoztunk egy egyszerű képgeneráló alkalmazást, és bár hiányzott néhány részlet, hihetetlen eredményt hozott:

Az OpenAI API használata

Az OpenAI API használata egyszerű, és követi a hagyományos API felhasználási mintát.

  1. Telepítse a openai csomag pip használatával: pip install openai.Ha helyette a Node-ot használja, az npm használatával teheti meg: npm install openai.
  2. Fogja meg az API-kulcsokat: Jelentkezzen be az OpenAI irányítópultjára, és kattintson a profil ikonjára a jobb felső sarokban. Menj API kulcsok megtekintése és kattintson Hozzon létre új titkos kulcsot az API titkos kulcs létrehozásához.
  3. API-hívásokat kezdeményezhet a kiválasztott modell végpontjaihoz szerveroldali nyelven, például Pythonon vagy JavaScripten (Node). Táplálja ezeket az egyéni API-kba, és tesztelje a végpontjait.
  4. Akkor egyéni API-k lekérése JavaScripten keresztül keretrendszerek, mint a React, Vue vagy Angular.
  5. Jelenítse meg az adatokat (felhasználói kéréseket és modellválaszokat) egy tetszetős felhasználói felületen, és az alkalmazás készen áll a valós használatra.

Mit hozhat létre az OpenAI API-val?

Az OpenAI API-k belépési pontokat hoznak létre a gépi tanulás és a megerősítő tanulás valós használatához. Noha a kreativitás lehetőségei bővelkednek, íme néhány az OpenAI API-k segítségével építhető lehetőségek közül:

  1. Integráljon egy intuitív virtuális asszisztens chatbotot webhelyébe vagy alkalmazásába a csevegés befejezési végpontjával.
  2. Hozzon létre egy képszerkesztő és -manipuláló alkalmazást, amely természetesen beszúrhat egy objektumot a képbe bármely megadott ponton a képgenerálási végpontok segítségével.
  3. Készítsen egyedi gépi tanulási modellt az alapoktól az OpenAI modell finomhangolási végpontjával.
  4. Javítsa ki a videók, hangok és élő beszélgetések feliratait és fordításait a beszédből szöveggé modell végpontjával.
  5. Az OpenAI beágyazási modell végpontja segítségével azonosíthatja a negatív érzelmeket az alkalmazásban.
  6. Programozási nyelv-specifikus kódkiegészítő bővítmények létrehozása kódszerkesztők és integrált fejlesztői környezetek (IDE) számára.

Építsen vég nélkül az OpenAI API-kkal

Napi kommunikációnk gyakran az írott tartalom cseréjéből áll. Az OpenAI API csak kiterjeszti kreatív hajlamait és lehetőségeit, látszólag korlátlan természetes nyelvhasználati esetekkel.

Az OpenAI API még korai napjai. De számítson rá, hogy az idő múlásával további funkciókkal bővül.