A ChatGPT készítői egy másik eszközzel is rendelkeznek, amelynek célja, hogy levegye az ujjairól a terhelést.

A ChatGPT mögött ugyanazok az emberek hoztak létre egy másik mesterséges intelligencia-alapú eszközt, amelyet ma felhasználhat termelékenységének növelésére. A Whisper-re gondolunk, egy hang-szöveg megoldásra, amely elhomályosította az összes előtte megjelent hasonló megoldást.

Használhatja a Whispert a programokban vagy a parancssorban. És mégis, ez legyőzi a célját: a billentyűzet nélküli gépelést. Ha gépelni kell a használatához, miért használja, hogy elkerülje a gépelést? Szerencsére most már használhatja a Whispert egy asztali grafikus felületen keresztül. Még jobb, hogy szinte valós időben át tudja írni a hangját. Nézzük meg, hogyan írhat a hangjával a Whisper Desktop segítségével.

Mi az az OpenAI Whisper?

Az OpenAI Whisper egy automatikus beszédfelismerő rendszer (röviden ASR), vagy leegyszerűsítve megoldás a beszélt nyelv szöveggé alakítására.

Azonban a régebbi diktálási és átírási rendszerekkel ellentétben a Whisper egy mesterséges intelligencia-megoldás, amely több mint 680 000 órányi beszédre van kiképezve különböző nyelveken. A Whisper páratlan pontosságot kínál, és egészen lenyűgöző módon nemcsak többnyelvű, hanem nyelvek közötti fordításra is képes.

instagram viewer

Ennél is fontosabb, hogy ingyenes és nyílt forráskódúként is elérhető. Ennek köszönhetően sok fejlesztő beépítette a kódját saját projektjébe, vagy olyan alkalmazásokat hozott létre, amelyek támaszkodnak rá, mint például a Whisper Desktop.

Ha a Whisper "vaníliás" verzióját és a terminál sokoldalúságát részesítené előnyben a nehézkes grafikus felhasználói felületek helyett, tekintse meg cikkünket hogyan változtassa hangját szöveggé az OpenAI Whisper for Windows segítségével.

A Whisper és a Whisper Desktop ugyanaz?

A hivatalosan hangzó neve ellenére a Whisper Desktop egy harmadik féltől származó grafikus felhasználói felület a Whisperhez, amely mindenki számára készült, aki a parancsok begépelése helyett szívesebben kattint a gombokra.

A Whisper Desktop egy önálló megoldás, amely nem támaszkodik egy meglévő Whisper-telepítésre. Bónuszként a Whisper egy alternatív, optimalizált verzióját használja, így jobban kell teljesítenie, mint az önálló verzió.

Ön a spektrum másik végén van, és ahelyett, hogy a terminálnál egyszerűbb módot keresne a Whisper használatára, inkább a saját megoldásaiban való megvalósításának módjait keresi? Örülj érte Az OpenAI hozzáférést biztosított a ChatGPT és a Whisper API-khoz.

A Whisper Desktop letöltése és telepítése

Bár a Whisper Desktop használata egyszerűbb, mint az önálló Whisper, telepítése bonyolultabb, mint a varázslóban a Tovább gombra való ismételt kattintás.

  1. Látogatás A Whisper Desktop hivatalos Github oldala. Nézze meg a jobb oldalon, és kattintson a legújabb verzióra alatta Kiadások.
  2. Alatt Eszközök, kattintson WhisperDesktop.zip és töltse le a számítógépére.
  3. Csomagolja ki a letöltött archívumot egy mappába, és keresse fel a fájlkezelővel. Belül található a Whisper Desktop alkalmazás. Kattintson duplán a futtatásához.
  4. Szüksége van egy Whisper nyelvi modellre is GCML bináris formátum. A Whisper Desktop két hivatkozást biztosít az egyik megszerzéséhez. Hagyja ki a második hivatkozást a saját modell létrehozásához, mivel ez bonyolultabb folyamat. Kattintson Átölelő Arc az oldal megnyitásához az alapértelmezett böngészőben, ahonnan letölthet egy használatra kész fájlt.
  5. A cikk írásakor használt Whisper Desktop verziója hivatkozást adott a Hugging Face egyik elavult tárhelyére. Ha ugyanazzal a problémával találkozik, vegye észre a hivatkozást a új helyszín. Kattintson rá az új tároló megnyitásához.
  6. Kattintson a hivatkozásra, amely elvezeti az elérhetőhöz modellek.
  7. A listában kattintson a gombra ggml-medium.bin vagy ggml-medium.en.bin, attól függően, hogy többnyelvű vagy csak angol nyelvű támogatást szeretne-e a Whisperben.
  8. Végül el kellett volna érnie a célállomást. Figyelje meg a sort, amely szerint ezt a fájlt a Git LFS tárolja, és túl nagy a megjelenítéshez, de még mindig letöltheti. Kattintson Letöltés hogy pontosan ezt tegye.
  9. Amikor a fájl letöltése befejeződött, használja kedvenc fájlkezelőjét (a File Explorer ezt teszi), hogy a letöltött nyelvi modellfájlt ugyanabba a mappába helyezze át, mint a Whisper Desktop.

Átírás a Whisper Desktop segítségével

Az átírás a Whisper Desktop segítségével egyszerű, de előfordulhat, hogy az alkalmazás használatához egy vagy két kattintás szükséges.

Futtassa újra a Whisper Desktopot. (még mindig) hiányzik a letöltött nyelvi modell megfelelő elérési útja? Kattintson a gombot a három ponttal a mező jobb oldalán, és manuálisan válassza ki a Hugging Face oldalról letöltött fájlt.

Innen a mellette lévő legördülő menüt is használhatja Modell megvalósítás kiválaszthatja, hogy szeretné-e futtatni a Whispert a GPU-n (GPU), mind a CPU-n, mind a GPU-n (Hibrid), vagy csak a CPU-n (Referencia).

A Fejlett gomb további lehetőségekhez vezet, amelyek befolyásolják, hogy a Whisper hogyan fog futni a hardveren. Mivel azonban a gomb egyértelműen jelzi, hogy fejlettek, azt javasoljuk, hogy csak akkor módosítsa őket, ha hibaelhárítást végez, vagy tudja, mit csinál. Ha itt rossz beállításokat állít be, az teljesítménybüntetést vonhat maga után, vagy használhatatlanná teheti az alkalmazást.

Kattintson az OK gombra, hogy az alkalmazás fő felületére lépjen.

Ha már van hangfelvétele, amelyet írott szöveggé szeretne alakítani, kattintson a gombra Fájl átírása és válassza ki. Ennek ellenére a Whisper Desktopot használjuk a cikk élő átírásához.

A kínált lehetőségek egyértelműek. Kiválaszthatja a nyelv A Whisper használni fogja, válassza ki, ha akarja fordít nyelvek között, és engedélyezze az alkalmazást Debug Console.

A legtöbb angolul beszélő felhasználó nyugodtan kihagyhatja ezeket a lehetőségeket, és csak a megfelelő hangbemenetet kell kiválasztani a mellette lévő legördülő menüből. Rögzítőeszköz.

Győződjön meg róla Mentés szöveges fájlba és Csatolás ehhez a fájlhoz engedélyezve van, hogy a Whisper Desktop a kimenetét fájlba mentse anélkül, hogy felülírná annak tartalmát. Használja a gombot a három ponttal a fájl elérési útja mezőjének jobb oldalán található szövegfájl meghatározásához.

Kattintson Elfog hogy elkezdje átírni a beszédet szöveggé.

A Whisper Desktop három jelzőt jelenít meg arra vonatkozóan, hogy mikor észleli a hangtevékenységet, amikor aktív az átírás, és amikor a folyamat elakadt.

Addig beszélhet, ameddig csak akar, és időnként látnia kell az első két jelzőfény felvillanását, miközben az alkalmazás szöveggé alakítja a hangját. Kattintson Állj meg amikor kész.

A kiválasztott szövegfájlnak meg kell nyílnia az alapértelmezett szövegszerkesztőben, és írásos formában tartalmazza mindazt, amit a kattintásig mondott Állj meg.

Meg kell jegyeznünk, hogy megteheti az ellenkezőjét is annak, amit itt láttunk: bármilyen szöveget beszéddé alakíthat. Így bármit úgy hallgathat, mintha podcast lenne, ahelyett, hogy fárasztaná a képernyőn hunyorogva szemet. Ha többet szeretne megtudni erről, tekintse meg cikkünket a legjobb ingyenes online eszközök a szövegfelolvasó letöltéséhez MP3 hangként.

Tippek a suttogó asztali hangíráshoz

Bár a Whisper Desktop életmentő lehet, lehetővé téve, hogy sokkal gyorsabban írjon a hangjával, mint ahogyan gépelni tudna, ez messze nem tökéletes.

Tesztelésünk során azt tapasztaltuk, hogy időnként akadozhat, kihagyhat néhány szót, és nem sikerül átírni, amíg Ön manuálisan állítsa le és indítsa újra a folyamatot, vagy elakadjon egy hurokban, és folytassa ugyanazt a kifejezést többször.

Úgy gondoljuk, hogy ezek átmeneti hibák, amelyeket kijavítanak, mivel az önálló Whisper nem mutat ugyanazokat a problémákat.

Az apróbb hibáktól eltekintve a Whisper Desktop segítségével könnyedén átválthatja a hangját szöveggé. Mégis, a tesztek során azt találtuk, hogy még jobban teljesíthet, ha...

  1. Ahelyett, hogy csak két-három szót mondana ki, majd megállna, a Whisper jobban megérti Önt, ha tovább folytatja. Próbálj meg legalább egy egész mondatot mondani egyszerre.
  2. Ugyanezen okból kerülje az átírási folyamat ismételt elindítását és leállítását.
  3. Amikor rájössz, hogy hibát követtél el, hagyd figyelmen kívül, és folytasd. A nyelvi modell betöltése és eltávolítása a folyamat legidőigényesebb részének tűnik a Whisper jelenlegi állapota és a rendelkezésre álló hardver mellett. Így gyorsabban folytatja a beszélgetést, és utána javítja ki a hibáit.
  4. A Whisper önálló verziójához hasonlóan a legjobb, ha a rendelkezésre álló hardverhez optimális nyelvi modellt használ. Akár a közepes modell, ha a GPU 8 GB VRAM-mal rendelkezik. Ha kevesebb VRAM-ot szeretne, válassza a kisebb modelleket. Csak a kicsit pontosabbat, de sokkal igényesebbet válassza nagy modell, ha 16 GB vagy több VRAM-mal rendelkező GPU-t használ.
  5. Ne feledje, hogy minél nagyobb a nyelvi modell, annál lassabb az átírási folyamat. Ne válasszon a szükségesnél nagyobb modellt. Valószínűleg azt fogja tapasztalni, hogy a Whisper Desktop már legtöbbször „megért” a közepes vagy kisebb modelleknél, bekezdésenként csak egy-két hibával.

Még mindig gépel? Használja hangját suttogással

Annak ellenére, hogy a beállításhoz némi időre van szükség, amint azt majd látni fogja, amikor kipróbálja, a Whisper Desktop sokkal jobban teljesít, mint a legtöbb alternatíva, sokkal nagyobb pontossággal és nagyobb sebességgel.

Miután elkezdi használni a hanggal történő gépelést, a billentyűzete úgy nézhet ki, mint egy régmúlt idők emléke.