A Kdenlive-ban automatikusan generálhat feliratokat, de a pontosság érdekében manuálisan is hozzáadhat feliratokat. Mutatjuk mindkét módszert.

Réges-régen, mint a videószerkesztés legtöbb vonatkozása, a projektek feliratainak létrehozásához külön és gyakran drága szoftverre volt szükség a videószerkesztő tetején. De a mesterséges intelligencia térnyerésével a projektek automatikus feliratozása megszokottá vált.

Az egykor hosszú házimunka nagyrészt egy kattintás és felejts eljárás lett, amely legfeljebb perceket vesz igénybe, és az eredmények olyan pontosak, mint valaha. Megvizsgáljuk ezt a folyamatot az ingyenes Kdenlive szerkesztőben.

Mi a különbség a VOSK és a Whisper között?

A Kdenlive 23.04, a nyílt forráskódú videószerkesztő megjelenésével kapott egy Whisper beszéd-szöveg motort, amelyet OpenAI hajt. A cikk írásakor a Whisper az eredeti VOSK-motor mellett létezik, és mindkettő azonosan működik e cikk céljaira.

A kettő közötti különbségek nagyrészt a pontossággal kapcsolatosak, a Whisper ennél többet ígér természetes hangzású nyelvfeldolgozó rendszer, és potenciálisan a nyelvek lefordításának képessége angol menet közben.

1. Feliratok létrehozása manuálisan a Kdenlive-ban

Noha időigényes, a feliratok manuális létrehozása azzal az előnnyel jár, hogy jobban szabályozhatja a megjelenő szöveg időzítését. Bármennyire is jó lett a hangfelismerés az elmúlt években, nem mindig sikerül. Tehát van valami, amiről azt mondjuk, hogy inkább saját kezűleg csinálja, mintsem egy teljes idővonalon keresztül kutatva egy mesterséges intelligencia hibáit.

A feliratok generálásához kattintson jobb gombbal egy klipre az idővonalon, és válassza a lehetőséget Klip a Project Binben. Ez automatikusan megtalálja a klipet a tárolóban, és kiemeli, hogy a beszédfelismerő eszköz megtalálja.

  1. A beszédfelismerés lapon válassza ki a beszédmodellt a legördülő listából. A választott beszéd-szöveg modultól függően a fenti képernyőképek egyikéhez hasonlóan fog kinézni.
  2. Az eszköz a Project Binben lévő teljes klipen fog működni, ha például egy klipben lévő összes beszédet tartalmazó szöveges dokumentumot szeretne exportálni. Illetve, ahogy itt is, a jelenlegi idővonalon fog működni, hogy feliratokat generáljon.
  3. Feliratok generálásához győződjön meg arról, hogy az idővonal aktív.
  4. A cikk írásakor a Csak a kiválasztott zóna A toggle csak a Project Binben lévő klipekhez használható, így egyelőre figyelmen kívül hagyhatjuk, és egyszerűen megnyomhatjuk a gombot Indítsa el a Felismerést gomb.
  5. A számítógép sebességétől függően a várakozás rövid vagy viszonylag hosszú lesz. De végül a beszédfelismerő mező elkezdi megjeleníteni a szöveget. Ha kész, másolja ki és illessze be a teljes kimenetet a Feliratok eszközt az idővonaltól jobbra.
  6. A Feliratok eszközben kattintson a gombra + feliratsáv létrehozásához. Azonnal meg kell töltenie a beillesztett szöveggel.
  7. Nézze meg a jelenetet, és megálljon ott, ahol a párbeszédablak minden sora kezdődik és végződik. A Felirat eszközben helyezze a kurzort a megfelelő helyre a szövegben, és nyomja meg az olló ikont a felirat felosztásához az aktuális helyen.
  8. Állítsa be ennek megfelelően.

2. Feliratok automatikus létrehozása a Kdenlive-ban

Ez volt a legnehezebb módja ennek. De mi van azzal, ha hagyod, hogy a szoftver gondoskodjon róla?

Néhány webhely, például a YouTube, feliratokat adhat a hátuljához, ami hasznos lehet, ha ez a platform a célközönsége. De mint minden automatikus módszernek, ennek is van néhány előnye, ha manuálisan csinálja, valószínűleg a pontosság a legnagyobb, de a feliratozási időzítés is módosítható, ahogy halad.

Kis jelenetek esetén azonban az automatikus feliratozási eszköz mindössze négy lépésben végez csodálatra méltó munkát.

  1. Nyissa meg a Feliratok szerszámot és nyomja meg a gombot + hogy létrehozza a feliratsávot, ahogy korábban tette.
  2. A létrehozott feliratsávban törölje a létrehozott kezdeti klipet, és kattintson a varázspálca ikonra a feliratsáv beállítási menüjében.
  3. A megjelenő mezőben válassza ki, hogy a program feliratot generáljon a teljes idővonalhoz, egyetlen műsorszámhoz vagy egy kiválasztott kliphez. Ha a Whisper AI modult használja, akkor lefordíthatja a szöveget angolra is.
  4. Üsd a Folyamat gombot, és várjon néhány percet, amíg a program elvégzi a munkáját. A fenti kézi módszerhez hasonlóan az idő a számítógép teljesítményétől függ.

Amint a program elvégezte a dolgát, a feliratok remélhetőleg a megfelelő helyen jelennek meg, vagyis kihagyhatod a feliratok manuális felosztásának utolsó lépéseit, ahogy fent tetted. Bár ez minden bizonnyal gyorsabb, hajlamos lehet egy kicsit korán megjeleníteni a feliratokat, és ha ez zavar, módosítható. De ezen kívül csak ennyi.

Könnyen létrehozhat feliratokat a Kdenlive-ban

Példánkban az időbeli különbség a feliratok manuális létrehozása és a program elvégzése között meglehetősen minimális volt. Ez egy rövid, 18 másodperces jelenet volt, összesen mindössze öt sornyi párbeszéddel. Egy nagyobb projektnél ez a hatékonyság nyilvánvalóan felfelé haladna.

Amikor eléri azt a pontot, amikor egy 30 perces projekt befejezésének határidején dolgozik, minden megtakarított perc értékes, és így az automatikus feliratozás értékét nem lehet túlbecsülni, akár a videószerkesztőbe, akár egy különállóból van beépítve az automatizálás. program.