A hangoskönyvek egyre nagyobb népszerűségnek örvendenek a hagyományos e-könyvekkel szemben. Kényelmesebbek, mivel bármikor és bárhol hallgathatja őket.

Egy egyszerű Python-szkripttel konvertálhat egy e-könyv PDF-fájlt hangoskönyvvé. Néhány egyszerű könyvtár használatával létrehozhat egy projektet, amely felolvassa a PDF-fájlt, és új fájlként tárolja a hangoskönyvet.

A szükséges csomagok telepítése

Telepítenie kell a PyPDF3, pyttsx3, és pdf vízvezeték-szerelő csomagok az induláshoz. Ezeket a csomagokat a pip csomagkezelő segítségével telepítheti. Győződjön meg róla, hogy már megvan pip telepítve van a rendszerére. A csomagok telepítéséhez futtassa a következő parancsot a parancssorban:

csipog telepítés PyPDF3 pyttsx3 pdf vízvezeték-szerelő
  • Használhatja a PyPDF3 könyvtár PDF-fájlok olvasásához és szerkesztéséhez Pythonban.
  • Az pyttsx3 könyvtár szöveg-beszéd átalakítást biztosít.
  • pdf vízvezeték-szerelő egy olyan könyvtár, amely lehetővé teszi szövegek és táblázatok kinyerését PDF-fájlokból.

A projektben használt kód elérhető a

instagram viewer
GitHub adattár és az MIT licence alapján ingyenesen használható.

PDF konvertálása hangoskönyvvé Python segítségével

Miután telepítette a fenti csomagokat, készen áll arra, hogy importálja őket a python fájlba:

import PyPDF3
import pyttsx3
import pdf vízvezeték-szerelő

Meg kell adnia a konvertálni kívánt PDF-fájl nevét és helyét. Az egyszerűség kedvéért bármilyen minta PDF-fájlt használhat. Másolja be ugyanabba a könyvtárba, mint a szkript, és tárolja a nevét egy változóban; ha úgy hívják Lorem.pdf, például:

fájl = 'Lorem.pdf'

Ezután hozzon létre egy fájlobjektumot a PDF-fájlhoz és egy PDF-olvasó objektumot:

könyv = nyitott (fájl, 'rb')
pdfReader = PyPDF3.PdfFileReader (könyv)

Később végignézi a PDF-fájl összes oldalát. Az oldalak teljes számának megtekintéséhez használja a lapok száma ingatlan:

oldalak = pdfReader.numPages

Most készen áll a szöveg kibontására a PDF-fájlból:

finalText = ""

val vel pdfplumber.open(fájlt) mint pdf:
i tartományban (0, oldal):
oldal = pdf.oldalak[i]
szöveg = page.extract_text()
finalText += szöveg

Használja a for ciklust az összes oldal ismétléséhez, és a szöveg kibontásához a PDF-ből. A pdfplumber csomag segítségével megnyithatja a pdf fájlt és a kivonat_szöveg Szöveg lekérésének módszere egy oldalról.

Ha a teljes szöveget egy változóban tároljuk, akkor igény szerint tovább dolgozhatja. Ha a szöveget hangra szeretné konvertálni, és új fájlba szeretné menteni, használja a következő kódot:

motor = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motor.Fuss és Várj()

Amikor te futtassa ezt a Python kódot, akkor létrehoz egy hangoskönyv fájlt a könyvtárában.

Ha nem szeretné menteni a hangoskönyvet, és például el szeretné olvasni a PDF-fájlt, használhatja helyette a következő kódot:

motor = pyttsx3.init()
motor.mond(végsőSzöveg)
motor.Fuss és Várj()

Amikor futtatja ezt a szkriptet, a PDF-fájlt fogja előadni.

Projektek fejlesztése Python használatával

A Python sokoldalúságáról ismert. A Python segítségével könnyen létrehozhat gyakorlati alkalmazásokkal rendelkező projekteket.

Ha szeretné bepiszkítani a kezét a Python-kóddal, kezdheti miniprojektek fejlesztésével. Néhány jó kiindulási ötlet egy kvízalkalmazás, chatbot, kígyójáték, URL-rövidítő, webkaparó vagy mértékegység-átalakító.