Mit kell tudni az e-könyvekről?

Ebben a leckében az e-könyvekkel fogunk kissé jobban megismerkedni. A további leckékben pedig körbejárjuk megjelenítésükhöz szükséges szoftvereket és hardvereket (ETA lecke: Az e-könyves világ szoftverei és hardverei (html)), végül pedig megnézzük a hozzájuk kapcsolódó szolgáltatásokat (ETA lecke: Az e-könyv a szolgáltatásokban: e-könyvtárak és társaik (html)).

Mindezek során 2 nagyobb témát fogunk körbejárni.

ikon

Terminológiák

Hogyan fogalmazhatjuk meg, hogy mi is az az e-könyv?

ikon

Formátumok

Mi a különbség a különböző e-könyvformátumok között a PDF-től az EPUB-ig?

Fontos

A szövegben csillaggal jelölt fogalmakat felugró ablakban olvashatja, illetve kereshető formában az alábbi weboldalon tudja elérni, vagy az ETA-ban a Könyvtárhasználati kislexikon nevű pdf-ben láthatja az adott fogalom, szakszó részletesebb magyarázatát!


Mindnyájunknak van fogalma arról, hogy mi az e-könyv ill. e-book. De ha hárman beszélgetnek erről, kiderül, mind a hárman mást gondolnak…

Ebben a részben ezt kívánjuk körbejárni tehát: mi is az e-könyv? Amikor egy könyv be van digitalizálva? Ennyiről lenne szó? S akkor ez tkp. egy papír alapú könyv képeiből áll össze? Magyarán egy lefotózott hagyományos könyv? De akkor hogyan kereshetünk bennük? Hogyan másolhatunk ki részeket? S hogy lehet, hogy "elfér" telefonunkon is, s egy nagy monitoron is olvasható? Vagy nem mindegyik?

Képernyőhöz alkalmazkodik? Mások úgy mondják: "reszponzív"*Az angol responsive (válaszoló, alkalmazkodó, képlékeny stb.) szóból alkotott szakkifejezés, ami arra utal, hogy az adott dokumentum, legyen az egy weblap, vagy egy off-line elektronikus dokumentum az adott eszközön áttördelődik és alkalmazkodik az adott eszköz képernyő-sajátságaihoz. Így valójában a formátuma kötetlen, átalakítható használat közben is. … ill. hogy tördelve van… ezek mit jelentenek?

S aztán van aki e-könyv olvasót használ, van aki tableten olvas, sőt a notebookján… az mind e-könyv? Hogy lesz egy könyvből e-könyv? Milyen mostanában egy tipikus e-könyves milyen lehetne és mi vele a baj? (Ha baj van vele egyáltalán…)

S mi az e-könyv előnye? Mi nem e-könyv, s mi az, ami majdnem az, de mégsem... Tényleg 20 év múlva már nem lesznek könyvek? Könyvesbolt sem, könyvillat sem? Szép színes borító és tipográfia sem?

Kezdjük tehát elölről, tegyük rendbe a fogalmakat és próbáljunk válaszolni ezekre a kérdésekre…

Aze-könyv*Lásd részletesebben: Kislexikon (angolul e-book) a hagyományos könyvek digitális formája. Általában az elektronikus formában létrehozott, terjesztett, és csak digitális eszközön és külön szoftverrel olvasható szövegeket és képeket tartalmazó dokumentum-formátumot értjük alatta. Az igazi e-könyv nem kötött formátumú, és alkalmazkodik a tördelése az adott eszköz képernyőjéhez, formai megjelenésének egy része (betűméret és -típus, háttérszín stb.) olvasáskor változtatható.

Az e-könyv formátumot két dolog hívta létre: a digitalizáció*Könyvtári szempontból egy hagyományos adathordozón (papír, film, hang- és videoszalag stb.) levő információ számítógépre vitele valamilyen speciális eszközzel (képbeolvasó szkenner, hang- és videokártya stb.); a rajtuk lévő hagyományos jelek számjegyekké (digit) alakítása. és a hálózati terjesztés. Már a 90-es évektől készítettek hipertext*Az angol hypertext, szóból.
Magyarul: hipertext, hiperszöveg, hálószöveg
Olyan (számítógépen tárolt) szöveg, melynek egyes pontjairól mutatók vannak a szöveg más pontjaira vagy más szövegekre. A hipertext olvasói ezeket a mutatókat követve kedvük szerint, különböző sorrendben haladhatnak a szöveg(ek)ben. A számítógépes hipertextek esetében a mutatók követését és az eligazodást egy speciális szoftver, pl. böngésző segíti. Az internet mai formájában ilyen hipertext (HTML ) dokumentumokra épül.
alapú, könyveket utánzó formátumokat, s ezek a hálózaton is megjelentek, de igazából e-könyvnek azóta nevezzük ezeket, amióta megfelelő méretű és minőségű kijelzővel rendelkező hordozható eszközök jelentek meg kezelésükre. Ezen a területen hatalmas áttörést jelentett az ún. e-papír* Az elektronikus papír az e-könyvek megjelentetésre kifejlesztett technológia. Alapját a több millió parányi mikrokapszula adja. Ezek pozitív töltésű fehér és negatív töltésű fekete pigmentet tartalmaznak és átlátszó folyadékban „úsznak“. Az elektromos mező töltésének változtatásával hol a fekete, hol a fehér pigmentek látszódnak.
Az ilyen kijelző csak akkor fogyaszt áramot, amikor tartalma változik. Ha egy e-könyv-olvasót nézünk, csak lapozáskor van szükség áramra, viszont amíg olvassuk az adott oldalt (és nem változik a kijelző tartalma), a kijelző nem fogyaszt semmit.
(e-ink) kijelzővel ellátott e-könyvolvasók megjelenése.


Az e-könyv fogalmának szűkebb és tágabb értelmezése

Bár a fentiekben kifejtett formát nevezzük valójában az e-könyv szűkebb és pontosabb definíciójának, a hétköznapi életben valójában minden könyv méretű és digitálisan kezelhető állományra is szokták használni az e-könyv fogalmat.

Ez azt jelenti, hogy ha valaki lefotóz egy könyvet mobillal és elmenti összefüggő PDF*A legelterjedtebb dokumentum-szabvány manapság, elsősorban megformázott, csaknem „nyomdakész“ dokumentumok számára alakították ki. A PDF állományok nagyon korlátozottan módosíthatók, megnézni és olvasni őket rengeteg programmal lehet. Ha egy analóg könyvből és nem egy számítógépes dokumentumból készül a pdf, akkor az lehet egy pusztán képeket tartalmazó sorozat is, de lehet olyan is, amikor egy speciális szövegfelismerő szoftverrel (OCR) fel is ismertetjük a rajta lévő szöveget, így egy ún. „kétrétegű“ PDF-formátum keletkezik, ahol a könyvoldalak szkennelt képe található, azonban a képek alatt, közvetlenül nem is látható módon egy kereshető és kimásolható, de általában javítatlan (vagyis még valamennyi hibát tartalmazó) szöveg is van. Az eleve számítógépes rendszerben készült szövegből olyan pdf készülhet, ami a grafikai külsőt is megőrzi és a szöveget is a fenti módon tartalmazza. (Portable Document Format) formában a képeket, gyakran azt is így hívja, sőt, sokan akár egy szövegszerkesztőben készült nagyobb méretű dokumentumot is így emlegetnek. Ezek az e-könyv fogalmának csak egyes kritériumait teljesítik.

Elektronikusan létrehozott szöveges PDF Forrás
Digitalizált képekből létrehozott képi PDF Forrás

Talán az eddigiekből is kiderült, hogy a problémát alapvetően ott tudjuk megragadni, ha világosan látjuk, hogy vannak 1) tisztán képi formátumok (pl. egy csak képszintű PDF) , ill. 2) vegyes formátumok, amelyekben a kép és a szöveg együtt van jelen (egymással összefüggésben pl. szövegesen is értelmezhető PDF), és vannak 3) tisztán szöveges formátumok, amelyek képeket csak illusztrációként tartalmaznak (klasszikus e-könyv).

A legjobban akkor járunk, ha kataszter-szerűen áttekintjük az összes fontosabb e-könyv formátumot és akkor világosan látjuk a különbségeket és az eltéréseket.

A PDF

A Portable Document Format (PDF) a manapság legelterjedtebb dokumentum-szabvány. Elsősorban megformázott, csaknem "nyomdakész" dokumentumok számára alakították ki. A PDF állományok nagyon korlátozottan módosíthatók, megnézni és olvasni őket rengeteg programmal lehet.

Ha egy analóg (azaz nyomtatott) könyvből és nem egy számítógépes dokumentumból készül a PDF, akkor az lehet egy pusztán képeket tartalmazó sorozat is, de lehet olyan is, amikor egy speciális szoftverrel (OCR*Az optikai karakterfelismerés (optical character recognition), amelyet gyakran rövidítettek OCR-ként, a gépelt, kézzel írt vagy nyomtatott (analóg) szövegek számítógépes eszközökkel történő elektronikus átalakítása. A beolvasott (szkennelt) dokumentumból vagy akár egy dokumentum fotójából a mesterséges intelligenciát is tartalmazó karakterfelismerő program felismeri a betűformákat, azokat szavakká rakja össze, akár úgy is, hogy közben a nyelvi szótárakkal korrigálja azokat.) fel is ismertetjük a rajta lévő szöveget, így egy ún. "kétrétegű" PDF-formátum keletkezik, ahol a könyvoldalak szkennelt képe található, azonban a képek alatt, közvetlenül nem is látható módon egy kereshető és kimásolható, de általában javítatlan (így előfordulhat, hogy tartalmaz valamennyi hibát) szöveg is van.
Kétrétegű PDF

Az eleve számítógépes rendszerben készült szövegből olyan PDF készülhet, ami a grafikai külsőt is megőrzi és a szöveget is a fenti módon tartalmazza, azzal a különbséggel, hogy ott a szkennelt képi réteg értelemszerűen hiányzik.

Hátránya

Az előzőekből következik, hogy bár a PDF nagyon elterjedt, pl. a Szaktárs rendszer csak ilyen könyveket tartalmaz, de kötött formátuma miatt nem alakul a képernyőhöz, emiatt mondjuk egy A3-as méretű újságlap PDF változatát alig-alig lehet olvasni egy mobil eszközön. Ezt szaknyelven úgy mondjuk, nem alakul a forma a képernyőhöz, tehát nem reszponzív.

Előnye

Könnyen és nagy tömegben gyártható, és mindenféle eszközzel és mindenki tudja olvasni, ha elég nagy a képernyője, tehetjük hozzá némi malíciával! A rögzített oldalkép miatt a PDF nagy előnye még, hogy pontosan és egyértelműen hivatkozható a benne szereplő tartalom, ezért előszeretettel alkalmazzák azt a tudományos és szakmunkák esetében.


Más képi formátumok: DjVu

Kevésbé elterjedt, de sok szempontból hasznos forma a DjVu*Neve a francia déjà vu kifejezésből ered (franciául: „már láttam”) , s arra utal, hogy az így elkészített elektronikus könyvmásolat megszólalásig idézi az eredeti könyvet.
Ez a formátum kifejezetten képként szkennelt könyvek digitális megjelentetésére és online szolgáltatására készült, a nagyon jól tömörített oldalképek (tehát a lap textúráját is őrzi valamennyire pl. régi könyvek esetén) "mögött" itt is (hasonlóan a pdf-hez) ott lehet az OCR-rel felismert, kereshető szöveg is. A file-ok nézegetéséhez és nyomtatásához egy DjVu olvasó és megjelenítő program szükséges vagy egy kiegészítő (plug-in), amely telepítés után beépül a böngészőprogramba.
formátum, amely sok hasonlóságot mutat a PDF formátummal. Neve a francia déjà vu kifejezésből ered (franciául: „már láttam”) , s arra utal hogy az így elkészített elektronikus könyvmásolat megszólalásig idézi az eredeti könyvet.

Ez a formátum kifejezetten képként szkennelt könyvek digitális megjelentetésére és online szolgáltatására készült, a nagyon jól tömörített oldalképek (tehát a lap textúráját is őrzi valamennyire pl. régi könyvek esetén) „mögött“ itt is ott lehet az OCR-rel felismert, kereshető szöveg is. A fájlok nézegetéséhez és nyomtatásához egy DjVu olvasó és megjelenítő program szükséges vagy egy kiegészítő (plug-in), amely telepítés után beépül a böngészőprogramba.

A legelterjedtebb valódi e-könyv formátumok

EPUB

Az EPUB ma már „ipari szabvánnyá vált“ formátum e-könyv olvasó eszközökhöz. Ezt a formátumot — ellentétben a Kindle és így az Amazon által preferált .mobi formátummal — kezdetben a kisebb konkurens cég, a Barnes & Noble használta.

Az EPUB név az Electronic Publication angol kifejezés rövidítése. Ez egy ingyenesen hozzáférhető, nyílt forráskódú elektronikus könyv szabvány. Az EPUB-ban íródott fájlok kiterjesztése: .epub. Az .epub fájlok valójában ZIP csomagok, melyekben a szöveges tartalmat HTML*(HyperText Markup Language) [magyar fordításban: hipertext jelölő nyelv} Az interneten jellemző hipertextes oldalainak leírására szolgáló szabványos nyelv, amelynek segítségével szövegeket, képeket, sőt hangokat és mozgóképeket is tárolhatunk. A HTML nyelven írt állományokat általában WWW szerverekkel szolgáltatják és böngészőkkel jelenítik meg. /XHTML állományok hordozzák, kiegészítve a szerkezetet leíró XML*Az angol Extensible Markup Language rövidítése, magyarul kiterjeszthető jelölőnyelv. Valójában egy általános célú leíró nyelv szabványa, aminek az elsődleges célja strukturált szöveg és információ megosztása az interneten keresztül. Célja az, hogy a puszta szövegen túl az arra vonatkozó strukturális információkat, amelyek lehetnek formaiak (cím, alcím, vastagítás stb.) és tartalmiak (pl. nevek, fogalmak jelölése) is egyként tartalmazza. Ezáltal egy a sima szövegnél sokkal jobban feldolgozható, visszakereshető szöveget tartalmaz, amely még formai/esztétikai szempontból is jobb eredményt ad. fájlokkal, továbbá stíluslapokkal és képfájlokkal. A nyílt szabványt egyre több kiadó és szoftverfejlesztő cég támogatja.


A dinamikus és a rögzített oldalkép jelentősége

Mint már a fentiekben többször utaltunk rá, az e-könyvként való szöveg olvasásánál rendkívül fontos jelentősége van annak, hogy az illető oldalnak, amit a képernyőn látunk, kötött-e a formátuma vagy szabad. A rögzített vagy kötött formátumú oldalkép problémáját gyakorlatilag a PDF forma tárgyalásánál kimerítettük, hiszen valójában egy képként ábrázolt dokumentum-formátumról van szó. Ez még akkor is igaz, ha az adott oldal optikai karakterfelismerése (OCR) már megtörtént. A dinamikus oldal ezzel szemben hasonlít a szövegszerkesztőben előállított oldalhoz, az e-könyvek gyakorlatában ez szinte mindig egy szabadon formálható és átrendezhető xml oldal. Ha az oldal dinamikus, tehát alkalmazkodni tud az olvasó masinánk képernyő méretéhez, akkor a már fentebb említett szakszóval azt mondjuk rá, hogy reszponzív. (A fogalmat a weboldalak világában is előszeretettel használják.)