František Čermák
Dvoujazyčný slovník a korpus: některé poznámky
(v tisku, rozšířená verze Překladové lexikografie, in Manuál lexikografie 1995, 230-248)
1. Bilingvní slovníky
1.1 Slovník, jeho cíle a typy
Překladové (zvl. dvoujazyčné, bilingvní) slovníky byly a jsou výrazem potřeby usnadnit, urychlit, popř. i standardizovat kontakt mezi komunitami s různými jazyky, tedy překlad nejrůznějšího druhu. Dvoujazyčná lexikografie, z jejíhož poznání by slovníky měly vycházet, je obecně orientována na hledání možností a prostředků vzájemné substituce, tj. specifičtěji hledání takových lexikálních jednotek cílového jazyka (ekvivalentů), které po vložení do daného kontextu poskytnou hladký překlad (Zgusta 1984, 147), resp. překlad adekvátní.
Slovník však nelze chápat jako dva prosté seznamy slov, které zaměňujeme podle pravidla kus za kus (což je běžný naivní pohled na něj), ale jako komplexní a vnitřně strukturovaný soubor hesel, ke kterým hledáme ekvivalentní hesla v druhém souboru. Protože ekvivalentem slova není zdaleka vždy jiné slovo, ale i jednotky jiných rovin, je sám název slovo, szótar, Wörterbuch, sanakirja, ordbog, žodynas atd. (oproti dictionary, dizionario atd.) klamný. Namísto o slovníku by tedy bylo výstižnější mluvit např. o "hesláři" ap.: název slovník, ale i slovo zde (i jinde) zavádí, udržuje se jen tradicí a s ohledem na laického uživatele (jde v něm i o víceslovné lexémy, morfémy aj.).
Potřeby, které slovníky plní, lze shrnout aspoň zhruba do tří okruhů:
1-cestování, obchod a jiný praktické n. kulturní styky; hlavní okruhy častých n. pravidelných uživatelů jsou administrativa a překladatelé a tlumočníci;
2-odborný styk vázaný na terminologii; hlavní uživatelé jsou odborní překladatelé (tlumočníci tu téměř neexistují);
3-studium druhého jazyka a tím prohloubené budování předpokladu pro nejsystematičtější, nejširší a dlouhodobý styk, často bez bezprostředního styku; hlavní uživatelé jsou (zvl. univerzitní) studenti a lingvisté. Zvláště poslední okruh souvisí však i s potřebou budovat automatizované počítačové slovníky.
Z hledisek obsahových a jiných vnějších lze jemněji rozlišovat slovníky mnoha typů; k hlavním typům patří zvláště tato hlediska: (1) počet jazyků, (2) rozsah lexikonu (všeobecný, spisovný, slang aj.?), (3) obor jazykový a věcný (problémy terminologie a informace encyklopedické?), (4) čas a (5) zaměření slovníku (obecný-studijní/školní?).
Různou kombinací těchto hledisek je potenciálně daná i velmi pestrá škála možností, kterou lze ještě mnohonásobně v teorii rozšířit, zapojí-li se do této typologie i výše uvažované uživatelské funkční typy slovníku. Lze však uvažovat ještě o dalších, byť okrajových hlediscích, např. o distinkci apelativnost-propriálnost; i když se všechny dosud uvažované typy týkaly jen apelativ, lze si dobře představit i překladový slovník proprií (srov. Prague-Praha, Prága-Praha ap. pro angličtinu a ma_arštinu, ale i typ Cařihrad-Istanbul-Konstantinopol mající diachronní povahu aj.), slovník zkratek ap. V praxi se ovšem tento i další typy samostatně nevyskytují a obvykle se kombinují, a to jen do určité míry, a proto je většina stávajících slovníků svou povahou typicky smíšená.
V realitě tomuto rozlišení odpovídají i různě pojaté praktické typy slovníků, k nimž nejčastěji patří zvl. slovníky obecné (akademické a obv. i velké, sem patří i slovníky mrtvých jazyků), terminologické a studijní (pro cizince); o reálné diferenciaci a pluralitě nabídky ovšem rozhoduje trh a rozsah jazykové komunity a/nebo uživatelů (živá latinská komunita dnes žádná není, ale potřeba latinských slovníků je značná), často však i tradice a jistá setrvačnost názoru. Dnešní poznání však napovídá něco jiného: na jedné straně to, že obecný slovník plnící všechny funkce pro všechny uživatele neexistuje a jednak to, že je škálu uživatelů třeba poznat, typizovat a vyjít jí vstříc. Jakkoliv je toto ohled zásadní, bližší poznatky o povaze, potřebách a rozsahu uživatelů obecně bohužel chybí, nikdo se neobtěžuje si zjistit stav věcí; to ztěžuje možnost orientaci slovníků výrazněji specifikovat. V jiném smyslu jsou utilitárnost, návratnost investic a tedy i rozsah uživatelů drasticky omezeny u komunity malé (např. české, ma_arské, dánské, makedonské), a ke skutečné pluralitě nabídky a jemnější diferencovanosti tu zpravidla nedojde (místo desítek slovníků, jako např. mezi angličtinou a francouzštinou, je tu slovník jen jeden nebo dva). Nutností, zcela však teoreticky nezmapovanou, pak je, odpovědět si na otázku, které typy slovníku lze ekonomicky integrovat do jediného a jak; univerzální slovník spojující v sobě všechny výhody řady přístupů je zřejmě (zatím) mýtus. Nepříjemnou pravdou je také to, že ze stejných ekonomických důvodů ke vzniku slovníků mezi dvěma malými jazyky, není-li tu zvláštní důvod (např. sousedství), však zpravidla vůbec nedojde.
Povaha slovníku, kterou lze do konkrétní podoby realizovat přitom různě, je tedy ideálně dána cílem, typem uživatele a potřeby, kterou má plnit. Jen takto lze rozhodnout, zda půjde o studijní či vědecký slovník, anebo jen o okomentovaný seznam slov; mezi těmito extrémy si lze představit řadu stupňů a podob. Stejnými ohledy je dán i rozsah slovníku, u jehož jednotlivých typů jsou hlavní kvalitativní rozdíly dány především mírou explicitnosti jejich informace. Je třeba si uvědomit, že tradiční dělení na slovníky kapesní (cca 10-15 tisíc hesel na obou stranách), střední (cca 35-50 tisíc hesel) a velké (nejasné, obv. 80 tisíc a více s implicitním naznačením vyčerpávající povahy, i když takový slovník ovšem neexistuje) není založeno na žádném zjištěném objektivním kritériu a je pouhou (a pohodlnou) nakladatelskou zvyklostí, která kontinuum potřeb jen pragmaticky zjednodušuje. I když z výzkumů statistického pokrytí textu základními lexémy se dá leccos odvodit, praxe o nich nic neví.
1.2 Funkce překladových slovníků
Ve smyslu orientace na uživatele a využitelnosti slovníku v rámci základního (a nejčastěji) uvažovaného bilaterálního jazykového vztahu není jeho funkce vždy tak jasná, jak se může zdát. Nejranější a laické představy tu primitivně funkci slovníku ztotožňují s počtem zapojených jazyků, a mluví (I) o slovníku do druhého (cílového) jazyka a z něj do jazyka domácího, tedy o dvou slovnících.
Běžné dnešní poznání však mluví obvykle o (II) čtyřech funkcích a tedy i uživatelských typech slovníku, kdy např. pro češtinu a ma_arštinu je třeba, při sledování dichotomie kódování-dekódování (tj. pro syntézu-analýzu textu, resp. pro mluvení/psaní-poslech/četbu), mít slovník:
(1a) česko-maďarský kódovací, tj. pro Čechy,
(1b) česko-maďarský dekódovací, tj. pro Maďary,
(2a) maďarsko-český kódovací, tj. pro Maďary,
(2b) maďarsko-český dekódovací, tj. pro Čechy
Avšak přidáním dalšího důležitého zřetele, resp. dichotomie aktivní-pasívní se předchozí rozdíl ještě dále zjemňuje. Lze pak (III) lišit orientaci na
(aA) komunikativní kompetenci a plnou a dokonalou syntézu/kódování, nebo jen (aB) snahu o orientační, aproximativní a hrubou korespondenci (=a, viz 1a, 2a výše) proti orientaci na
(bA) plnou a odstíněnou analýzu/dekódování, nebo jen na
(bB) orientační, hrubé porozumění/dekódování (=b, viz případy 1b, 2b výše).
Tato distinkce pak teoreticky vytváří s předchozí osm různých typů funkce a tedy i typů slovníku mezi dvěma jazyky (srov. i Hausmann 1988) a promítá se výrazně především do rozdílů v rozsahu slovníku (oba případy A vyžadují slovníky větší, srov. Čermák 1986).
1.3 Materiálová báze slovníku
Tradiční dobrá lexikografie pochopitelně neopisuje ze slovníků starších, ale opírá se o vlastní překladovou excerpci, často i dobrých překladatelů, obecných i odborných. Vytvořit spolehlivou kartotéku excerpt však trvá dlouhá léta, a proto se dnes hledají cesty kratší a řešení rychlejší, totiž v paralelních korpusech. Paralelní korpus je rozsáhlý soubor identických textů v obou jazycích (překladů, někdy i z třetího jazyka), který slouží v zásadě stejně jako korpus jednojazyčný: nalezením slova ve výchozím jazyce v jeho kontextu/kontextech a počítačovým vyhledáním odpovídajícího místa a ekvivalentu v cílovém korpusu, opět v kontextu k posouzení vhodnosti, se vlastně ve zkratce opakuje tradiční cesta excerpce. Výhodou tohoto přístupu, kdy se nemusí texty pracně shánět a excerpční lísteček vypisovat rukou a hledat v kartotéce, je obrovská rychlost nalezení, kontrola v opěrném širokém kontextu i statistická nápověda v podobě vyhodnocení typičnosti nalezeného ekvivalentu z hlediska frekvence jeho opakování v celém korpusu. Je zřejmé, že čím je paralelní korpus větší, tím jsou informace v něm objektivnější, širší i spolehlivější, tj. nenáhodnější. Pro překladový slovník jednoho směru je dnes tedy třeba mít ideálně k dispozici
(1) kartotéku, resp. databázi s množství překladových excerpt (zvl. z oblastí terminologických a některých dalších) a
(2) paralelní komputerové korpusy obou jazyků s příslušným vyhledávacím softwarem (aligner).
Nedobrou tradicí překladových slovníků bývá, že svou materiálovou základnu často mechanicky přebírají ze slovníků výkladových, která nejenže není východiskem vždy nejlepším, ale může slovníkáře vést i k omylům (např. mechanickým přenášením členění polysémie z výchozího jazyka do cílového).
Stanovením cíle, funkce, povahy a typu slovníku a jeho materiálové báze je dán soubor východisek k vlastní tvorbě slovníku, která by nikdy neměla být pouhou kompilací z předchozích publikací. Zároveň je tak do značné míry předurčena i metodologie vlastní tvorby.
1.4 Projekt slovníku
Optimální pojetí slovníku lze obecně shrnout takto: Slovník je příručka mapující lexikálně-sémantické korelace a všechny další systémové vztahy mezi dvěma jazyky, s nimi pevně spjaté, která má komplexní paradigmaticko syntagmatickou povahu. Při opření o spolehlivou materiálovou bázi by měl takto mít základní vybavení dvojího typu:
(a) měl by zařazovat lexém do systému souvislostí, především tříd, kam ten který lexém patří;
(b) měl by naznačovat valenci a základní kolokabilitu (syntagmatiku, spojitelnost) pro každé heslo, resp. heslové slovo i ekvivalent.
Oba aspekty jsou zásadní a je nutné je ve slovníku zachytit. Bez prvního je v něm slovo osamělá troska bez přátel, adresy a vztahů, bez druhého je torzo bez končetin a tedy bez možnosti pohybu po jazykovém světě. Obojí je však tvrdošíjně opakovanou běžnou komerční praxí více či zcela popíráno a ignorováno do té míry, že se často zdá být luxusem. To, co běžná praxe pak vydává za slovníky, je jen hromada sice pracných, ale iritujících polotovarů (v kolika z nich je např. uspokojivě zachycena valence?). Toto platí zvláště o malých a kapesních slovnících. Shrnuto ještě jinak, znamená to, že slovník by se neměl dělat podle zásady slovíčko za slovíčko (kromě slovníků terminologických, např. z matematiky) a protože domácímu slovu odpovídá jednoznačně cizí slovo jen málokdy, je třeba se řídit zásadou, že heslu odpovídá i v cílovém jazyce celé "heslo" jakožto komplex informací, resp. často hesel víc.
Vlastní projekt slovníku, determinovaný aspekty, které byly většinou jen stručně naznačeny výše, musí komplexně zahrnout realistický odhad rozsahu a časové délky práce, typu a náročnosti práce, zpětné vazby, druh kontroly a koordinace i míru a povahu podmíněnosti, resp. závislosti pracovního týmu na externí spolupráci s jinými odborníky; ta, především terminologická, roste s rozsahem a náročností slovníku. Projekt musí být rozepsaný jak z hlediska jednotlivých typů a rozsahu úkolu systemizovaných pracovníků, které je nutné do práce napřed zacvičit (A-lineární plán), tak z hlediska koordinace, kontroly (evidence) a zpětných vazeb (B-nelineární plán s "návraty" a paralelními kroky). Pokud bude k práci využito elektronických zdrojů a softwarových nástrojů (a to by mělo), je třeba do této druhé složky (B) začlenit dostupné maximum počítačové kontroly, kterou si lze neobyčejně výhodně zajistit homogennost zpracování (stejný typ informace : stejná forma zpracování), jeho úplnost (kontrola mezer), grafickou jednotnost ap.; v řadě zemí se běžně využívají různé syntaktické analyzátory (angl. parsers) jednak složek hesla, jednak např. definice ap. Obrovskou výhodou tohoto přístupu je bu_ přímo odstranění či radikální redukce posteditačních korektur, což byla tradičně noční můra všech lexikografů.
Důležitou součástí projektu je stanovení základního hesláře (a vymezení kritérií výběru hesel) a určení typů a struktury hesel. Obsah a složení hesláře musí samozřejmě vyhovovat obecným cílům slovníku; měl by, vedle řady dalších kritérií, odrážet např. u slovníku synchronního, synchronní frekvenci hesel a jejich skutečný a doložený úzus. Notorickým nedostatkem např. českých synchronních slovníků je v důsledku nesmyslného prospisovného elitářství jejich totální opovrhování mluveným jazykem (s následky v diskomunikaci např. v hospodě nebo při četbě moderní beletrie) a naproti tomu často zdůrazňování dávno už neužívaných lexémů knižních (typu žoužel).
Struktura standardního hesla (tj. vedle hesel jiného typu) dnes nutně musí začlenit všechny relevantní informace paradigmatické i syntagmatické u formy výchozího jazyka a podle typu slovníku i u ekvivalentu v jazyce cílovém. Proti minulosti a tradici je třeba zvláště zdůraznit potřebu pokrytí aspektů syntagmatických (valence a sémantická kolokabilita) a u ekvivalentu informace paradigmatické, zvl. ve smyslu jeho zasazení do sítě vztahů. Tomu musí vydatně napomáhat promyšlený návrh metajazyka a jeho zapojení v podobě anotací a poznámek zvláště k ekvivalentům.
2. Lingvistika a lexikografie
Lingvistická analýza obou jazyků, zvl. kontrastivní a typologická, však přináší pro koncepci slovníku i jeho konkrétní zpracování obvykle řadu velmi potřebným vhledů. Můžou se promítnout už do koncepce hesel, nebo do přístupů k některým typům ekvivalentů.
2.1 Typologie hesel
Z mnoha důvodů bývá nutné uvážit potřebu pracovat, vedle standardních hesel, se zvláštními typy hesel. K nim lze řadit především hesla odkazová, gramaticky nepravidelné formy lemmat s odkazem (zvl. supletiva), části slov či přímo morfémy (v češ. např. verbální prefixy), zkratky, výběr proprií a hesla konstruovaná pro potřeby slovníky v důsledku analýzy obou jazyků (např. složky kompozit, srov. fém- kovový). K poslednímu případu: tak např. čes. pré, které není lexémem (je pouze nedílnou součástí frazému mít pré), je třeba uvést zvlášť, obv. s odkazem na celek, a to v jakémkoliv slovníku. Naopak specificky ve vztahu k finštině je třeba uvádět jinak (jen pro češtinu) zbytečné formy jako přimíchat se (o látce): sekoittautua z toho důvodu, že reflexivizace (přimíchat - přimíchat se) je v češtině sice pravidelná a tedy jakoby pro slovník zbytečná, ale ve finštině je tu dost odlišné verbum (přimíchat: sekoittaa), tvořené takto ne zcela pravidelně a obecně. Jinými příklady jsou např. jevy reprezentované rozdílem aktíva či pasíva, nebo konkurencí syntetického verba (např. zestárnout) oproti analytickému STÁT SE adj. (např. stát se významným) stojící proti celkem jednotnému a pravidelnému skandinávskému bli/bliva/blive adj. (např. švéd. bli(va) gammal/viktig).
2.2 Ekvivalence a ekvivalent
Úhelným kamenem bilingvního slovníku je nalezení a odlišení ekvivalentů. Ekvivalence je pak vztah mezi lexémem v určitém významu výchozího jazyka a
formou cílového jazyka založený na jejich (téměř) identickém, resp. vysoce podobném významu a funkci, zatímco členy, koncovými termíny tohoto vztahu jsou ekvivalenty. Tento vztah přitom obvykle je asymetrický a ekvivalentem v druhém jazyce nemusí vždy být nutně lexém, ale jiná forma. Je to mj. důsledkem toho, že lexikálně-sémantické vztahy dvou jazyků jsou zásadně anizotropní. V tomto pojetí ekvivalent tudíž zprostředkuje informaci o sémanticko-pragmatickém systému druhého jazyka, popř. i o jeho potenciálu.
Teoreticky lze lišit čtyři, resp. tři obecné případy ekvivalence lexémů (mimo lexikografii však i jiných jednotek a funkčních forem); schematicky představuje první sloupec lexémy např. češtiny (jeden nebo více), druhý pak ekvivalenty v jiném jazyce (=situace česko-cizojazyčného slovníku):
A- 1 : 1 (jednoznačná ekvivalence, izomorfismus)
B- 1 : více (částečná ekvivalence, anizomorfismus)
C- více : více (částečná ekvivalence, anizomorfismus)
D- 1 : 0 (absence lexémů a tedy i ekvivalence; lakuny)
1-Případ D sem vlastně nepatří, nejde tu o žádný vztah (ekvivalence ani ničeho jiného); tradičně se tu nevhodně mluví o lakunách, mezerách ve slovníku, a naznačuje tak neschopnost druhého jazyka vyjádřit určitý význam jazyka prvního, což je očividný nesmysl. Každý jazyk je vždy schopný vyjádřit vše, co potřebuje; jakým způsobem to však dělá, je jiná věc. Nemusí to být nutně, v případě uvažované výchozí úrovně lexémů, koncový lexém, ale jejich kombinace, zvl. gramatická forma lexému ap. Je zřejmé, že častý zdroj této tudíž zdánlivé neekvivalence na lexikální, a to především substantivní úrovni (kterou lze v tomto případě kompenzovat deskriptivně, opisem), leží v tradiční oblasti kultury národa (dříve: reálií), tj. jídel, oděvů, nádobí, řemeslnických nástrojů, domácího náčiní a zařízení, náboženství, právních institucí, společenských vztahů apod.
2-Vztahy typu A-B-C, tj. částečné ekvivalence, lze přesněji označit jako jedno-jednoznačný, jednovíceznačný a více-víceznačný. Těchto případů je velké množství, od strukturně-gramatických, přes sémantické a stylistické až k pragmatickým. Poslední případ C se často neuvažuje, protože předpokládá určitou abstrakci (týká se komplexní souvztažnosti mezi dvěma skupinami lexémů, např. mezi skupinkou čtyř synonym ve výchozím jazyce a skupinkou sedmi synonymních ekvivalentů v jazyce cílovém), a představuje tedy zmnožení případy B. Lze ho podmíněně a nouzově nazvat polyekvivalencí.
3-Co do svého výskytu je případ A krajně vzácný (týká se v podstatě jen přesně a mezinárodně definovaných termínů); ani tak běžné pojmy jako stůl (např. v japonštině) či chléb (např. v arabštině) nemusejí mít ekvivalenty jednoznačné. Při běžném opomíjení případu C je pak zdaleka nejčastějším případ B, tj. částečná ekvivalence. Má mnoho subtypů a představuje i hlavní zdroj potíží při překladu. I způsobů mapování či třídění částečné ekvivalence je víc, zřejmě mj. i proto, že postulování určitého subtypu bude vždy záležet na typu jazyka.
4-Svou povahou je slovníková ekvivalence (srov. Duval) kdesi mezi překladovými ekvivalenty literárními a jednoznačností terminologickou. Oba extrémy odrážejí šíři škály, jejíž většinu je slovníkem třeba pokrýt, tj. od faktů jazyka a systémových pojmů k faktům textu a nesystémových aspektů. Tradičně se tento rozdíl vyjadřuje dichotomií denotace-konotace, jejíž oba termíny musejí být pokryty rovnoměrně. I když je pochopitelně denotativní složka lexémů téměř univerzální, obvykle lépe vystižitelná a nápadnější, jsou naproti tomu i slova, kde (téměř) chybí a převažuje pragmatická informace, často evaluativní povahy. Vedle toho však i velké množství lexémů s jasně denotativním typem významu má v různé míře zastoupenou i složku pragmatickou (konotativní). Vystižení pragmatické stránky bývá obvykle obtížnější.
5-Běžným doprovodem většiny typů částečných ekvivalentů je glosa, resp. metajazyková poznámka vymezující relevantní odstín či část významu a/nebo úzu, popř. funkce. Její rozložení v hesle, tj. místo uvedení závisí mj. příznačně na typu slovníku (srov. Kroman et al.), tedy na tom, zda jde o slovník aktivní nebo pasívní: zatímco u aktivního slovníku je glosa ap. vhodná, popř. nutná u ekvivalentu, její místo je naopak ve slovníku pasívním u lemmatu.
6-Obecně může slovník nabídnout pochopitelně pouze ekvivalenty ustálené, a tedy systémové, na úrovni lemmatu; někdy však existuje vhodný ekvivalent níže, na úrovni jen konkrétního tvaru (zvl. gramatického), jakkoliv někdy takový tvar, resp. kombinace forem nemusí rodilému mluvčímu jako ekvivalent připadat, srov. angl. I wonder a české zajímalo by mně, které je nepřenosné do jiné osoby ap. Slovník však nemůže nabízet ekvivalenty neustálené, resp. autorské či překladové, s nimiž se ad hoc může setkat pouze v překladu.
7-Podstata zjištění ekvivalence je obecně jako u každého jiného srovnávání v opření srovnávaných forem v obou jazycích o tertium comparationis; u dvoujazyčného slovníku tertium comparationis, které by ideálně mělo být vnější, zpravidla typicky splývá s formami výchozího jazyka.
Další poznámky k ekvivalenci.
Ekvivalence by tedy měla být především sémanticko funkční povahy a měla by být založena na aproximativní identitě úzu. Prakticky je třeba počítat alespoň s pěti typy ekvivalence (v dalším pro jednoduchost jen z hlediska čistě denotativního, kognitivního, viz však bod 4 výše):
(a) jednoznačná ekvivalence: situace, kdy jedna odpovídá jedné, a=a, která je řídká (viz 2.2, A);
(b) opis: chybí ekvivalent a je třeba proto podat funkční vysvětlení, stručné vytčení toho, čeho se ten který lexém týká (=obv. encyklopedická informace) (viz 2.2, D); např. švéd., nor. a dán. ombudsman do češtiny;
(c) částečná ekvivalence mnoha typů (viz 2.2, B): tvoří škálu přechodů mezi (a) a (b); lze tu z hlediska distribuce rozeznat aspoň 3 typy těchto relací:
c1) vztah širší a užší a naopak (vůči druhému jazyku); daný pojem se pak může rozdvojit, popř. v cílovém jazyku roztrojit ap., a jde pak o tzv. komplementární ekvivalenci, např. angl. cut a čes. stříhat, krájet, sekat, popř. čes. ržát a angl. neigh, whinny;
c2) obecné a specifické a naopak; např. čes. babička a švéd. farmor, mormor (babička z otcovy a matčiny strany), čes. prst a angl. finger, toe (prst u ruky a nohy),
c3) u rovnocenných pojmů může jít také jen o částečný průnik, kdy se výchozí lexém a ekvivalent překrývají jen zčásti; např. i pův. společný název pro "stožár" v hol. mast a angl. mast, kde však jde též, kromě velkého společného průniku, o přesah do významu "borovice" v holandštině a do významu "kolmý stožár jeřábu s fixním úhlem ramene" v angličtině.
Ekvivalence je ovšem často krajně komplikována aspekty kulturními, sociálními (včetně stylových) a pragmatickými (viz výše). V zásadě by však ekvivalent měl optimálně pochytit implicite maximum shodných potřebných informací sám o sobě, tj. bez glosy (tj. i syntakticko funkční paralelismus, stylovou obdobu aj.).
(d) ekvivalent vázaný na pevnou kombinaci lexémů, resp. tvarů, tj. na frazém, idiom; jde li o něj, není samozřejmě možné udávat ekvivalent jen pro dané slovo (např. dokořán, na holičkách), ale pro celé spojení. Obvyklé řešení je uvést zvlášť označenou formu, tvar tohoto hesla, za ním dvojtečku a pak dané spojení, srov. *holičky: nechat na holičkách ....
(e) ekvivalent funkčně neparalelní (případ částečné ekvivalence): např. české líbit se vůči angl. like ap. (odlišné subjekty, srov. I like it a líbí se mi to), nebo případ verbum (aktivní): verbum pasívní, slovo: věta aj.
Podle povahy hledaného ekvivalentu se evidují jeho kandidáti, a to zvl. na základě jejich iterativnosti a typičnosti, resp. vysokého stupně ekvivalence; základem tohoto postupu je identifikace, resp. kváziidentifikace výchozího lemmatu v určitém významu v dostatečném kontextu s některou formou v tomtéž kontextu a téže funkci v cílovém jazyce. Výhodným východiskem se tu stává možnost opřít se vhodným vyhledávacím programem o paralelní překladové korpusy obou jazyků (srov. mj. Calzolari-Zampolli, Picchi), a mít tak i možnost uvážit jeho nabídku základních, ale i netypických autorských ekvivalentů (které obsahuje každý autorský, individuální překlad). Po shromáždění kandidátů na ekvivalenty a jejich srovnání s jinými zdroji (zvl. u páru jazyků lexikograficky zpracovaných už dříve, popř. u páru, v němž je výchozí jazyk lexikograficky zpracován ve vztahu k jazyku, obv. velkému, který lexikograf dobře zná) je třeba ekvivalenty vybrat, zkorelovat a uspořádat do sledu, a to jak podle frekvence, tak míry zachycované ekvivalence (tj. řídké a úzké, úzce specifické ekvivalenty budou v daném sledu poslední).
3. Korpusová lexikografie
Nicméně poznatky korpusové lingvistiky a lexikografie mají nemenší význam pro dnešní zpracování slovníku než poznatky obecně a kontrastivně lingvistické. Základní pozitivní zkušenost ukazuje (Dickens, Picchi), že z paralelního korpusu lze získat až dvakrát více ekvivalentů, které do něj vložili zkušení překladatelé, než ze standardních slovníků. Introspekcí uživatele lze z nich jistě vybrat významnou část, především z hlediska ustálenosti, a obohatit stávající repertoár ekvivalentů ve slovnících tradičních (profesionální překladatel má v hlavě obvykle svůj vlastní repertoár ekvivalentů a do knihy se dívá málokdy, srov. Dickens). K negativní zkušenosti patří mj. to, že vzhledem k uznávané pravdě, že každý překlad jistým způsobem originál pokřivuje, nemusejí být nabízené ekvivalenty bez problémů. Dobrým lékem tu je však statistika a vysoká frekvence výskytu: ta obvykle pokřivené kandidáty ekvivalence vyloučí; to opět mluví pro potřebu co největších korpusů. Závažným problémem paralelních korpusů však zůstává mluvený jazyk. Vzhledem k prostému faktu, že skutečně mluvené texty se zpravidla nepřekládají, nebude paralelní korpus tento textový typ zpravidla mít.
Aligners ("zarovnávací programy"), obvykle založené stochasticky, vyhledají v obou paralelních textech hranice vět (včetně označení alternativ tam, kde počet vět si nekoresponduje) a k vybranému tvaru v jednom textu odhadnou v odpovídající větě kandidáta na ekvivalent. Kontrolou kontextu uživatel ověří správnost a opakovaným vyhledáním zjišťuje frekvenci a potvrzení, zda si nalezený vztah obou jazyků odpovídá i opakovaně. Vzhledem ke způsobu práce, založeném na prohlížení kontextu, je podstatné přitom to, že se tak zároveň nabízí i typické kolokace, informace o gramatickém a jiném užití apod., které lze zároveň pro tvorbu slovníku využít. Pokud je v počítači zároveň zapojený (v dalším okně) ke konzultaci tradiční slovník, lze porovnávat a korigovat své výsledky i vzhledem k tradiční lexikografii.
V posledních letech se oprávněně však množí na adresu tradiční lexikografie velmi kritické hlasy. P. Hanks z Oxford University Press (Hanks) už přímo ironicky a ostře říká "Lexikografové jsou mistři na neopodstatněná tvrzení" a vedle důrazné rady opírat se o korpus pak se znovu vrací k problematické praxi ostrého lišení významů, resp. ekvivalentů pro jediný lexém. Korpusové poznání ho a další vede ke střízlivosti a zdrženlivosti v tom smyslu, že ostré hranice mezi významy jsou, oproti jejich obrázku ve slovnících, velmi řídké, že většinou jde o kontinuum kombinatorických možností lexému, kde přechody mezi "významy" jsou povlovné. Zdá se tedy zřejmě výhodnější takovou praxi silně omezit a spíše se soustředit na hledání (proto)typického užití a významu a tedy i typických norem úzu. Je pochopitelné, že v jazyce existuje ovšem i užití netypické, kreativní apod., ale jak ho mapovat, by bylo téma na jinou diskuzi. Úzus a frekvence nám tedy ukazují přirozenou prioritu věcí.
4. Některé otázky a problémy
Na nedostatky slovníků se poukazovalo vždycky a přesto byli lidé rádi, že slovníky mají. Pojetí slovníku však bylo vždy otevřené a zlepšovalo se kontinuálně, s rostoucím poznáním i tlakem potřeb.
V dnešní situaci (srov. mj. Atkins) se poukazuje především na několik věcí. Ideálně by měl slovník bilingvnímu uživateli nabízet i monolingvní funkce (tj. informaci o definici, úzu aj. už ve vstupním jazyce), kterou by tak mohl porovnat s odlišnou situací u ekvivalentu. Do budoucnosti se uvažuje o možnosti jednak vnitřního propojení elektronického slovníku hypertextovým způsobem, který odstraní omezení jen na abecední hledání a také omezení rozsahu, které vždy u knižních vydání bylo limitujícím faktorem. Jednak však se nabízí možnost propojit takový slovník přímo s korpusem, ve kterém by si uživatel hledal, resp. dohledával podle své potřeby informace další. Znovu a znovu se však vrací důraz kladený na potřebu lepšího pokrytí kolokability, kolokací a propojení informací, které slovník nabízí, s reálnými kontexty užití. S tím souvisí novější důraz kladený na důležitost konkrétních tvarů, nalezitelných zase jen studiem korpusu: už dlouho neplatí, že veškerý význam se váže výlučně jen k lemmatu a že naopak některé tvary mají speciální významy a funkce, které zobecnit pro celé lemma je nesmyslné a chybné.
Systematická analýza korpusu ovšem také odstraní, resp. omezí další klasické manko slovníků: děravost, neúplnost jejich informace, která odrážela nedokonalost excerpce. Systematicky zapojovaný (a často formalizovaný) metajazyk musí nenáhodně plnit především dvě funkce: ozřejmovat rozdíly mezi oběma jazyky a hlavně vést uživatele spolehlivě při volbě a užití správného ekvivalentu, pokud se jich nabízí více a/nebo se funkčně liší od lexému výchozího jazyka. Studium korpusu však často přímo nabízí i odpově_ na problémy pragmatické a diskurzní. Pragmatika zvláště řady formulí, specifických pro daný jazyk, je slovo za slovem nepřenosná do druhého jazyka, mění se podmínky užití (např. modalita), je reakcí přímo na určitý podnět, mívá zvláštní intonaci či důraz apod. (není důvodu, proč v takových případech např. neznačit do slovníku i intonaci).
Zcela zvláštním a většinou nedostatečně řešeným problémem zůstává, kromě dalších věcí, otázka termínů, především jejich výběr. Na první pohled se zdá, že by u obecného slovníku mohla rozhodnout o zařazení termínu jeho frekvence, ale takové korpusy, které by musely být obrovské, dosud neexistují v žádném jazyce.
5. Desatero slovníkářovo
(1) Slovník do cílového jazyka má dělat kvalifikovaný rodilý mluvčí.
(2) Žádný slovník není úplný, jde vždy o výběr. Ten však nesmí být ledajaký.
(3) Slovník má být v konečné podobě na jiných zdrojích informace nezávislý, i když se implicite a jako předchozí znalost obvykle předpokládají (ideální je vycházet z existujících popisů obou jazyků).
(4) Nepřeložitelnost neexistuje, existuje jen omezená znalost slovníkáře: problémy se neházejí pod stůl, ale řeší dobrým příkladem a kontextem, když je nelze zobecnit jako význam.
(5) Žádný slovník není bez chyb. Slovník je umění možného.
(6) Slovu neodpovídá slovo, ale heslu heslo s celým aparátem a vztahy.
(7) Ekvivalent je především sémanticko funkční, založený na aproximativní identitě úzu i systémové příslušnosti toho, co se srovnává v obou jazycích. Skutečný úzus lze zjistit jen studiem typické kolokability.
(8) Heslo a jeho informace má vyhovět potřebě uživatele a povaze sledovaného jazyka, a proto může být svou povahou jak nadslovní, tak podslovní. Je v průsečíku relevantních vztahů paradigmatických a syntagmatických.
(9) Slovník je přítel, a ne učeně odpudivý povýšenec či podvodník: přes velkou sumu vloženého umu a znalostí musí vycházet vstříc, a ne mást či jen rozmarně napovídat, nakusovat.
(10) Lepší jeden slovník než deset gramatik, je li dobře udělán.
Bibliografie:
-AL, B.P.F., Dictionnaire bilingue et ordinateur. In Hausmann F.J. et al., Vol. 3, 1991, 2804-2813
-AL-KASIMI A. M., Linguistics and Bilingual Dictionaries. Leiden 1983
-ATKINS B.T.S., Bilingual Dictionaries: Past, Present and Future, In Euralex 96 Proceedings, M. Gellerstam, J. Järborg et al., eds., Göteborg 1996, 515-545
-BERKOV V. P., Slovo v dvujazyčnom slovare. Akademija Nauk ESSR. Tallin 1977
-CALZOLARI N., ZAMPOLLI A., From Monolingual to Bilingual Automated Lexicons: Is There a Continuum ? Lexicographica 4, 1988, 130-144
-COP M., Collocations in the Bilingual Dictionary. In Hausmann F.J. et al., Vol. 3, 1991, 2775-2778
-ČERMÁK F., HRONEK J., MACHAČ J., eds., Slovník české frazeologie a idiomatiky. Přirovnání 1983, Výrazy neslovesné 1988, Výrazy slovesné. A-P, R-Ž. 1994 Academia Praha.
-ČERMÁK F. et al., Česko-laoský slovník I a II. UK Praha 1989 (vedoucí kolektivu, koncepce a redakce spolu s Virasac Somphongem, Phanthakone Champasith, Phimphone Douangsavanh), 783s.
-ČERMÁK F., Nizozemský lexikografický projekt století, SaS 48, 1986, 227-231
-ČERMÁK F., Zpracování česko-cizojazyčného slovníku. Metodické listy ÚJOP 4, 1989, 1-16
-ČERMÁK F., Králík J., Pala K., Počítačová lexikografie (Počítačový fond češtiny). SaS 53 1992, 41-48
-ČERMÁK F, BLATNÁ R., eds., Manuál lexikografie. H H Praha 1995 (spoluautor, spolueditor), 283 s.
-ČERMÁK F., Komputační lexikografie. In: Manuál lexikografie, eds. F. Čermák, R. Blatná. H H Praha 1995, 50-71
-ČERMÁK F., Paradigmatika a syntagmatika slovníku: možnosti a výhledy. In: Manuál lexikografie, eds. F. Čermák, R. Blatná. H H Praha 1995, 90-115
-ČERMÁK F., Frazeografie. In: Manuál lexikografie, eds. F. Čermák, R. Blatná. H H Praha 1995, 116-136
-ČERMÁK F., Překladová lexikografie. In: Manuál lexikografie, eds. F. Čermák, R. Blatná. H H Praha 1995, 230-248
-ČERMÁK F., HRNČÍŘOVÁ Z., Nizozemsko-český slovník. Nederlands-Tsjechisch Woordenboek. Leda Praha. 2. rozšíř. vyd. 1039 s.
-ČERMÁK F., Czech National Corpus: A Case in Many Contexts. International Journal of Corpus Linguistics Vol. 2 (2) 1997, 181-197.
-ČERMÁK F., Idiomatics. In The Prague School of Structural and Functional Linguistics, ed. P. A. Luelsdorff, J. Benjamins Amsterdam/Philadelphia 185-195 1994. Edice Linguistic & Literary Studies in Eastern Europe (LLSEE), Vol. 41.
-ČERMÁK F., Linguistic Units and Texts Entities: Theory and Practice, In Actes Euralex'98 Proceedings, eds. T. Fontenelle, P. Hiligsmann et al., Université de Li‚ge, Depart. d'anglais et néerlandais Vol. I-II, 1988, 281-290.
-DICKENS A., SALKIE R., Comparing Bilingual Dictionaries with a Parallel Corpus, In Euralex 96 Proceedings, M. Gellerstam, J. Järborg et al., eds., Göteborg 1996, 551-560
-DUVAL A., L' équivalence dans le dictionnaire bilingue. In Hausmann F.J. et al., Vol. 3, 1991, 2817-2824
-FILIPEC J., Ekvivalenty a synonyma v slovní zásobě. In Slovo a slovník, Bratislava 1973, 131-144
-FILIPEC J., Problematika konfrontace v lexikální zásobě, SaS 46, 1985, 201-214
-GREFENSTETTE G., HEID U. et al., The DECIDE Project: Multilingual Collocation Extraction, In Euralex 96 Proceedings, M. Gellerstam, J. Järborg et al., eds., Göteborg 1996, 93-108
-HANKS P., Enthusiasm and Condecension, In Actes EURALEX 98 Proceedings, Fontenelle Th. et al., eds., Université de Liege 1998, 151-166
-HARTMANN R.R.K., ed., LEXeter '83 Proceedings. Niemeyer Tübingen 1984
-HARTMANN R.R.K., Contrastive Linguistics and Bilingual Lexicography. In Hausmann F.J. et al., Vol. 3, 1991, 2854-2859
-HARTMANN R.R.K., G. JAMES, Dictionary of Lexicography. Routledge London New York 1998
-HAUSMANN F.J.
| London, Katta London - Buyuk Britaniya poytaxti, mamlakatning muhim siyosiy, iqtisodiy va madaniy markazi. Temza daryosining quyi oqimida, Shim. dengizdan 64 km masofada, London havzasi deb ataluvchi tekislikning markaziy qismida joylashgan. |
, Grundprobleme des zweisprachigen Wörterbuchs. In Hyldgaard-Jensen K., Zettersten A., eds., Symposium on Lexicography III. Proceedings of of the Third International Symposium on Lexicography, May 14-16, 1986 at the University of Copenhagen. Niemeyer Tübingen 1988, 137-154
-HAUSMANN F.J., WERNER R.O., Spezifische Bauteile und Strukturen zweisprachiger Wörterbücher: eine Übersicht. In Hausmann F.J. et al., Vol. 3, 1991, 2729-2769
-JACOBSEN J.R., MANLEY J., PEDERSEN F.H., Examples in the Bilingual Dictionary. In Hausmann F.J. et al., Vol. 3, 1991, 2782-2789
-JEDLIČKA A., Tschechische Lexikographie. In Hausmann F.J. et al., Vol. 2, 1990
-KROMAN H.-P., RIIBER T., ROSBACH P., Grammatical Constructions in the Bilingual Dictionary. In Hausmann F.J. et al., Vol. 3, 1991, 2770-2775
-KROMAN H.-P., RIIBER T., ROSBACH P., Principles of Bilingual Lexicography. In Hausmann F.J. et al., Vol. 3, 1991, 2711-2728
-LINDROOS H., ČERMÁK F., Česko-finský a finsko-český slovník na cesty. SPN Praha 1986, 271 a 300s.
-PICCHI E., PETERS C., MARINAI E., The Pisa Lexicographic Workstation: The bilingual components, In Euralex 92 Proceedings, H. Tommola et al., eds., Tampere 1992, 277-286
-ROBERTS R.P., MONTGOMERY C., The Use of Corpora in Bilingual Lexicography, In Euralex 96 Proceedings, M. Gellerstam, J. Järborg et al., eds., Göteborg 1996, 457-464
-SNELL-HORNBY M., The bilingual dictionary - help or hindrance? In Hartmann, ed., 1984, 274-281
-STERKENBURG P. van, MARTIN W., AL B., A New van Dale Project: Bilingual Dictionaries on one and the same monolingual basis. In Goetschalcx J., Rolling L., eds., Lexicography in the Electronic Age,
|