• Paralelní korpus
  • Materiálová báze slovníku




    Download 72.3 Kb.
    bet5/19
    Sana07.04.2017
    Hajmi72.3 Kb.
    #3477
    1   2   3   4   5   6   7   8   9   ...   19
    1.3 Materiálová báze slovníku
    Tradiční dobrá lexikografie pochopitelně neopisuje ze slovníků starších, ale opírá se o vlastní překladovou excerpci, často i dobrých překladatelů, obecných i odborných. Vytvořit spolehlivou kartotéku excerpt však trvá dlouhá léta, a proto se dnes hledají cesty kratší a řešení rychlejší, totiž v paralelních korpusech. Paralelní korpus je rozsáhlý soubor identických textů v obou jazycích (překladů, někdy i z třetího jazyka), který slouží v zásadě stejně jako korpus jednojazyčný: nalezením slova ve výchozím jazyce v jeho kontextu/kontextech a počítačovým vyhledáním odpovídajícího místa a ekvivalentu v cílovém korpusu, opět v kontextu k posouzení vhodnosti, se vlastně ve zkratce opakuje tradiční cesta excerpce. Výhodou tohoto přístupu, kdy se nemusí texty pracně shánět a excerpční lísteček vypisovat rukou a hledat v kartotéce, je obrovská rychlost nalezení, kontrola v opěrném širokém kontextu i statistická nápověda v podobě vyhodnocení typičnosti nalezeného ekvivalentu z hlediska frekvence jeho opakování v celém korpusu. Je zřejmé, že čím je paralelní korpus větší, tím jsou informace v něm objektivnější, širší i spolehlivější, tj. nenáhodnější. Pro překladový slovník jednoho směru je dnes tedy třeba mít ideálně k dispozici
    (1) kartotéku, resp. databázi s množství překladových excerpt (zvl. z oblastí terminologických a některých dalších) a

    (2) paralelní komputerové korpusy obou jazyků s příslušným vyhledávacím softwarem (aligner).


    Nedobrou tradicí překladových slovníků bývá, že svou materiálovou základnu často mechanicky přebírají ze slovníků výkladových, která nejenže není východiskem vždy nejlepším, ale může slovníkáře vést i k omylům (např. mechanickým přenášením členění polysémie z výchozího jazyka do cílového).
    Stanovením cíle, funkce, povahy a typu slovníku a jeho materiálové báze je dán soubor východisek k vlastní tvorbě slovníku, která by nikdy neměla být pouhou kompilací z předchozích publikací. Zároveň je tak do značné míry předurčena i metodologie vlastní tvorby.


    Katalog: doc

    Download 72.3 Kb.
    1   2   3   4   5   6   7   8   9   ...   19




    Download 72.3 Kb.