PRINCIPLE SDURDD Croatian-English Parallel Corpus in the legal domain

View resource name in all available languages

PRINCIPLE SDURDD Hrvatsko-engleski paralelni korpus u području pravosuđa

PRINCIPLE SDURDD Croatian-English Parallel Corpus in the legal domain contains 204 files (102 in Croatian and 102 in English) in the eJustice domain, totaling 261,046 translation units. Manual text extraction from PDF documents has been performed, followed by a manual check. Documents were cleaned, and manual content check was performed on a sample. Automatic TU alignment was performed, followed by manual check of alignment on a sample. It is open and freely available under the PSI licence.

View resource description in all available languages

PRINCIPLE SDURDD Hrvatsko-engleski paralelni korpus u području pravosuđa sadrži 204 dokumenta (102 na hrvatskom i 102 na engleskom), sveukupno 261.046 prijevodnih jedinica. Izvršena je ručna ekstrakcija teksta iz PDF dokumenata koji su zatim ručno pregledani. Dokumenti su očišćeni, a na uzorku je provedena ručna provjera sadržaja. Sravnjivanje prijevodnih jedinica napravljeno je automatski te je naknadno uzorak ručno pregledan. Otvoren je i slobodno dostupan na temelju informacija javnog sektora.

DSI Relevance: eJustice