Latvian and English monolingual corpus from Latvian web resources

8 Last view: 2023-08-25

1 Last update: 2023-04-06

1 Last download: 2024-05-12

Latvian and English monolingual corpus from Latvian web resources

Attribution details: "Latvian and English monolingual corpus from Latvian web resources" compiled from corpora listed in ReadMe file by Consortium of National Language Technology Platform (NLTP) Project (Action number: 2018-EU-IA-0082). Published under CC-BY-SA-4.0 license.'}

https://elrc-share.eu/repository/browse/icelandic-and-english-monolingual-corpus-from-icelandic-web-resources/8dbc3e2ed38111eda54c00155d026706d250c51b34224f0e99091edfa01e0044/

Monolingual corpus Latvian web resources collected during NLTP project.
Resource size:
Latvian : 153 667 sentences, 2 106 839 words
English: 80 403 sentences, 1 080 017 words

Distribution

Availability: Available

Licences

CC-BY-SA-4.0

Conditions: Attribution, Share Alike

Distribution Details

Attribution Details: "Latvian and English monolingual corpus from Latvian web resources" compiled from corpora listed in ReadMe file by Consortium of National Language Technology Platform (NLTP) Project (Action number: 2018-EU-IA-0082). Published under CC-BY-SA-4.0 license.'}

Contact Person

Roberts Rozis

text

Monolingual text corpusLanguages

English (en)

Linguality

Linguality type: Monolingual

Text Format

Plain Text

Size

1,080,017 Words

80,403 Sentences

Character encoding

UTF-8

Domains

SOCIAL QUESTIONS Health (Eurovoc 2841)

Monolingual text corpusLanguages

Latvian (lv)

Linguality

Linguality type: Monolingual

Text Format

Plain Text

Size

2,106,839 Words

153,667 Sentences

Character encoding

UTF-8

Domains

SOCIAL QUESTIONS Health (Eurovoc 2841)

Resource Creation

Funding Project

National Language Technology Platform (NLTP - 2020-EU-IA-0084)

Funding Type: Eu Funds

Funding Country: European Union (EU)

Metadata

Created: 04/04/2023

Last Updated: 04/04/2023

Metadata Language: English (en)

Metadata Creator

Roberts Rozis

People who looked at this resource also viewed the following:

Resources from the same project

Latvian and English monolingual corpus from Latvian web resources

https://elrc-share.eu/repository/browse/icelandic-and-english-monolingual-corpus-from-icelandic-web-resources/8dbc3e2ed38111eda54c00155d026706d250c51b34224f0e99091edfa01e0044/

Monolingual corpus Latvian web resources collected during NLTP project.Resource size: Latvian : 153 667 sentences, 2 106 839 wordsEnglish: 80 403 sentences, 1 080 017 words

Monolingual corpus Latvian web resources collected during NLTP project.
Resource size:
Latvian : 153 667 sentences, 2 106 839 words
English: 80 403 sentences, 1 080 017 words