Gravatar tilde / Valodas resursi / Paralēlais korpuss Tilde MODEL – fold.lv

Lai veicinātu valodas resursu trūkumu kā šķērsli valodas tehnoloģiju attīstībā, sabiedrība Tilde ir identificējusi dizaina un mākslas rakstu portālu fold.lv kā avotu paralēlam angļu-latviešu valodu tekstu korpusam.

Projekta ODINE Open Data for Europe ietvaros no šī portāla tekstiem ir izveidots paralēls korpuss. Projekta Projekta ODINE Open Data for Europe mērķis ir atbalstīt nākamās paaudzes digitālos uzņēmumus un paātrinātu jaunu produktu un pakalpojumu radīšanu.

Ir panākta vienošanās ar portālu fold.lv par portāla satura izmantošanu mašīntulkošanas korpusa izveidei un tā licencēšanu ar radošo kopienu licenci ar atsaukšanos CC-BY. Piekrītot šīs licences nosacījumiem, šis korpuss ir pieejams ikvienam nozares lietotājam lejupielādei korpusu standarta TMX formātā.

Portāls fold.lv ir līderis un piemērs, kā publiskā sektora finansēts saturs var tikt atvērts sabiedrībai un padarīts pieejams pētniekiem un jaunu tehnoloģiju izstrādātājiem.

Korpusā ir 10 692 paralēlu angļu-latviešu valodas segmentu.

Avota URL: https://tilde-model.s3-eu-west-1.amazonaws.com/Tilde_MODEL_Corpus.html#tilde-model-fold.lv

No data imported.
No dataset columns have been created. Upload CSV source file at first.

Komentāri

× Lūdzu pieslēdzieties, lai komentētu

Pēdējās aktivitātes

Jaunākie komentāri