st-pti: Thread: maszynowe opanowywanie terminologii -- sprawozdanie z sesji Sekcji Terminologicznej PTI z 24.10.2013


[<<] [<] Page 1 of 1 [>] [>>]
Subject: maszynowe opanowywanie terminologii -- sprawozdanie z sesji Sekcji Terminologicznej PTI z 24.10.2013
From: "ady,dlaPTI" ####@####.####
Date: 5 Nov 2013 11:14:19 +0000
Message-Id:

Szanowne K&K,

 

uprzejmie donoszę, iż w Warszawie 24. października br. w uroczej atmosferze
kawiarni "Cafe Zamek" w Zamku Królewskim w Warszawie 

w ramach prac Sekcji Terminologicznej PTI odbyło się spotkanie z Michałem
Tyszkowskim z firmy Centrum Lokalizacji C&M z Wrocławia. 

Omówił on stosowane przez siebie techniki maszynowego opracowania i kontroli
terminologii, w tym:

 

* ekstrakcji glosariusza terminologicznego (półautomatycznego wyodrębniania
słów i zwrotów kluczowych dla zrozumienia tekstu);

* konsultacji z autorem tekstu (ewentualnie uzgodnienia z jego wewnętrznymi
słownikami i regułami);

* udostępniania glosariusza tłumaczom z jednoczesnym wyjaśnianiem
wątpliwości;

* oficjalnego zatwierdzania glosariusza;

* kontroli przeprowadzonych tłumaczeń na podstawie zatwierdzonego
glosariusza. 

 

Opracowane przez C&M oprogramowanie do generowania terminologii każdy może
bezpłatnie przetestować w Internecie 

w portalu 

 

http://extract.cmlocalization.eu/

 

(w wersji demo można jednocześnie analizować jeden plik, bez możliwości
edycji tzw. "stop words" )

 

Akceptowane są wszystkie formaty plików dwujęzycznych oparte na standardzie
XLIFF i TMX, także TTX i SDLXLIFF oraz jedno- i dwujęzyczne pliki DOCX.

Można także analizować jednojęzyczne dokumenty tekstowe (TXT) oraz strony
internetowe (HTML). Lista tzw. "stop words", czyli wyrazów nie branych pod

uwagę jako terminy, jest edytowalna i powiązana z konkretnym użytkownikiem.
Program obsługuje obecnie języki angielski, francuski, hiszpański, niemiecki

oraz polski.

 

 

Michał Tyszkowski jest absolwentem biologii na Uniwersytecie Wrocławskim; ma
tytuł naukowy doktora nauk przyrodniczych. Od roku 1997 zajmuje się

lokalizacją oprogramowania i tłumaczeniami technicznymi, początkowo dla
firmy IBM, później rozwijając własną działalność. Obecnie jest prezesem

firmy Centrum Lokalizacji C&M. Od około 10 lat intensywnie zajmuje się
komputerowym wspomaganiem tłumaczeń. Jest twórcą między innymi autorskiego

systemu obsługi terminologii oraz kontroli jakości tłumaczeń. Obecnie
prowadzi prace nad poprawą jakości tłumaczeń maszynowych poprzez tworzenie

mechanizmów hybrydowych wzbogacających klasyczne systemy SMT. W ramach prac
w firmie C&M opracował między innymi system obsługi terminologii KeyStone,

narzędzie internetowe do ekstrakcji terminologii oraz uniwersalny glosariusz
KeyTerm. Jest także współtwórcą systemu maszynowego tłumaczenia

rozszerzającego funkcje programu Moses.

 

Firma, której szefuje, na co dzień zajmuje się wielojęzycznymi tłumaczeniami
tekstów technicznych opierając się na glosariuszach. Dopracowała się bazy
terminologii 

z takich dziedzin jak medycyna (ok. 12 tys. terminów), IT (ok. 4 tys
terminów), automatyka (ok. 2 tys.) i inne (fotografia, telekomunikacja,
energetyka, chemia, ochrona środowiska). 

Zajmuje się również lokalizacjami oprogramowania.

 

[<<] [<] Page 1 of 1 [>] [>>]


  ©The Linux Documentation Project, 2014. Listserver maintained by dr Serge Victor on ibiblio.org servers. See current spam statz.