st-pti: maszynowe opanowywanie terminologii -- sprawozdanie z sesji Sekcji Terminologicznej PTI z 24.10.2013
Subject:
maszynowe opanowywanie terminologii -- sprawozdanie z sesji Sekcji Terminologicznej PTI z 24.10.2013
From:
"ady,dlaPTI" ####@####.####
Date:
5 Nov 2013 11:14:19 +0000
Message-Id:
Szanowne K&K,
uprzejmie donoszę, iż w Warszawie 24. października br. w uroczej atmosferze
kawiarni "Cafe Zamek" w Zamku Królewskim w Warszawie
w ramach prac Sekcji Terminologicznej PTI odbyło się spotkanie z Michałem
Tyszkowskim z firmy Centrum Lokalizacji C&M z Wrocławia.
Omówił on stosowane przez siebie techniki maszynowego opracowania i kontroli
terminologii, w tym:
* ekstrakcji glosariusza terminologicznego (półautomatycznego wyodrębniania
słów i zwrotów kluczowych dla zrozumienia tekstu);
* konsultacji z autorem tekstu (ewentualnie uzgodnienia z jego wewnętrznymi
słownikami i regułami);
* udostępniania glosariusza tłumaczom z jednoczesnym wyjaśnianiem
wątpliwości;
* oficjalnego zatwierdzania glosariusza;
* kontroli przeprowadzonych tłumaczeń na podstawie zatwierdzonego
glosariusza.
Opracowane przez C&M oprogramowanie do generowania terminologii każdy może
bezpłatnie przetestować w Internecie
w portalu
http://extract.cmlocalization.eu/
(w wersji demo można jednocześnie analizować jeden plik, bez możliwości
edycji tzw. "stop words" )
Akceptowane są wszystkie formaty plików dwujęzycznych oparte na standardzie
XLIFF i TMX, także TTX i SDLXLIFF oraz jedno- i dwujęzyczne pliki DOCX.
Można także analizować jednojęzyczne dokumenty tekstowe (TXT) oraz strony
internetowe (HTML). Lista tzw. "stop words", czyli wyrazów nie branych pod
uwagę jako terminy, jest edytowalna i powiązana z konkretnym użytkownikiem.
Program obsługuje obecnie języki angielski, francuski, hiszpański, niemiecki
oraz polski.
Michał Tyszkowski jest absolwentem biologii na Uniwersytecie Wrocławskim; ma
tytuł naukowy doktora nauk przyrodniczych. Od roku 1997 zajmuje się
lokalizacją oprogramowania i tłumaczeniami technicznymi, początkowo dla
firmy IBM, później rozwijając własną działalność. Obecnie jest prezesem
firmy Centrum Lokalizacji C&M. Od około 10 lat intensywnie zajmuje się
komputerowym wspomaganiem tłumaczeń. Jest twórcą między innymi autorskiego
systemu obsługi terminologii oraz kontroli jakości tłumaczeń. Obecnie
prowadzi prace nad poprawą jakości tłumaczeń maszynowych poprzez tworzenie
mechanizmów hybrydowych wzbogacających klasyczne systemy SMT. W ramach prac
w firmie C&M opracował między innymi system obsługi terminologii KeyStone,
narzędzie internetowe do ekstrakcji terminologii oraz uniwersalny glosariusz
KeyTerm. Jest także współtwórcą systemu maszynowego tłumaczenia
rozszerzającego funkcje programu Moses.
Firma, której szefuje, na co dzień zajmuje się wielojęzycznymi tłumaczeniami
tekstów technicznych opierając się na glosariuszach. Dopracowała się bazy
terminologii
z takich dziedzin jak medycyna (ok. 12 tys. terminów), IT (ok. 4 tys
terminów), automatyka (ok. 2 tys.) i inne (fotografia, telekomunikacja,
energetyka, chemia, ochrona środowiska).
Zajmuje się również lokalizacjami oprogramowania.