Ondřej Bojar
|
|
|
- Bertram Hancock
- 10 years ago
- Views:
Transcription
1 Frázový statistický překlad z angličtiny do češtiny Ondřej Bojar [email protected] 9. říjen, 2006
2 Osnova Frázový statistický překlad krok po kroku Frázový překlad Hledání nejlepší hypotézy (beam search decoding) Ladění vah (minimum error rate training) Frázový statistický překlad o více faktorech Experimenty s překladem do češtiny Malý rozbor chyb Závěr O workshopu 1 Anglické části pocházejí z prezentací Philippa Koehna.
3 Translation Task: translate this sentence from German into English 2 er geht ja nicht nach hause
4 2 Translation step 1 Task: translate this sentence from German into English er geht ja nicht nach hause er he Pick phrase in input, translate
5 2 Translation step 2 Task: translate this sentence from German into English er geht ja nicht nach hause er ja nicht he does not Pick phrase in input, translate it is allowed to pick words out of sequence (reordering) phrases may have multiple words: many-to-many translation
6 2 Translation step 3 Task: translate this sentence from German into English er geht ja nicht nach hause er geht ja nicht he does not go Pick phrase in input, translate
7 2 Translation step 4 Task: translate this sentence from German into English er geht ja nicht nach hause er geht ja nicht nach hause he does not go home Pick phrase in input, translate
8 Translation options 3 er geht ja nicht nach hause he it, it, he it is he will be it goes he goes is are goes go is are is after all does yes is, of course not is not are not is not a not is not does not do not not do not does not is not to following not after not to after to according to in home under house return home do not house home chamber at home Many translation options to choose from in Europarl phrase table: 2727 matching phrase pairs for this sentence by pruning to the top 20 per phrase, 202 translation options remain
9 Translation options 3 er geht ja nicht nach hause he it, it, he it is he will be it goes he goes is are goes go is are is after all does yes is, of course not is not are not is not a not is not does not do not not do not does not is not to following not after not to after to according to in home under house return home do not The machine translation decoder does not know the right answer Search problem solved by heuristic beam search house home chamber at home
10 Decoding process: precompute translation options er geht ja nicht nach hause 4
11 Decoding process: start with initial hypothesis er geht ja nicht nach hause 4
12 Decoding process: hypothesis expansion er geht ja nicht nach hause 4 are
13 Decoding process: hypothesis expansion er geht ja nicht nach hause 4 he are it
14 Decoding process: hypothesis expansion er geht ja nicht nach hause 4 yes he goes home are does not go home it to
15 Decoding process: find best path er geht ja nicht nach hause 4 yes he goes home are does not go home it to
16 Complexity of search 5 Search space is exponential with number of input words Pruning required organize hypotheses in stacks each stack contains all hypotheses with the same number of input words translated only the top n hypothesis are kept in a stack (Moses default: 200) only hypothesis worse by factor α are kept in the stack (default: 0.03) when comparing hypotheses, future cost has to be considered heuristic beam search is polynomial with sentence length Typically, a reordering limit is used (maximum movement) search is linear with sentence length
17 Knowledge sources Many different knowledge sources useful language model reordering (distortion) model phrase translation model word translation model word count phrase count drop word feature phrase pair frequency additional language models additional features 6
18 7 Set feature weights Contribution of components p i determined by weight λ i Methods manual setting of weights: try a few, take best automate this process Learn weights set aside a development corpus set the weights, so that optimal translation performance on this development corpus is achieved requires automatic scoring method (e.g., BLEU)
19 Learning task Task: find weights, so that feature vector of the correct translations ranked first TRANSLATION LM TM WP SER 1 Mary not give slap witch green Mary not slap the witch green Mary not give slap of the green witch Mary not give of green witch Mary did not slap the witch green Mary did not slap green witch Mary not slap of the witch green Mary did not give slap of witch green Mary did not give slap of the green witch Mary did slap the witch green Mary did not slap the green witch Mary did slap witch green Mary did slap the green witch Mary did not slap the of green witch Mary did not give slap the witch green rank translation feature vector
20 Learn feature weights 9 generate n-best list Model change feature weights score translations find feature weights that move up good translations
21 Osnova 10 Frázový statistický překlad krok po kroku Frázový statistický překlad o více faktorech Motivace: morfologie Krok za krokem Další nápady na využití více faktorů Experimenty s překladem do češtiny Malý rozbor chyb Závěr O workshopu
22 10 Motivace pro víc faktorů: zlepšit tvarosloví Statistický překlad do morfologicky bohatých jazyků funguje hůř než opačně. Viz např. (Koehn, 2005). Motivace pro překlad angličtina čeština: Běžné BLEU 25% BLEU bez ohledu na slovní tvary 1 33% Dokonalým tvarováním slov by bylo možné zlepšit skóre o 8 bodů. 1 BLEU lematizovaného výstupu proti lematizovaným referencím.
23 Factored translation models Factored represention of words surface surface lemma lemma part of speech part of speech morphology morphology word class word class Benefits generalization, e.g. by translating lemmas, not surface forms richer model, e.g. using syntax for reordering, language modeling 11
24 12 Translation process: example Input: Häuser (Häuser, Haus, NNS) 1. Translation step: lemma lemma (?, house,?), (?, home,?) 2. Generation step: lemma part-of-speech (?, house, NN), (?, house, NNS), (?, home, NN), (?, homes, NNS) 3. Translation step: part-of-speech part-of-speech (?, house, NN), (?, house, NNS), (?, home, NN), (?, homes, NNS) 4. Generation step: lemma, part-of-speech surface (houses, house, NNS), (homes, home, NNS) Pořadí překladových kroků je pevně určeno konfigurací.
25 Another idea: Subject-verb agreement Lexical n-gram language model would prefer the paintings of the old man is beautiful old man is is a better trigram than old man are 13 Correct translation the paintings of the old man are beautiful - SBJ-plural V-plural - Special tag that tracks count of subject and verb p(-,sbj-plural,-,-,-,-,v-plural,-) > p(-,sbj-plural,-,-,-,-,v-singular,-) skip language model: p(sbj-plural,v-plural) > p(sbj-plural,v-singular)
26 Osnova 14 Frázový statistický překlad krok po kroku Frázový statistický překlad o více faktorech Experimenty s překladem do češtiny Scénáře překladu Jemnost morfologie Více dat? Malý rozbor chyb Závěr O workshopu
27 Testované scénáře překladu 14 Pouze překlad (P) Angličtina Čeština forma forma +LM morfologie lemma morfologie Překlad+kontrola (P+K) Angličtina Čeština forma forma +LM morfologie lemma morfologie +LM 2*překlad+kontrola (P+P+K) Angličtina Čeština forma forma +LM morfologie lemma morfologie +LM 2*překlad+generování (P+P+G) Angličtina Čeština forma forma +LM morfologie lemma +LM morfologie +LM
28 15 Výsledky scénářů Dev (std) Dev (opt) Test (opt) Baseline: Pouze překlad (P) *překlad+generování (P+P+G) *překlad+kontrola (P+P+K) Překlad+kontrola (P+K) Přidání faktorů (a jazykových modelů) pro morfologii vždy pomohlo. Čím složitější scénář, tím horší výsledek. Důvodem jsou zřejmě chyby v hledání (search errors): víc faktorů větší prostor hypotéz (možná stejným povrchem) hloubka zásobníku nemusí stačit
29 Míra detailu v reprezentaci morfologie (P+K) 16 Tagset Typů viděno Popis plné zn Plná morfologická značka, 15 pozic, teoreticky 4000 různých značek. POS 173 Slovní druh a poddruh, u {N,A,P,R} navíc pád. CNG Jako POS, ale {N,A,P,R} odlišují pád, číslo a rod. CNG Pád, číslo a rod odlišen u {N,A,P,R,C,V}, lemma interpunkce přidáno ke značce. CNG Jména a číslovky vyjadřují pád, číslo a rod, zvýrazněno zvratné se/si. Slovesa vyjadřují číslo, rod, čas a vid, zvýrazněno být. Předložky vyjadřují pád i lemma, lemma přidáno ke značce {Z,T,I}, tvar čísel u C=.
30 Výsledky P+K s různě jemnou morfologíı 17 Dev (std) Dev (opt) Test (opt) Baseline: P (jediný faktor) P+K, CNG P+K, POS P+K, plné značky P+K, CNG P+K, CNG Není chybou přidat detailní morfologii. Lépe však funguje specifická sada značek opírající se o znalost jazyka i morf. systému.
31 18 Více dat ve scénáři P+K P+K CNG03 mix m + mix v m P+K plné značky m m+ v P mix m v m=malá data, 20k vět v doméně m + =malá data, 20k vět v doméně, ale navíc oddělené jazykové modely (840k vět mimo doménu) v=velká data, 20k vět v doméně a 840k vět mimo ni, oddělené jazykové modely vět mix=velká data, 20k vět v doméně a 840k vět mimo, smíšeno do společného jazykového modelu
32 19 Osnova Frázový statistický překlad krok po kroku Frázový statistický překlad o více faktorech Experimenty s překladem do češtiny Malý rozbor chyb Závěr O workshopu
33 Dosáhli jsme cíle zlepšit morfologii? 19 Na malých datech dosaženo významného zlepšení: English Czech: 20k vět, BLEU zvýšeno z 25.82% na 27.62% nebo až na 28.12% při použití dodatečných dat. Stále nedosahujeme úrovně lematizovaného BLEU (35%). Lokální shoda je již celkem dobrá: Mikrostudie: shoda přídavného a podstatného jména 74% adjektiv ve shodě, 2% v neshodě, (v dalších případech chybělo subst. ap.) Kde tedy zůstávají chyby v morfologii?
34 Mikrostudie chyb v překladu angličtina čeština 20 Mikrostudie na nejlepším dosaženém výstupu (BLEU 28,12%), intuitivní metrika: studováno 15 vět, z celk. počtu 77 dvojic sloveso-slovesné doplnění ve vstupním textu: překlad... zachoval význam... nebyl srozumitelný... úplně chyběl slovesa 43% 14% 21% doplnění 79% 12% 6% Navíc z případů, kdy sloveso i doplnění byly přeloženy správně, mělo 44% negramatickou nebo nesprávnou vazbu.
35 Ukázkové chyby 21 Vstup: Výstup MT: Glosa: Správně: Keep on investing. Pokračovalo investování. (grammar correct here!) Continued investing. (Meaning: The investing continued.) Pokračujte v investování. jazykový model vyhrál neprávem nutno zohlednit valenci na zdrojové straně. Vstup: brokerage firms rushed out ads... Výstup MT: brokerské firmy vyběhl reklamy Glosa: brokerage firms pl.fem ran sg.masc ads pl.nom,pl.acc,pl.voc,sg.gen Správná možnost 1: brokerské firmy vyběhly s reklamami pl.instr Správná možnost 2: brokerské firmy vydaly reklamy pl.acc Data na cílové straně možná dost bohatá k identifikaci: vyběhnout s instr Určitě nebudou dost bohatá pro všechny morfologické a lexikální varianty: vyběhl s reklamou, vyběhla s reklamami, vyběhl s prohlášením, vyběhli s oznámením,...
36 Osnova 22 Frázový statistický překlad krok po kroku Frázový statistický překlad o více faktorech Experimenty s překladem do češtiny Malý rozbor chyb Závěr Porovnání s angličtinou Návrat do reality (ukázka překladu) Shrnutí Celkové poučení O workshopu
37 Porovnání s angličtinou a lidmi 22 Do angličtiny Do češtiny Rozdíl Lidé 55.3± ± P, 20k vět P+K, 20k vět P, 860k vět, směs domén BLEU lidí počítáno 5x a průměrováno větší rozptyl do angličtiny, protože i původní text sloužil jako jedna z referencí nižší skóre do češtiny může ukazovat na větší tvaroslovnou a slovoslednou volnost, ale také možná jen, že do angličtiny překládali přímočařeji P+K podle očekávání pomohlo víc do češtiny do angličtiny pomohlo víc dat a překvapivě nevadilo smísit domény
38 Ukázka překladu do češtiny (BLEU 28,12) 23 jsme asi navštívit, pokud reklama funguje. těžko na patách pátečního propadu akciového 190-point a nejistota, že to následovalo, několik velkých brokerských firem, které jsou kolébat nové reklamy, že známá zpráva : pokračovalo investování, trh je docela dobře. jejich posláním je, aby udrželi klienti prchají z trhu, jako individuální investoři udělali v droves po krachu v říjnu právě dny po krachu v roce 1987, hlavní brokerské firmy vyběhl reklamy na klidné investory. tentokrát kolem, jsou pohybující ještě rychlejší. We are about to see if advertising works. Hard on the heels of Friday s 190-point stock-market plunge and the uncertainty that s followed, a few big brokerage firms are rolling out new ads trumpeting a familiar message : Keep on investing, the market s just fine. Their mission is to keep clients from fleeing the market, as individual investors did in droves after the crash in October Just days after the 1987 crash, major brokerage firms rushed out ads to calm investors. This time around, they are moving even faster.
39 24 Shrnutí Frázový překlad do češtiny není zcela beznadějný. Podobně jako u jiných jazyků lokální shody přijatelné, problém celkové koherence. Kontrola morfologie ve vícefaktorovém překladu pomáhá (čj, nj, špaň.).... a to i v případě unsupervised morfologie (třídy slov místo značek, čínšť.). Efekt se snižuje při použití více dat (čj, špaň.). Efekt se snižuje při užití složitějšího scénáře. Jiná testovaná využití více faktorů zatím příliš nepomohla. aj nj: celková struktura věty, shoda čísla slovesa a subjektu aj čj: povrchová valence Data mimo doménu mohou i ubĺıžit.
40 Celkové poučení (znovu a znovu a znovu!) Potřebuješ úkol a metriku kvality výstupu. Čím bĺıž je úkol ke každodenním problémům, tím lépe. 2. Napřed zkus nejjednodušší způsob, jak problém řešit. Čím víc jsi vzdělán/vychován, tím těžší bývá mít jednoduché nápady. 3. Testuj na málo datech, i když jich máš hodně. Ladění očividných chyb je rychlejší. Případné zlepšení bude markantnější ;-) 4. Opravuj chyby časté, nikoli chyby nápadné! Mikroevaluace je velmi užitečná. Projdi 10 vzorků výstupu, pojmenuj chyby, posčítej.
41 Osnova Frázový statistický překlad krok po kroku Frázový statistický překlad o více faktorech Experimenty s překladem do češtiny Malý rozbor chyb Závěr O workshopu 26
42 26 Celkově o workshopu Výsledky týmu SMT na workshopu: Moses: systém pro strojový překlad, zřejmě bude LGPL. Vícefaktorové modely pro frázový překlad. Confusion networks (aproximace slovních grafů) pro překlad víceznačného vstupu. Budoucnost: Euromatrix: Edinburgh: Další využití více faktorů (reordering, lepší modely celkové koherence). ÚFAL: Stromečkový dekodér (navazuje na disertaci M. Čmejrka). MIT (M. Collins, B. Cowan): Překlad valenčních rámců, doplnění pak frázově. RWTH Aachen, ITC irst: Překlad mluvené řeči, confusion networks.
43 Jak dosáhnout úspěšného workshopu 27 Všechno musí být připraveno předem. Moses byl vyvíjen 9 měsíců předem, workshop jen ověřil použitelnost. Přesto první dva tři týdny neproběhl jediný experiment. Data byla připravena předem. Přesto se třetí týden ukázalo, že španělština má otazníky místo diakritiky a v češtině chybí půlka dat.
44 28 Literatura Koehn, Philipp Europarl: A Parallel Corpus for Statistical Machine Translation. In Proceedings of MT Summit X, September.
Chapter 6. Decoding. Statistical Machine Translation
Chapter 6 Decoding Statistical Machine Translation Decoding We have a mathematical model for translation p(e f) Task of decoding: find the translation e best with highest probability Two types of error
Jak pracuje. Ondřej Bojar [email protected] Ústav formální a aplikované lingvistiky MFF UK. ELRC Training Workshop, 15. prosinec 2015 1/28
Jak pracuje automatický překlad Ondřej Bojar [email protected] Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/28 Osnova Úloha strojového překladu. Obtížnost
Jak pracuje. Ondřej Bojar [email protected] Ústav formální a aplikované lingvistiky MFF UK. ELRC Workshop, 14.
Jak pracuje automatický překlad Ondřej Bojar [email protected] Ústav formální a aplikované lingvistiky MFF UK ELRC Workshop, 14. duben 2016 1/31 Osnova Úloha strojového překladu. Obtížnost překladu.
Phrase-Based MT. Machine Translation Lecture 7. Instructor: Chris Callison-Burch TAs: Mitchell Stern, Justin Chiu. Website: mt-class.
Phrase-Based MT Machine Translation Lecture 7 Instructor: Chris Callison-Burch TAs: Mitchell Stern, Justin Chiu Website: mt-class.org/penn Translational Equivalence Er hat die Prüfung bestanden, jedoch
Statistical Machine Translation
Statistical Machine Translation Some of the content of this lecture is taken from previous lectures and presentations given by Philipp Koehn and Andy Way. Dr. Jennifer Foster National Centre for Language
Chapter 5. Phrase-based models. Statistical Machine Translation
Chapter 5 Phrase-based models Statistical Machine Translation Motivation Word-Based Models translate words as atomic units Phrase-Based Models translate phrases as atomic units Advantages: many-to-many
aneb Perfekt perfektně.
aneb Perfekt perfektně. 2013 se v angličtině nazývá Present Perfect, tedy Přítomný perfekt. Patří k časům přítomným, ačkoliv se jistě nejedná o klasický přítomný čas tak, jak jsme zvykĺı z češtiny. jistým
Factored Translation Models
Factored Translation s Philipp Koehn and Hieu Hoang [email protected], [email protected] School of Informatics University of Edinburgh 2 Buccleuch Place, Edinburgh EH8 9LW Scotland, United Kingdom
A Joint Sequence Translation Model with Integrated Reordering
A Joint Sequence Translation Model with Integrated Reordering Nadir Durrani, Helmut Schmid and Alexander Fraser Institute for Natural Language Processing University of Stuttgart Introduction Generation
Statistical Machine Translation Lecture 4. Beyond IBM Model 1 to Phrase-Based Models
p. Statistical Machine Translation Lecture 4 Beyond IBM Model 1 to Phrase-Based Models Stephen Clark based on slides by Philipp Koehn p. Model 2 p Introduces more realistic assumption for the alignment
Luk aˇ s R uˇ ziˇ cka Pomocn a slovesa
Pomocná slovesa Přehled funkcí Leden 2013 Přehled funkcí 1 děje probíhající právě ted 2 děje probíhající, ale ne nutně právě ted 3 děje probíhající dočasně 4 budoucí použití (pevná dohoda) Děje probíhající
The XMU Phrase-Based Statistical Machine Translation System for IWSLT 2006
The XMU Phrase-Based Statistical Machine Translation System for IWSLT 2006 Yidong Chen, Xiaodong Shi Institute of Artificial Intelligence Xiamen University P. R. China November 28, 2006 - Kyoto 13:46 1
aneb Perfektní minulost.
aneb Perfektní minulost. 2013 se v angličtině nazývá Past Perfect. Používáme jej tehdy, potřebujeme-li jasně vyjádřit, že nějaký děj proběhl ještě dříve než minulý děj, o kterém hovoříme. Podívejme se
NÁVRH Příklady hlášení obchodů
NÁVRH Příklady hlášení obchodů Příklady HLOB říjen 2007 verze DRAFT 1 Číslo změny Účinnost změny 1. 22.10.2007 Označení změněné části První zveřejnění příkladů hlášení obchodů Číslo verze po změně Změnu
The Prague Bulletin of Mathematical Linguistics NUMBER 96 OCTOBER 2011 49 58. Ncode: an Open Source Bilingual N-gram SMT Toolkit
The Prague Bulletin of Mathematical Linguistics NUMBER 96 OCTOBER 2011 49 58 Ncode: an Open Source Bilingual N-gram SMT Toolkit Josep M. Crego a, François Yvon ab, José B. Mariño c c a LIMSI-CNRS, BP 133,
Jazyk C# (seminář 8)
Jazyk C# (seminář 8) Pavel Procházka KMI 12. listopadu 2014 Na co je dobré XML? Deklarativní jazyk reprezentující čitelně data Snadná práce s konfiguračními soubory a ukládání do souboru Human readeble
A Joint Sequence Translation Model with Integrated Reordering
A Joint Sequence Translation Model with Integrated Reordering Nadir Durrani Advisors: Alexander Fraser and Helmut Schmid Institute for Natural Language Processing University of Stuttgart Machine Translation
BIRD Internet Routing Daemon
BIRD Internet Routing Daemon Ondřej Zajíček CZ.NIC z.s.p.o. IT 13 Úvod I Úvod do dynamického routování I Představení démona BIRD I OSPF a BIRD I BGP a BIRD Dynamické routování I Sestavení routovacích tabulek
Assessment of Risk Areas of a Tunnel Project based on Expert Opinion
Assessment of Risk Areas of a Tunnel Project based on Expert Opinion Martin Srb 3G Consulting Engineers s.r.o., Prague, Czech Republic ABSTRACT: Based on evaluation of tunnel accidents/collapses during
Upozorňujeme,že můžete formáty pro čtečky převádět ON-LINE na internetu do formátu PDF apod.
Dobrý den, děkujeme za Nákup,níže máte odkazy pro bezplatné stažení.knihy jsou v archivech PDF(nepotřebujete čtečku e-knih),txt(nepotřebujete čtečku e-knih), a dále pro čtečky : soubory typu: PDB,MOBI,APNX
Machine Translation and the Translator
Machine Translation and the Translator Philipp Koehn 8 April 2015 About me 1 Professor at Johns Hopkins University (US), University of Edinburgh (Scotland) Author of textbook on statistical machine translation
The Transition of Phrase based to Factored based Translation for Tamil language in SMT Systems
The Transition of Phrase based to Factored based Translation for Tamil language in SMT Systems Dr. Ananthi Sheshasaayee 1, Angela Deepa. V.R 2 1 Research Supervisior, Department of Computer Science & Application,
aneb Co bylo, bylo, co zbylo, zbylo.
aneb Co bylo, bylo, co zbylo, zbylo. 2013 Minulé časy Minulý čas se vyznačuje především tím, že jím popisované děje jsou již ukončeny a dále neprobíhají. Často jsou tyto skutečnosti naznačeny signálním
IRIS - English-Irish Translation System
IRIS - English-Irish Translation System Mihael Arcan, Unit for Natural Language Processing of the Insight Centre for Data Analytics at the National University of Ireland, Galway Introduction about me,
HIERARCHICAL HYBRID TRANSLATION BETWEEN ENGLISH AND GERMAN
HIERARCHICAL HYBRID TRANSLATION BETWEEN ENGLISH AND GERMAN Yu Chen, Andreas Eisele DFKI GmbH, Saarbrücken, Germany May 28, 2010 OUTLINE INTRODUCTION ARCHITECTURE EXPERIMENTS CONCLUSION SMT VS. RBMT [K.
UEdin: Translating L1 Phrases in L2 Context using Context-Sensitive SMT
UEdin: Translating L1 Phrases in L2 Context using Context-Sensitive SMT Eva Hasler ILCC, School of Informatics University of Edinburgh [email protected] Abstract We describe our systems for the SemEval
MOJEBILLBOARDY.CZ OUTDOOR ADVERTISING MATERIÁLY PRO UČITELE
MOJEBILLBOARDY.CZ OUTDOOR ADVERTISING MATERIÁLY PRO UČITELE At Mojebillboardy.cz you can in one place you can compare the prices and the locations of billboards of many different agencies which have outdoor
YOUTUBE 4.0. Postup upgrade Youtube z Youtube 3.1 na Youtube 4.0 pro produkty EAGET X5R, M6, M7 a M9:
YOUTUBE 4.0 Postup upgrade Youtube z Youtube 3.1 na Youtube 4.0 pro produkty EAGET X5R, M6, M7 a M9: 1) V puštěném přehrávači EAGET zjistěte IP adresu vašeho zařízení (Nastavení - Systém - Síť - "IP adresa
An End-to-End Discriminative Approach to Machine Translation
An End-to-End Discriminative Approach to Machine Translation Percy Liang Alexandre Bouchard-Côté Dan Klein Ben Taskar Computer Science Division, EECS Department University of California at Berkeley Berkeley,
Factored bilingual n-gram language models for statistical machine translation
Mach Translat DOI 10.1007/s10590-010-9082-5 Factored bilingual n-gram language models for statistical machine translation Josep M. Crego François Yvon Received: 2 November 2009 / Accepted: 12 June 2010
Computer Aided Translation
Computer Aided Translation Philipp Koehn 30 April 2015 Why Machine Translation? 1 Assimilation reader initiates translation, wants to know content user is tolerant of inferior quality focus of majority
Automatizovaná formální verifikace
Automatizovaná formální verifikace v operačních systémech Kamil Dudka 11. března 2010 Téma práce efektivní techniky pro verifikaci programů, které pracují s dynamickými datovými strukturami na vstupu bude
Přednášející... Kamil Juřík. [email protected]. Lead Consultant & Platform Architect
Přednášející... Kamil Juřík Lead Consultant & Platform Architect [email protected] Microsoft Most Valuable Professional: SharePoint Server Microsoft Certified Trainer Microsoft Certified IT
NEURAL NETWORKS IN INTRUSION DETECTION SYSTEMS NEURONOVÉ SÍTĚ V SYSTÉMECH PRO DETEKCI NAPADENÍ
NEURAL NETWORKS IN INTRUSION DETECTION SYSTEMS NEURONOVÉ SÍTĚ V SYSTÉMECH PRO DETEKCI NAPADENÍ Arnošt Veselý, Dagmar Brechlerová Abstract: Security of an information system is its very important property,
8.2 Transformace, množinové operace
8.2. TRANSFORMACE, MNOŽINOVÉ OPERACE 8.2 Transformace, množinové operace 8.2.1 Transformace Posunutí, otočení a změna rozměrů umožňují efektivní práci s objekty. Je jednodušší umístit objekt v požadovaných
WK29B / WK29W. Bluetooth Wireless Slim Keyboard. User manual ( 2 5 ) Uživatelský manuál ( 6 10) Užívateľský manuál (11 15)
WK29B / WK29W Bluetooth Wireless Slim Keyboard User manual ( 2 5 ) Uživatelský manuál ( 6 10) Užívateľský manuál (11 15) 1. Installing the batteries The EVOLVEO WK29B / WK29W keyboard uses two AAA alkaline
Studentská tvůrčí a odborná činnost STOČ 2013. Control of laboratory model 3D Printer. Martin JUREK
Studentská tvůrčí a odborná činnost STOČ 2013 Control of laboratory model 3D Printer Martin JUREK VŠB-TUO, 17. listopadu 2172/15, 708 00 Ostrava-Poruba 25. dubna 2013 FAI UTB ve Zlíně Klíčová slova: RepRap,
MICROSOFT WORD 2010. Mgr. Krejčí Jan (ZSJP) MICROSOFT WORD 2010 21. září 2012 1 / 21
MICROSOFT WORD 2010 Mgr. Krejčí Jan Základní škola Jaroslava Pešaty, Duchcov 21. září 2012 Mgr. Krejčí Jan (ZSJP) MICROSOFT WORD 2010 21. září 2012 1 / 21 Microsoft Word 2010 Anotace V souboru typu pdf
Market Consistent Embedded Value
Market Consistent Embedded Value Dana Bohatová Chládková, Kamil Žák Seminář z aktuárských věd 4. května 2007 Obsah Proč Embedded Value? Co je Embedded Value? Market Consistent Embedded Value Vývoj EV Příklady
tance alignment and time information to create confusion networks 1 from the output of different ASR systems for the same
1222 IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 16, NO. 7, SEPTEMBER 2008 System Combination for Machine Translation of Spoken and Written Language Evgeny Matusov, Student Member,
Fill each of the numbered blanks in the following passage. Use only one word in each space.
Page 1/5 A. LISTENING COMPREHENSION You will hear a woman talking about what happened on the night a serious storm struck Britain. For questions 1-5 fill in the missing information. Only one word is necessary
English Welcome Unit. Mgr. Martin Juchelka. Pracovní listy pro SOU, nematuritní obory Angličtina opakování ze ZŠ
English Welcome Unit Pracovní listy pro SOU, nematuritní obory Angličtina opakování ze ZŠ Mgr. Martin Juchelka Tento materiál byl vytvořen v rámci projektu CZ.1.07/1.1.07/03.0027 Tvorba elektronických
Domain-specific terminology extraction for Machine Translation. Mihael Arcan
Domain-specific terminology extraction for Machine Translation Mihael Arcan Outline Phd topic Introduction Resources Tools Multi Word Extraction (MWE) extraction Projection of MWE Evaluation Future Work
Customizing an English-Korean Machine Translation System for Patent Translation *
Customizing an English-Korean Machine Translation System for Patent Translation * Sung-Kwon Choi, Young-Gil Kim Natural Language Processing Team, Electronics and Telecommunications Research Institute,
Safetex. Safety with style. Selling your products. Safetex Ltd. It s designed for /It comes with /It offers
56 6 A Selling your products Safetex Ltd Is your job sometimes dangerous? Can you name a tool (nástroj, nářadí) in English? It s designed for /It comes with /It offers emails Could you, please? prices:
Convergence of Translation Memory and Statistical Machine Translation
Convergence of Translation Memory and Statistical Machine Translation Philipp Koehn and Jean Senellart 4 November 2010 Progress in Translation Automation 1 Translation Memory (TM) translators store past
A New Input Method for Human Translators: Integrating Machine Translation Effectively and Imperceptibly
Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence (IJCAI 2015) A New Input Method for Human Translators: Integrating Machine Translation Effectively and Imperceptibly
Building a Web-based parallel corpus and filtering out machinetranslated
Building a Web-based parallel corpus and filtering out machinetranslated text Alexandra Antonova, Alexey Misyurev Yandex 16, Leo Tolstoy St., Moscow, Russia {antonova, misyurev}@yandex-team.ru Abstract
7-2 Speech-to-Speech Translation System Field Experiments in All Over Japan
7-2 Speech-to-Speech Translation System Field Experiments in All Over Japan We explain field experiments conducted during the 2009 fiscal year in five areas of Japan. We also show the experiments of evaluation
An Approach to Handle Idioms and Phrasal Verbs in English-Tamil Machine Translation System
An Approach to Handle Idioms and Phrasal Verbs in English-Tamil Machine Translation System Thiruumeni P G, Anand Kumar M Computational Engineering & Networking, Amrita Vishwa Vidyapeetham, Coimbatore,
VY_22_INOVACE_54 Present perfect. Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor: Anglický jazyk Ročník: 8.,9.
VY_22_INOVACE_54 Present perfect Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor: Anglický jazyk Ročník: 8.,9. G: PRESENT PERFECT (předpřítomný čas) now + HAVE/HAS + past participle (3.
The noisier channel : translation from morphologically complex languages
The noisier channel : translation from morphologically complex languages Christopher J. Dyer Department of Linguistics University of Maryland College Park, MD 20742 [email protected] Abstract This paper
Hybrid Machine Translation Guided by a Rule Based System
Hybrid Machine Translation Guided by a Rule Based System Cristina España-Bonet, Gorka Labaka, Arantza Díaz de Ilarraza, Lluís Màrquez Kepa Sarasola Universitat Politècnica de Catalunya University of the
A chart generator for the Dutch Alpino grammar
June 10, 2009 Introduction Parsing: determining the grammatical structure of a sentence. Semantics: a parser can build a representation of meaning (semantics) as a side-effect of parsing a sentence. Generation:
SYSTRAN Chinese-English and English-Chinese Hybrid Machine Translation Systems for CWMT2011 SYSTRAN 混 合 策 略 汉 英 和 英 汉 机 器 翻 译 系 CWMT2011 技 术 报 告
SYSTRAN Chinese-English and English-Chinese Hybrid Machine Translation Systems for CWMT2011 Jin Yang and Satoshi Enoue SYSTRAN Software, Inc. 4444 Eastgate Mall, Suite 310 San Diego, CA 92121, USA E-mail:
An Online Service for SUbtitling by MAchine Translation
SUMAT CIP-ICT-PSP-270919 An Online Service for SUbtitling by MAchine Translation Annual Public Report 2012 Editor(s): Contributor(s): Reviewer(s): Status-Version: Arantza del Pozo Mirjam Sepesy Maucec,
SYSTRAN 混 合 策 略 汉 英 和 英 汉 机 器 翻 译 系 统
SYSTRAN Chinese-English and English-Chinese Hybrid Machine Translation Systems Jin Yang, Satoshi Enoue Jean Senellart, Tristan Croiset SYSTRAN Software, Inc. SYSTRAN SA 9333 Genesee Ave. Suite PL1 La Grande
Návod k použití: Boxovací stojan DUVLAN s pytlem a hruškou kód: DVLB1003
Návod na použitie: Boxovací stojan DUVLAN s vrecom a hruškou kód: DVLB1003 Návod k použití: Boxovací stojan DUVLAN s pytlem a hruškou kód: DVLB1003 User manual: DUVLAN with a boxing bag and a speed bag
VEDA VYDAVATEĽSTVO SLOVENSKEJ AKADÉMIE VIED
VEDA VYDAVATEĽSTVO SLOVENSKEJ AKADÉMIE VIED JAZYKOVEDNÝ ÚSTAV ĽUDOVÍTA ŠTÚRA SLOVENSKEJ AKADÉMIE VIED PEDAGOGICKÁ FAKULTA UNIVERZITY KOMENSKÉHO RECENZENTI Ing. Vladimír Benko PhDr. Mária Šimková S L O
The Prague Bulletin of Mathematical Linguistics NUMBER 95 APRIL 2011 5 18. A Guide to Jane, an Open Source Hierarchical Translation Toolkit
The Prague Bulletin of Mathematical Linguistics NUMBER 95 APRIL 2011 5 18 A Guide to Jane, an Open Source Hierarchical Translation Toolkit Daniel Stein, David Vilar, Stephan Peitz, Markus Freitag, Matthias
Jane 2: Open Source Phrase-based and Hierarchical Statistical Machine Translation
Jane 2: Open Source Phrase-based and Hierarchical Statistical Machine Translation Joern Wuebker M at thias Huck Stephan Peitz M al te Nuhn M arkus F reitag Jan-Thorsten Peter Saab M ansour Hermann N e
Hybrid Strategies. for better products and shorter time-to-market
Hybrid Strategies for better products and shorter time-to-market Background Manufacturer of language technology software & services Spin-off of the research center of Germany/Heidelberg Founded in 1999,
Factored Markov Translation with Robust Modeling
Factored Markov Translation with Robust Modeling Yang Feng Trevor Cohn Xinkai Du Information Sciences Institue Computing and Information Systems Computer Science Department The University of Melbourne
BEER 1.1: ILLC UvA submission to metrics and tuning task
BEER 1.1: ILLC UvA submission to metrics and tuning task Miloš Stanojević ILLC University of Amsterdam [email protected] Khalil Sima an ILLC University of Amsterdam [email protected] Abstract We describe
The Impact of Morphological Errors in Phrase-based Statistical Machine Translation from English and German into Swedish
The Impact of Morphological Errors in Phrase-based Statistical Machine Translation from English and German into Swedish Oscar Täckström Swedish Institute of Computer Science SE-16429, Kista, Sweden [email protected]
Agris on-line Papers in Economics and Informatics
Agris on-line Papers in Economics and Informatics Volume III Number 1, 2011 Social Networks as an Integration Tool in Rural Areas Agricultural Enterprises of the Czech Republic E. Červenková 1, P. Šimek
Automatic post-editing of phrase-based machine translation outputs
Charles University in Prague Faculty of Mathematics and Physics MASTER THESIS Rudolf Rosa Automatic post-editing of phrase-based machine translation outputs Institute of Formal and Applied Linguistics
UNSUPERVISED MORPHOLOGICAL SEGMENTATION FOR STATISTICAL MACHINE TRANSLATION
UNSUPERVISED MORPHOLOGICAL SEGMENTATION FOR STATISTICAL MACHINE TRANSLATION by Ann Clifton B.A., Reed College, 2001 a thesis submitted in partial fulfillment of the requirements for the degree of Master
[email protected] [email protected]
Evolution of Linux network management InstallFest 2013, Praha http://data.pavlix.net/installfest/2013/ 1/12 From: Dan Williams To: networkmanager-list gnome org Subject: ANN: released
THUTR: A Translation Retrieval System
THUTR: A Translation Retrieval System Chunyang Liu, Qi Liu, Yang Liu, and Maosong Sun Department of Computer Science and Technology State Key Lab on Intelligent Technology and Systems National Lab for
MORPHOLOGY BASED PROTOTYPE STATISTICAL MACHINE TRANSLATION SYSTEM FOR ENGLISH TO TAMIL LANGUAGE
MORPHOLOGY BASED PROTOTYPE STATISTICAL MACHINE TRANSLATION SYSTEM FOR ENGLISH TO TAMIL LANGUAGE A Thesis Submitted for the Degree of Doctor of Philosophy in the School of Engineering by ANAND KUMAR M CENTER
ARP,TCP,IP utility -zjednodusene a rychle Jiri Kubina [email protected] Ver. 1.0 leden 2006
ARP,TCP,IP utility -zjednodusene a rychle Jiri Kubina Ver. 1.0 leden 2006 Obsah 1.ip 2.ifconfig 3.route 4.arp 5.arping 6.netstat 7.ethtool Upozorneni: U popisovanych prikazu nejsou uvedeny vsechny parametry
Translating the Penn Treebank with an Interactive-Predictive MT System
IJCLA VOL. 2, NO. 1 2, JAN-DEC 2011, PP. 225 237 RECEIVED 31/10/10 ACCEPTED 26/11/10 FINAL 11/02/11 Translating the Penn Treebank with an Interactive-Predictive MT System MARTHA ALICIA ROCHA 1 AND JOAN
Word Completion and Prediction in Hebrew
Experiments with Language Models for בס"ד Word Completion and Prediction in Hebrew 1 Yaakov HaCohen-Kerner, Asaf Applebaum, Jacob Bitterman Department of Computer Science Jerusalem College of Technology
Machine Translation. Agenda
Agenda Introduction to Machine Translation Data-driven statistical machine translation Translation models Parallel corpora Document-, sentence-, word-alignment Phrase-based translation MT decoding algorithm
Why Evaluation? Machine Translation. Evaluation. Evaluation Metrics. Ten Translations of a Chinese Sentence. How good is a given system?
Why Evaluation? How good is a given system? Machine Translation Evaluation Which one is the best system for our purpose? How much did we improve our system? How can we tune our system to become better?
Statistical Pattern-Based Machine Translation with Statistical French-English Machine Translation
Statistical Pattern-Based Machine Translation with Statistical French-English Machine Translation Jin'ichi Murakami, Takuya Nishimura, Masato Tokuhisa Tottori University, Japan Problems of Phrase-Based
An Iteratively-Trained Segmentation-Free Phrase Translation Model for Statistical Machine Translation
An Iteratively-Trained Segmentation-Free Phrase Translation Model for Statistical Machine Translation Robert C. Moore Chris Quirk Microsoft Research Redmond, WA 98052, USA {bobmoore,chrisq}@microsoft.com
Machine Translation. Why Evaluation? Evaluation. Ten Translations of a Chinese Sentence. Evaluation Metrics. But MT evaluation is a di cult problem!
Why Evaluation? How good is a given system? Which one is the best system for our purpose? How much did we improve our system? How can we tune our system to become better? But MT evaluation is a di cult
Applying Statistical Post-Editing to. English-to-Korean Rule-based Machine Translation System
Applying Statistical Post-Editing to English-to-Korean Rule-based Machine Translation System Ki-Young Lee and Young-Gil Kim Natural Language Processing Team, Electronics and Telecommunications Research
MODULE CAN R/S MODULE CAN BUS MAGICAR MODUL CAN R/S MODUL CAN BUS MAGICAR
MODULE CN R/S MODULE CN BUS MGICR MODUL CN R/S MODUL CN BUS MGICR Mul CN BUS prevníka Pporované funkcie tabuľka vozidiel CN BUS converter mule Table of function supported vehicles Mul CN BUS převníku Pporované
PROMT Technologies for Translation and Big Data
PROMT Technologies for Translation and Big Data Overview and Use Cases Julia Epiphantseva PROMT About PROMT EXPIRIENCED Founded in 1991. One of the world leading machine translation provider DIVERSIFIED
Machine translation techniques for presentation of summaries
Grant Agreement Number: 257528 KHRESMOI www.khresmoi.eu Machine translation techniques for presentation of summaries Deliverable number D4.6 Dissemination level Public Delivery date April 2014 Status Author(s)
Installation manual Wireless Keypad
Advanced Operations Please know exactly what you are doing when processing the operations below. It could cause errors or erase settings which make keypad stop working. Please disarm from keypad before
Syntax-to-Morphology Mapping in Factored Phrase-Based Statistical Machine Translation from English to Turkish
Syntax-to-Morphology Mapping in Factored Phrase-Based Statistical Machine Translation from English to Turkish Reyyan Yeniterzi Language Technologies Institute Carnegie Mellon University Pittsburgh, PA,
