Mapare intre arbori
Transformarea “eficientă” a arborelui asociat lui T în arborele H având date valorile de penalizare pentru cele 3 operaţii.
Textual Entailment – Mapping between trees
Textual Entailment = “We say that a text T entails a hypothesis H if, typically, a human reading T would infer that H is most likely true.”
Example:
T1: Internet media company Yahoo Inc. announced Monday it is buying Overture Services Inc. in a $1.63-billion (U.S.) cash-and-stock deal that will bolster its on-line search capabilities.
the following hypotheses are entailed:
H1.1 Yahoo bought Overture.
H1.2 Yahoo is an internet company
the following hypothesis is a contradiction:
H1.3 Overture bought Yahoo
the following hypothesis is unknown:
H1.4 Yahoo has 5.000.000 employees
Problemă:
Presupunând că avem arborii de dependenţă asociaţi textului T şi ipotezei H, definim următoarele trei operaţii pe arborele T:
• Adăugarea unui nod – presupune adăugarea unui nod în arborele T şi are un cost de penalizare Pa;
• Modificarea unui nod – presupune transformarea valorii unui nod cu o altă valoare şi are un cost de penalizare Pm dacă se păstrează partea de vorbire şi PM dacă se modifică şi partea de vorbire (PM> Pm);
• Ştergerea unui nod – presupune ştergerea unui nod din arbore, moment în care toţi copii nodului şters devin copiii părintelui nodului şters, şi are un cost de penalizare Ps.
Costul de transformare a arborelui T în H este suma tuturor penalizărilor obţinute în urma trasformărilor prin operaţiile de adăugare, modificare şi ştergere.
Se cere: transformarea “eficientă” a arborelui asociat lui T în arborele H având date valorile de penalizare pentru cele 3 operaţii. Eficienţa se va calcula în funcţie de două valori: costul de transformare şi timpului de execuţie care trebuie să fie cât mai mici.
Transformarea în arbori de dependenţă se face cu utilitarul MINIPAR, costul de modificare este distanţa între cuvinte din WordNet.
Pentru enuntul complet al problemei in format PDF accesati urmatorul link: mapare-intre-arbori.
Echipa: maxim 4 studenti.
Bonus: nota 10 la examenul obligatoriu din cadrul disciplinei “Programare Bazata pe Reguli” (anul III, semestrul II) sau “Introducere in Prelucrarea Limbajului Natural” (master).
Proiect propus de: domnul asistent Adrian Iftene, doctorand in cadrul Facultatii de Informatica.
2 Comments so far
Leave a reply
Actually, nu prea vezi figura de mai jos…
Ai dreptate, uitasem sa scot din enuntul problemei paranteza aia.