:: Enseignements :: Master :: M1 :: 2009-2010 :: Ingénierie Linguistique 1 ::
![[LOGO]](http://igm.univ-mlv.fr/ens/resources/mlv.png) | Analyse syntaxique et extraction d'informations |
Préliminaires
Exercice 1 - Analyse syntaxique
Dans cet exercice, il s'agit de réaliser l'analyse syntaxique de chaque phrase du texte fourni,
en utilisant les fonctionalités de NLTK.
-
Déterminer sur papier la catégorie grammaticale de chacun des mots des trois premières phrases.
-
Dessiner les arbres syntaxiques des trois premières phrases.
-
Ecrire sur papier la grammaire reconnaissant ces trois phrases.
Par exemple, la phrase "Jean dort" est reconnue par la grammaire suivante:
- S -> NP VP
- VP -> V
- NP -> N
- V -> 'dort'
- N -> 'Jean'
-
En vous inspirant du script suivant, implémenter une grammaire qui reconnaît l'ensemble des phrases du texte.
Exercice 2 - Extraction d'informations
A l'aide de l'analyse syntaxique réalisée précédement, nous souhaitons extraire les informations suivantes pour chaque phrase:
l'acheteur (resp. le vendeur) et l'acheté (resp. le vendu).
Pour cela, il s'agira de faire un parcours de l'arbre syntaxique
et identifier les informations pertinentes:
le verbe, le sujet et le complément d'objet.
Par exemple, pour la phrase "Microsoft achète Google", le sujet est "Microsoft", le verbe est "achète" et le complément d'objet est "Google".
On devra extraire les informations suivante: acheteur="Microsoft" et acheté="Google".
Indication: pour le parcours de l'arbre, utiliser les méthodes du script en exemple.
- Traiter d'abord les phrases actives (phrases 1, 2, 6 et 7)
- Modifier la grammaire pour qu'elle distingue les phrases actives et passives (ajout d'un non-terminal). Modifier le script pour extraire les informations pertinentes.
© Université de Marne-la-Vallée