Le laboratoire GREYC (CNRS UMR 6072) de l'université de Caen Basse-Normandie a proposé un post-doc dans le cadre du projet Bingo2 (Knowledge discovery for and by inductive queries in post-genomic applications) soutenu par ANR.
Localisation: Caen, Normandie, France
Sujet: découverte automatique de règles pour l'annotation de corpus
L'objectif général de cette recherche concerne la découverte de connaissances à partir de textes bio-médicaux. Face à l'explosion quantitative de telles données, l'accès à l'information pertinente est devenue un enjeu majeur. Il existe un savoir-faire au GREYC sur les méthodes de fouille de données et du traitement automatique des langues (TAL), notamment en extraction d'information et nous proposons, dans cette recherche, d'exploiter les complémentarités de ces domaines. Au niveau du TAL, l'acquisition automatique de ressources linguistiques (lexiques, règles d'extraction) par des techniques de fouille de texte (FT) est une voie prometteuse pour prendre en compte la diversité des corpus et leur évolution, et permettre une analyse automatique des textes et les annoter. Au niveau de la FT, il s'agit de concevoir de nouvelles méthodes de fouille intégrant les spécificités du texte.
Le post-doc travaillera sur cette problématique qui inclut les points suivants :
- utilisation et adaptation des méthodes de FT pour l'apprentissage de règles d'extraction ;
- conception d'une méthode pour l'annotation sémantique de corpus ;
- développement d'une interface permettant la recherche d'information au sein des corpus annotés.
Profil
Nous recherchons un informaticien ayant des connaissances dans au moins l'un des domaines du traitement automatique des langues, de la fouille de données ou de l'apprentissage automatique.
Lieu, durée et rémunération
- contrat de 12 mois (possibilité de prolongation), à pourvoir en septembre 2008
- rémunération : 1900 euros net par mois
- le poste est à pourvoir au laboratoire GREYC
Comment candidater
Les candidatures sont à envoyer dès que possible et seront étudiées jusqu'à ce que le poste soit pourvu.
Envoyer un CV et une lettre de motivation, ainsi que deux noms de personnes susceptibles de recommander le candidat, par courrier électronique à :
Thierry Charnois +33 2 31 56 73 77 Thierry.Charnois@info.unicaen.fr
Bruno Crémilleux +33 2 31 56 74 35 Bruno.Cremilleux@info.unicaen.fr
GREYC - CNRS UMR 6072, Université de Caen, Campus Côte de Nacre F-14032 Caen Cedex - France