Poste de chargé-e de recherche en apprentissage et Traitement Automatique des Langues à INRAE

Un poste de chercheur (CRCN) en méthodes d’apprentissage automatique pour le traitement automatique de la langue et l’extraction d’information à partir de textes est ouvert aux concours 2020 dans l’équipe Bibliome de l’unité MaIAGE (Mathématiques en Informatique Appliquées du Génome à l’Environnement) d’INRAE (Institut national de recherche pour l’agriculture, l’alimentation et l’environnement) à Jouy-en-Josas (78).

* Clôture des candidatures : *5 mars 2020*

* Descriptif du poste CRCN20-NUMM-2 : https://jobs.inrae.fr/concours/concours-charges-recherche-classe-normale-h/f/crcn20-numm-2

* Modalités de candidature : https://jobs.inrae.fr/concours/concours-charges-recherche-classe-normale-h/f

Présentation d’INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche placé sous la double tutelle du ministère en charge de l’agriculture et du ministère en charge de la recherche.

C’est un acteur majeur de la recherche et de l’innovation créé le 1er janvier 2020. Institut de recherche finalisé issu de la fusion entre l’Inra et Irstea, INRAE rassemble une communauté de 12 000 personnes, avec plus de 200 unités de recherche et 42 unités expérimentales implantées dans toute la France.

L’institut se positionne parmi les tous premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal, et se classe 11ème mondial en écologie-environnement. Face à l’augmentation de la population, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE construit des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

L’unité de recherche MaIAGE («Mathématiques et Informatique Appliquées du Génome à l’Environnement ») d’INRAE développe des méthodes mathématiques et informatiques originales de portée générique ou motivées par des problèmes biologiques précis.

Son équipe de recherche Bibliome développe des méthodes et outils en extraction d’information (text mining) à partir de textes dans les domaines de spécialité d’INRAE. Elle maintient une plateforme logicielle collaborative, Alvis, pour faciliter expérimentation, valorisation et applications des résultats. Elle collabore étroitement dans de nombreux projets avec son réseau disciplinaire en traitement automatique de la langue et en apprentissage automatique au niveau local de l’Université Paris-Saclay mais aussi au niveau national, européen (ex. OpenMinTeD) et international (ex BioNLP-ST) . Elle s’implique dans des partenariats de recherche et de développement avec de nombreuses équipes INRAE en science de la vie, agriculture et alimentation.

L’équipe Bibliome recrute un.e chercheur en apprentissage automatique pour l’extraction d’information.

Votre recherche portera sur le développement de nouvelles méthodes adaptées aux conditions fréquemment rencontrées dans les applications en science de la vie, telles que le petit nombre d’exemples, ou la disponibilité de connaissances du domaine formalisées sous forme d’ontologies, nomenclatures. Vous pourrez, en particulier, vous intégrer dans les travaux de l’équipe sur l’exploitation de plongements lexicaux (word embeddings), de connaissances formelles et d’informations linguistiques (termes, dépendances syntaxiques) pour pallier le petit nombre d’exemples. Vous pourrez travailler sur le développement d’algorithmes d’apprentissage adaptés à plusieurs tâches : reconnaissance et normalisation d’entités du domaine (ou entity-linking) et extraction de relations. Il s’agira par exemple d’explorer les approches neuronales (ex. architectures de Transformer-based NN, Graph-LSTM, mécanisme d’attention) et d’étudier comment intégrer des connaissances externes structurées (ontologies) dans ces architectures.
D’un point de vue applicatif, ces travaux s’inscriront tout d’abord dans les collaborations existantes pour lesquelles les données sont disponibles et les questions de recherche bien spécifiées notamment, sur les thématiques de la biodiversité microbienne et de l’analyse phénotypique des microbes et des plantes. Ils pourront répondre dans le futur à de nouveaux besoins identifiés par exemple, en surveillance épidémiologique des plantes.
Vous serez encouragé-e à valoriser vos travaux sous forme de logiciels open source en les partageant sur la plateforme Alvis et sous forme de publications dans des conférences du domaine du traitement automatique du langage naturel (TALN) et de l’apprentissage automatique. Vous serez impliqué-e dans des projets collaboratifs méthodologiques et appliqués en adéquation avec vos recherches et incité-e à en prendre l’initiative.

Formations et compétences recherchées

Doctorat ou équivalent

Vous êtes titulaire d’une thèse de doctorat et avez suivi une formation en apprentissage automatique (machine learning) idéalement. L’obtention d’un doctorat en apprentissage automatique dans le domaine du text mining / traitement automatique de la langue est fortement recommandé.
Avoir apporté des contributions méthodologiques à des thématiques telles que les word embeddings (plongement lexicaux) et/ou les réseaux de neurones serait particulièrement adapté, mais ne représente pas une condition exclusive.
Une expérience applicative en domaine de spécialité (biologie, agriculture, médecine) serait appréciée.
Une familiarité avec le domaine de l’ingénierie des connaissances, et en particulier des ontologies, serait un plus.
Vous avez un fort intérêt pour le travail collaboratif disciplinaire et interdisciplinaire ce qui requiert des qualités de médiation scientifique. Vous êtes motivé-e par la valorisation de vos résultats et leur intégration dans des applications finalisées.
La maitrise de l’anglais est souhaitée ainsi qu’une expérience internationale de longue durée : les lauréats qui n’en auraient pas encore eu seront fortement incités à réaliser un séjour à l’étranger co-construit avec l’équipe d’accueil dans les 3 années suivant l’année de stage.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez :

Liens utiles :

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.