Thème : Recherche d'information et Apprentissage automatique

 

25-26 Mars 2019, Lyon, France

https://coria-earia2019.projet.liris.cnrs.fr/EARIA/

===============
L’école offre un cadre d’échange convivial tant autour des fondements théoriques de l’apprentissage automatique et de leur utilisation en recherche d’information et applications. Ces sujets sont abordés par des chercheurs et des industriels faisant autorité dans le domaine. Les participants auront également l’occasion de mettre en pratique les connaissances théoriques aux travers de : 1) séance de travaux pratiques sur l’utilisation d’environnement dédiés à l’apprentissage profond ; 2) le Hackathon qui est un projet fédérateur de mise en situation dans un domaine applicatif en lien avec la recherche d’information et l’apprentissage automatique. La réalisation du projet permet de produire un (des) prototype(s) qui sera (ront) présenté(s) lors d’une session de la conférence CORIA qui aura lieu au suivant de EARIA du 27-29 Mars 2019.
L’école s’adresse ainsi à un public de jeunes chercheurs, chercheurs et industriels intéressés par la conception de modèles d’apprentissage automatique pour la recherche d’information et applications, leur implémentation et leur évaluation empirique

===========================================================================
Programme EARIA’2019 : Recherche d’Information et Apprentissage Automatique
===========================================================================
***Lundi 25 mars***
8h30 - 8h45 : Ouverture (Lynda Tamine, IRIT)
8h45- 9h45 : Session 1 – Introduction à la Recherche d'Information (Mohand Boughanem, IRIT )
9h45 - 11h00 : Session 2 - Apprentissage pour la recherche d'information (Eric Gaussier, LIG)
11h00 - 11h30 - Pause
11h30 - 12h45 : Session 3 – Plongements lexicaux et réseaux de neurones (Benjamin Piwowarski, LIP6)
13h00-14H30 - Déjeuner
14h30 - 16h30 Session 4 : - Séance pratique (Benjamin Piwowarski, LIP6, José Moreno, IRIT)
16h30 - 17h00 - Pause
17h00 - 19h30 : Session 5 – Présentation Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT), lancement des activités
19h30-21h00 Dîner
21h00 – 22h30 : Session 6 – Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT)

***Mardi 26 mars***
8h30 - 9h45 : Session 7 – Machine learning for natural language understanding (Marie-Francine Moens ; Univ. Louvain, Belgique)
9h45 - 11h00 : Session 8 – Le Traitement Automatique des Langues appliqué à la recherche d’information ( Christophe Servan, Qwant)
11h00-11H-30 Pause
11h30 - 12h45 : Session 9 – Conversational search (Pierre-Emmanuel Mazaré, Facebook)
13h00 - 14h-30 Déjeuner
14h30 – 16H30 : Session 10 – Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT)
16H30 -17H : Pause
17h - 19h30 : Session 11 – Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT)
19h30- 21h00 : Dîner
===================================================================

Inscription : http://colloque.insavalor.fr/CORIAEARIA2019/Inscription.html

 

 

La 16è édition de CORIA (COnférence en Recherche d’Information et Applications) sera organisée à Lyon du 27 au 29 mars 2019, conjointement aux rencontres jeunes chercheurs en RI (RJCRI) et à l’école EARIA. Elle est la principale manifestation soutenue par l’Association Francophone de Recherche d'Information et Applications ARIA (http://www.asso-aria.org).

 

 

Calendrier

 

  • Soumission des résumés : 7 décembre 2018
  • Soumission des articles : 14 décembre 2018  
  • Notification : 8 février 2019
  • Version définitive des articles : 1er mars 2019
  • Conférence : 27 au 29 mars 2019

 

 

CORIA vise à rassembler les équipes et les personnes menant des travaux scientifiques dans le domaine de la recherche d’information et de ses applications : recherche d’information sur le web, sur les réseaux sociaux ou sur des collections spécifiques, systèmes de recommandation, fouille de documents, d’images, d’enregistrements audio, de vidéos, assistants personnels et chatbots…  Devenue activité quotidienne du grand public, la recherche d’information est essentielle à de nombreux usages du numérique.  L’activité scientifique et technologique associée ne cesse de croître en interaction avec d’autres domaines de l’informatique et d’autres disciplines, mathématiques, linguistique, sciences cognitives, mais aussi en lien direct avec l’industrie et les acteurs de l’internet, des média, de la culture, de la santé ou de l’éducation. Les modèles récents intégrent l’apprentissage automatique, la fouille de données, le traitement automatique des langues, le traitement de la parole et du signal, l'analyse d'images ou encore l’informatique affective.

 

La conférence CORIA est ouverte à l’ensemble de la communauté scientifique internationale concernée par la recherche d’information du point de vue théorique comme du point de vue des applications. Le public visé par CORIA est celui des chercheurs académiques, incluant les étudiants en master et doctorat, des industriels et de tous les spécialistes du domaine. Toutes les publications CORIA sont diffusées en accès ouvert sur le site de l’ARIA et sont indexées par DBLP.

 

Soumissions :

 

Les soumissions seront évaluées par au moins 3 membres du comité de programme. Elles devront être déposées via https://easychair.org/conferences/?conf=coria2019 selon les indications suivantes :

 

  • elles doivent être anonymes
  • la taille maximale des articles est de 16 pages hors références bibliographiques. Des articles de longueur inférieure peuvent être soumis sans que cela soit préjudiciable ;
  • CORIA accepte des articles en anglais pour des auteurs anglophones.
  • des articles déjà publiés en anglais peuvent également être soumis après traduction en français et adaptation à CORIA.

 

 

En 2019, 3 sessions spéciales feront l’objet d’une sélection spécifique :
* session "retour d’expérience": seront par exemple présentés des résultats de projets ou de compétitions, des tentatives de reproduction de résultats ou encore des expériences qui ont échoué (résultats négatifs) ;
* session  "industrielle" : articles à orientation technologique dans lesquels les aspects ingénierie ou transfert de technologie sont majeurs ;
* session "prise de position" : il pourra par exemple s’agir d’articles prospectifs, de présentations d’approches théoriques nouvelles ou de domaines scientifiques connexes qui pourraient bénéficier à la recherche d’information ou pour lesquels la recherche d’information pourra être une source d’innovation.
Pour ces sessions spéciales : lors de la soumission dans EasyChair, cocher la case corresponsante dans la section “Other Information and Files”.

 

Thèmes (liste non exhaustive) :
- Apprentissage et fouille pour la RI : apprentissage profond, apprentissage de représentations, apprentissage d'ordonnancement, classification
- Représentation de l’information : indexation, entités liées, multimédia, profils, bases de connaissances
- Compréhension de requêtes : intention de recherche, suggestion de requêtes, difficulté des requêtes, adaptation aux requêtes
- Interaction utilisateur : interrogation flexible, interfaces, visualisation, modélisation de l’utilisateur, du contexte et de l’usage, accessibilité, RI conversationnelle, personnalisation, RI collaborative
- Systèmes question/réponse, systèmes de dialogue et chatbots
- RI dans l’environnement nomade
- RI et Humanités Numériques
- RI interactive
- Traitement automatique de la langue naturelle écrite et orale pour la recherche d’information : résumé automatique, détection d’entités nommées et de relations, analyse de sentiments, fouille d’arguments...
- RI et connaissances :  web sémantique, web des données, ontologies
- RI pour les assistants personnels et/ou vocaux
- RI multilingue : recherche d’information multilingue, traduction automatique
- Passage à l’échelle : architectures, performance, compression
- Analyse du Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens
- Réseaux sociaux : analyse de réseaux, d’opinions, diffusion d’information, prédiction d’activités, détection d’événements
- Filtrage et recommandation
- Catégorisation de textes/images
- Extraction d’information
- Multimédia (image, audio, vidéos, sons, musiques) et texte : indexation, recherche, catégorisation, alignement, ...
- Systèmes de recherche d’information dédiés : recherche d’information génomique, géographique, médicale, recherche de brevets, RI pour les bibliothèques numériques
- Ressources et évaluation de la RI : évaluation, bancs d’essais, métriques, expérimentations qualitatives des systèmes

 

Au plaisir de vous retrouver à Lyon en mars prochain.

 

Président du comité de programme et contact:
Patrice Bellot, Aix-Marseille Université CNRS (LIS, UMR 7020)
 Fake ou pas Fake ?

Hackathon CORIA-TALN 2018
(hackathon en recherche d’information et traitement automatique des langues)

TL;DR

Tâches : détection et visualisation de fausses informations sur les réseaux
Site web : http://hackatal.github.io/2018
Dates : 14 et 15 mai 2018
Lieu : IRISA, Rennes
Inscription (gratuite mais obligatoire) : https://goo.gl/forms/soTeFTikjWol8bj13 !

Description

Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL). L’évènement porte sur des problématiques en RI et en TAL. L’objectif est de réunir les communautés scientifiques, et au delà, autour de défis à relever, pour modéliser, prototyper, coder, expérimenter, développer, tester, évaluer, échanger, etc. - par équipes, dans une ambiance décontractée :) !

Les tâches proposées portent cette année sur la détection et le traitement d’informations manifestement fausses, un sujet de préoccupation pour les médias et citoyens. Ces problématiques, nouvelles pour la société de l’information, soulèvent de nombreuses questions et nous essaierons de voir si des traitements RI et TAL peuvent y répondre, pour mieux comprendre les phénomènes en jeu et y réagir, plus rapidement et de manière plus adéquate, à l’aide d’algorithmes du domaine.

L’événement est ouvert à tous (informaticiens, linguistes, journalistes), ne nécessite aucune préparation particulière et ne requiert pas de compétences spécifiques aux tâches que nous proposons... tout le monde est bienvenu !

Tâches

1. Détection : repérer et catégoriser les fausses informations

Objectifs

Parmi les informations disponibles en ligne certaines sont manifestement fausses et il n’est pas évident de faire la part des choses, autant pour les médias, entreprises ou laboratoires (notamment à cause des volumes de données à traiter), que pour les citoyens : quels indices caractérisent les fausses informations ? L’objectif de cette tâche est de voir si des algorithmes TAL et RI sont capables de détecter et catégoriser finement ces fausses informations.

Sous-tâches

- parmi un ensemble de textes, déterminer automatiquement lesquels sont des faux (contrefactuels, détournés, trompeurs, parodiques),
- catégoriser les fausses informations parmi un ensemble de catégories prédéfinies (sites propagandistes, conspirationnistes, pseudo-science, satires),
- caractériser les faux d’un point de vue linguistique : quels modes d’expression, quelles tournures sont utilisées pour propager de fausses informations.

2. Visualisation : agrégation des fausses nouvelles pour une vision synthétique

Objectifs

Le traitement des fausses nouvelles soulève d’autres questions lorsque l’on tient compte des liens (informationnels, thématiques, linguistiques) entre ces dernières, ou au sein des médias et des réseaux sociaux. Certaines reprennent des fausses nouvelles déjà connues, les complètent ou les modifient. Il est aussi intéressant d’étudier les mécanismes de leur propagation sur des réseaux (statiques) ou sur les relations temporelles (dynamiques).

Sous-tâches

- regrouper les fausses nouvelles de manière non-supervisée ou peu supervisée,
- déterminer la structure d’un réseau de fausses nouvelles, pour identifier des liens orientés selon l’axe temporel et l’axe thématique,
- détecter des communautés (sites ou individus) qui propagent des fausses nouvelles.

Planning prévisionnel

Lundi 14 mai :
13h-14h : accueil et café
14h-15h : présentation du hackathon
15h-18h : développements en équipes
18h-19h : présentations invitées
19h-20h : cocktail dinatoire
- 20h-... : développements en équipes

Mardi 15 mai :
09h-10h : accueil et café
10h-12h : développements en équipes
12h-14h : déjeuner et café
14h-17h : développements en équipes
17h-19h : présentation des résultats
19h-21h : conclusion et cocktail

Organisation pratique

BYOD (amenez votre ordinateur)
Pas de critères pour participer, le hackathon est ouvert à tous !
Aucune préparation requise des participants en amont de l’évènement
Logiciels et données en ligne : https://github.com/HackaTAL/2018

Organisateurs

Kevin Deturck (Viseo / ERTIM)
Nicolas Dugué (LIUM)
Loïc Grobol (LaTTiCe)
Gael Guibon (LSIS, Caléa)
Charles Huyghues-Despointes (Bertin)
Damien Nouvel (ERTIM)
Benjamin Piwowarski (LIP6)
Ramon Ruti (Storyzi)
Raphaël Troncy (Eurecom)
Julien Velcin (ERIC)

MasterClass:
Dans ce cadre une "ARIA's Master Class" est organisée le vendredi 14 septembre. L'inscription est gratuite pour les adhérents de l'ARIA (c'est-à-dire à jour de leur cotisation 2018). 
Si vous n'êtes pas encore adhérent(e) au titre de l'année 2018 RDV rapidement ici : http://www.asso-aria.org/images/FichiersAssociation/Adhesion2018.pdf
Si vous souhaitez vous assurer ou vérifier que vous êtes bien adhérent (soit à titre individuel, soit à titre moral) vous pouvez contacter directement : Vincent Claveau (Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.)

Cette MasterClass est également ouverte gratuitement aux participants à CLEF 2018.

Le nombre de places étant limitées (30 places), nous vous conseillons, après avoir validé votre adhésion à l'ARIA ou votre inscription à CLEF, de vous inscrire au plus vite (cf site web de CLEF 2018).


Le programme de cette MasterClass est le suivant (sous réserve de modification) : 

08:30 – 09:00 Welcoming & Opening
09:00 – 10:30 The Art of evaluation in IR by Julio Gonzalo
10:30 – 11:00 Tea & Coffee Break
11:00 – 12:30 Personalization of Information Interaction by Nicholas Belkin
12:30 – 14:30 Lunch
14:30 – 18:30 Playing around with CLEF collections, Elastic Search and Kibana by Richard Dufour, Liana Ermakova, Vincent Labatut

 

L'association ARIA (http://www.asso-aria.org) propose des bourses a ses adhérents pour participer à la conférence CORIA 2018 qui se déroule à Rennes du 16 au 18 mai (ateliers le 14 et 15 mai) conjointement avec la conférence sur le Traitement Automatique des Langues Naturelles (TALN) >> cf.http://coria-taln-2018.irisa.fr.

L'objectif prioritaire est de permettre à des étudiants, post-docs ou jeunes docteurs qui ont un intérêt pour les travaux en Recherche d'Information d'assister à la conférence CORIA/TALN.  L'idée est également est de prendre en considération les situations individuelles particulières (notamment financières). 

Attention : cette bourse ne couvre que l'inscription à la conférence. Les frais de missions restent à la charge du laboratoire/équipe d'accueil du postulant.

Pour postuler à cette bourse, nous vous demandons de bien vouloir nous envoyer au plus tôt (et avant le 02 mai 2018) par voie électronique :

> Un lettre de motivation (en anglais ou en français) soulignant l'intérêt que le postulant a pour les travaux en Recherche d'Information. Il est demandé de préciser le statut du postulant (post-doc, thésard 1ere année, thésard 2eme année...) et éventuellement un lien vers un site web présentant les activités de recherche (site institutionnel, site DBLP...).

> Une attestation signée du directeur de recherche ou du responsable d'équipe qui, dans le cas où la bourse serait accordée, s'engage à financer la mission pour se rendre à Rennes pour participer CORIA/TALN 2018.

> Une attestation indiquant votre statut d'adhérent de l'association ARIA au titre de l'année 2018. Si vous n'êtes pas encore adhérent (à titre physique ou moral), vous pouvez en faire la demande dès à présent (toutes les informations sont données ici : http://www.asso-aria.org/images/FichiersAssociation/Adhesion2018.pdf). Attention, l'affection de la bourse ne pourra se faire que dès lors où la demande d'adhésion sera traitée.  

Merci d'envoyer les documents ci-dessus au plus vite à l'adresse : Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.

Les réponses seront données au fil de l'eau le plus rapidement possible et ce jusqu'à épuisement des bourses.

N'hésitez pas à me contacter pour toute information complémentaire.

Amicalement,

Max Chevalier 
Président de l'Association en Recherche d'Information et Applications.