Journée commune de l'AFIA (Association Française pour l'Intelligence Artificielle) et de l'ARIA (Association francophone de Recherche d'Information et Applications)

2 décembre 2019, Sorbonne université, 75015 Paris
https://ia-ri.sciencesconf.org/

THÈME
-----------------------------------------------------------------------

Cette journée constitue la 3ème rencontre entre chercheurs en Intelligence Artificielle (IA) et en Recherche d'Information (RI). La première visait à mettre en évidence les problématiques communes et les approches proposées venant de l'une ou l'autre communauté, la seconde s’était focalisée sur l’extraction d’information pour le peuplement de bases de connaissances et l’annotation sémantique de documents.
Pour cette 3ème journée, nous prolongerons les discussions autour des bases de connaissances, et plus particulièrement des réseaux sémantiques (Knowledge Graphs). Ces graphes décrivent les entités du monde réel ainsi que les relations qui les lient, sans thématique particulière. Outre le fait qu’ils permettent de lier des bases de connaissances du Web des données (LOD), ils sont aujourd’hui utilisés dans de nombreux contextes, comme le question-réponse, l’annotation sémantique, l’analyse de sentiments ou encore la recherche Web.
Les problématiques autour d’eux sont nombreuses, et vont de leur construction à leur exploitation pour la découverte de connaissance, souvent en utilisant des techniques d’apprentissage profond et de plongements de noeuds/relations, aux problèmes de passage à l’échelle ou d’évolution temporelle des données.

Pour cette journée nous sollicitons des interventions qui présentent un état de l'art ou un tutoriel en relation avec ces thématiques, et qui disposeront d'un créneau de 30 à 45 mn.
Des présentations plus focalisées seront également considérées et disposeront d'un créneau de 20 à 30 mn.


Modalités de soumission
---------------------------------
Les propositions d'intervention sont attendues sous la forme d'un résumé d’une page environ au format texte ayant la structure ci-dessous à soumettre sur https://ia-ri.sciencesconf.org/


Titre de l'intervention :
Nature de l'intervention : synthèse, tutoriel, présentation courte
Auteur(s) :
Mots-Clefs :
Résumé ou plan de l'intervention : 1/2 à 1 page

Date limite de soumission : 16/10/2019 
Date de notification : au fil de l’eau

Coordinateurs de la journée
------------------------------------------------
Haïfa Zargayouna (LIPN, UMR CNRS, Université Paris 13),

Karen Pinel-Sauvagnat (IRIT, UMR CNRS, Université Toulouse 3),

Benjamin Piwowarski (LIP6, UMR CNRS, Sorbonne Université)

Thème : Recherche d'information et Apprentissage automatique

 

25-26 Mars 2019, Lyon, France

https://coria-earia2019.projet.liris.cnrs.fr/EARIA/

===============
L’école offre un cadre d’échange convivial tant autour des fondements théoriques de l’apprentissage automatique et de leur utilisation en recherche d’information et applications. Ces sujets sont abordés par des chercheurs et des industriels faisant autorité dans le domaine. Les participants auront également l’occasion de mettre en pratique les connaissances théoriques aux travers de : 1) séance de travaux pratiques sur l’utilisation d’environnement dédiés à l’apprentissage profond ; 2) le Hackathon qui est un projet fédérateur de mise en situation dans un domaine applicatif en lien avec la recherche d’information et l’apprentissage automatique. La réalisation du projet permet de produire un (des) prototype(s) qui sera (ront) présenté(s) lors d’une session de la conférence CORIA qui aura lieu au suivant de EARIA du 27-29 Mars 2019.
L’école s’adresse ainsi à un public de jeunes chercheurs, chercheurs et industriels intéressés par la conception de modèles d’apprentissage automatique pour la recherche d’information et applications, leur implémentation et leur évaluation empirique

===========================================================================
Programme EARIA’2019 : Recherche d’Information et Apprentissage Automatique
===========================================================================
***Lundi 25 mars***
8h30 - 8h45 : Ouverture (Lynda Tamine, IRIT)
8h45- 9h45 : Session 1 – Introduction à la Recherche d'Information (Mohand Boughanem, IRIT )
9h45 - 11h00 : Session 2 - Apprentissage pour la recherche d'information (Eric Gaussier, LIG)
11h00 - 11h30 - Pause
11h30 - 12h45 : Session 3 – Plongements lexicaux et réseaux de neurones (Benjamin Piwowarski, LIP6)
13h00-14H30 - Déjeuner
14h30 - 16h30 Session 4 : - Séance pratique (Benjamin Piwowarski, LIP6, José Moreno, IRIT)
16h30 - 17h00 - Pause
17h00 - 19h30 : Session 5 – Présentation Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT), lancement des activités
19h30-21h00 Dîner
21h00 – 22h30 : Session 6 – Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT)

***Mardi 26 mars***
8h30 - 9h45 : Session 7 – Machine learning for natural language understanding (Marie-Francine Moens ; Univ. Louvain, Belgique)
9h45 - 11h00 : Session 8 – Le Traitement Automatique des Langues appliqué à la recherche d’information ( Christophe Servan, Qwant)
11h00-11H-30 Pause
11h30 - 12h45 : Session 9 – Conversational search (Pierre-Emmanuel Mazaré, Facebook)
13h00 - 14h-30 Déjeuner
14h30 – 16H30 : Session 10 – Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT)
16H30 -17H : Pause
17h - 19h30 : Session 11 – Hackathon (Benjamin Piwowarski, LIP6 ; José Moreno, IRIT)
19h30- 21h00 : Dîner
===================================================================

Inscription : http://colloque.insavalor.fr/CORIAEARIA2019/Inscription.html

 

 

MasterClass:
Dans ce cadre une "ARIA's Master Class" est organisée le vendredi 14 septembre. L'inscription est gratuite pour les adhérents de l'ARIA (c'est-à-dire à jour de leur cotisation 2018). 
Si vous n'êtes pas encore adhérent(e) au titre de l'année 2018 RDV rapidement ici : http://www.asso-aria.org/images/FichiersAssociation/Adhesion2018.pdf
Si vous souhaitez vous assurer ou vérifier que vous êtes bien adhérent (soit à titre individuel, soit à titre moral) vous pouvez contacter directement : Vincent Claveau (Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.)

Cette MasterClass est également ouverte gratuitement aux participants à CLEF 2018.

Le nombre de places étant limitées (30 places), nous vous conseillons, après avoir validé votre adhésion à l'ARIA ou votre inscription à CLEF, de vous inscrire au plus vite (cf site web de CLEF 2018).


Le programme de cette MasterClass est le suivant (sous réserve de modification) : 

08:30 – 09:00 Welcoming & Opening
09:00 – 10:30 The Art of evaluation in IR by Julio Gonzalo
10:30 – 11:00 Tea & Coffee Break
11:00 – 12:30 Personalization of Information Interaction by Nicholas Belkin
12:30 – 14:30 Lunch
14:30 – 18:30 Playing around with CLEF collections, Elastic Search and Kibana by Richard Dufour, Liana Ermakova, Vincent Labatut

 

La 16è édition de CORIA (COnférence en Recherche d’Information et Applications) sera organisée à Lyon du 27 au 29 mars 2019, conjointement aux rencontres jeunes chercheurs en RI (RJCRI) et à l’école EARIA. Elle est la principale manifestation soutenue par l’Association Francophone de Recherche d'Information et Applications ARIA (http://www.asso-aria.org).

 

 

Calendrier

 

  • Soumission des résumés : 7 décembre 2018
  • Soumission des articles : 14 décembre 2018  
  • Notification : 8 février 2019
  • Version définitive des articles : 1er mars 2019
  • Conférence : 27 au 29 mars 2019

 

 

CORIA vise à rassembler les équipes et les personnes menant des travaux scientifiques dans le domaine de la recherche d’information et de ses applications : recherche d’information sur le web, sur les réseaux sociaux ou sur des collections spécifiques, systèmes de recommandation, fouille de documents, d’images, d’enregistrements audio, de vidéos, assistants personnels et chatbots…  Devenue activité quotidienne du grand public, la recherche d’information est essentielle à de nombreux usages du numérique.  L’activité scientifique et technologique associée ne cesse de croître en interaction avec d’autres domaines de l’informatique et d’autres disciplines, mathématiques, linguistique, sciences cognitives, mais aussi en lien direct avec l’industrie et les acteurs de l’internet, des média, de la culture, de la santé ou de l’éducation. Les modèles récents intégrent l’apprentissage automatique, la fouille de données, le traitement automatique des langues, le traitement de la parole et du signal, l'analyse d'images ou encore l’informatique affective.

 

La conférence CORIA est ouverte à l’ensemble de la communauté scientifique internationale concernée par la recherche d’information du point de vue théorique comme du point de vue des applications. Le public visé par CORIA est celui des chercheurs académiques, incluant les étudiants en master et doctorat, des industriels et de tous les spécialistes du domaine. Toutes les publications CORIA sont diffusées en accès ouvert sur le site de l’ARIA et sont indexées par DBLP.

 

Soumissions :

 

Les soumissions seront évaluées par au moins 3 membres du comité de programme. Elles devront être déposées via https://easychair.org/conferences/?conf=coria2019 selon les indications suivantes :

 

  • elles doivent être anonymes
  • la taille maximale des articles est de 16 pages hors références bibliographiques. Des articles de longueur inférieure peuvent être soumis sans que cela soit préjudiciable ;
  • CORIA accepte des articles en anglais pour des auteurs anglophones.
  • des articles déjà publiés en anglais peuvent également être soumis après traduction en français et adaptation à CORIA.

 

 

En 2019, 3 sessions spéciales feront l’objet d’une sélection spécifique :
* session "retour d’expérience": seront par exemple présentés des résultats de projets ou de compétitions, des tentatives de reproduction de résultats ou encore des expériences qui ont échoué (résultats négatifs) ;
* session  "industrielle" : articles à orientation technologique dans lesquels les aspects ingénierie ou transfert de technologie sont majeurs ;
* session "prise de position" : il pourra par exemple s’agir d’articles prospectifs, de présentations d’approches théoriques nouvelles ou de domaines scientifiques connexes qui pourraient bénéficier à la recherche d’information ou pour lesquels la recherche d’information pourra être une source d’innovation.
Pour ces sessions spéciales : lors de la soumission dans EasyChair, cocher la case corresponsante dans la section “Other Information and Files”.

 

Thèmes (liste non exhaustive) :
- Apprentissage et fouille pour la RI : apprentissage profond, apprentissage de représentations, apprentissage d'ordonnancement, classification
- Représentation de l’information : indexation, entités liées, multimédia, profils, bases de connaissances
- Compréhension de requêtes : intention de recherche, suggestion de requêtes, difficulté des requêtes, adaptation aux requêtes
- Interaction utilisateur : interrogation flexible, interfaces, visualisation, modélisation de l’utilisateur, du contexte et de l’usage, accessibilité, RI conversationnelle, personnalisation, RI collaborative
- Systèmes question/réponse, systèmes de dialogue et chatbots
- RI dans l’environnement nomade
- RI et Humanités Numériques
- RI interactive
- Traitement automatique de la langue naturelle écrite et orale pour la recherche d’information : résumé automatique, détection d’entités nommées et de relations, analyse de sentiments, fouille d’arguments...
- RI et connaissances :  web sémantique, web des données, ontologies
- RI pour les assistants personnels et/ou vocaux
- RI multilingue : recherche d’information multilingue, traduction automatique
- Passage à l’échelle : architectures, performance, compression
- Analyse du Web : grands graphes, utilisation de la topologie du web, lois de puissances, citations, analyse de liens
- Réseaux sociaux : analyse de réseaux, d’opinions, diffusion d’information, prédiction d’activités, détection d’événements
- Filtrage et recommandation
- Catégorisation de textes/images
- Extraction d’information
- Multimédia (image, audio, vidéos, sons, musiques) et texte : indexation, recherche, catégorisation, alignement, ...
- Systèmes de recherche d’information dédiés : recherche d’information génomique, géographique, médicale, recherche de brevets, RI pour les bibliothèques numériques
- Ressources et évaluation de la RI : évaluation, bancs d’essais, métriques, expérimentations qualitatives des systèmes

 

Au plaisir de vous retrouver à Lyon en mars prochain.

 

Président du comité de programme et contact:
Patrice Bellot, Aix-Marseille Université CNRS (LIS, UMR 7020)
 Fake ou pas Fake ?

Hackathon CORIA-TALN 2018
(hackathon en recherche d’information et traitement automatique des langues)

TL;DR

Tâches : détection et visualisation de fausses informations sur les réseaux
Site web : http://hackatal.github.io/2018
Dates : 14 et 15 mai 2018
Lieu : IRISA, Rennes
Inscription (gratuite mais obligatoire) : https://goo.gl/forms/soTeFTikjWol8bj13 !

Description

Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL). L’évènement porte sur des problématiques en RI et en TAL. L’objectif est de réunir les communautés scientifiques, et au delà, autour de défis à relever, pour modéliser, prototyper, coder, expérimenter, développer, tester, évaluer, échanger, etc. - par équipes, dans une ambiance décontractée :) !

Les tâches proposées portent cette année sur la détection et le traitement d’informations manifestement fausses, un sujet de préoccupation pour les médias et citoyens. Ces problématiques, nouvelles pour la société de l’information, soulèvent de nombreuses questions et nous essaierons de voir si des traitements RI et TAL peuvent y répondre, pour mieux comprendre les phénomènes en jeu et y réagir, plus rapidement et de manière plus adéquate, à l’aide d’algorithmes du domaine.

L’événement est ouvert à tous (informaticiens, linguistes, journalistes), ne nécessite aucune préparation particulière et ne requiert pas de compétences spécifiques aux tâches que nous proposons... tout le monde est bienvenu !

Tâches

1. Détection : repérer et catégoriser les fausses informations

Objectifs

Parmi les informations disponibles en ligne certaines sont manifestement fausses et il n’est pas évident de faire la part des choses, autant pour les médias, entreprises ou laboratoires (notamment à cause des volumes de données à traiter), que pour les citoyens : quels indices caractérisent les fausses informations ? L’objectif de cette tâche est de voir si des algorithmes TAL et RI sont capables de détecter et catégoriser finement ces fausses informations.

Sous-tâches

- parmi un ensemble de textes, déterminer automatiquement lesquels sont des faux (contrefactuels, détournés, trompeurs, parodiques),
- catégoriser les fausses informations parmi un ensemble de catégories prédéfinies (sites propagandistes, conspirationnistes, pseudo-science, satires),
- caractériser les faux d’un point de vue linguistique : quels modes d’expression, quelles tournures sont utilisées pour propager de fausses informations.

2. Visualisation : agrégation des fausses nouvelles pour une vision synthétique

Objectifs

Le traitement des fausses nouvelles soulève d’autres questions lorsque l’on tient compte des liens (informationnels, thématiques, linguistiques) entre ces dernières, ou au sein des médias et des réseaux sociaux. Certaines reprennent des fausses nouvelles déjà connues, les complètent ou les modifient. Il est aussi intéressant d’étudier les mécanismes de leur propagation sur des réseaux (statiques) ou sur les relations temporelles (dynamiques).

Sous-tâches

- regrouper les fausses nouvelles de manière non-supervisée ou peu supervisée,
- déterminer la structure d’un réseau de fausses nouvelles, pour identifier des liens orientés selon l’axe temporel et l’axe thématique,
- détecter des communautés (sites ou individus) qui propagent des fausses nouvelles.

Planning prévisionnel

Lundi 14 mai :
13h-14h : accueil et café
14h-15h : présentation du hackathon
15h-18h : développements en équipes
18h-19h : présentations invitées
19h-20h : cocktail dinatoire
- 20h-... : développements en équipes

Mardi 15 mai :
09h-10h : accueil et café
10h-12h : développements en équipes
12h-14h : déjeuner et café
14h-17h : développements en équipes
17h-19h : présentation des résultats
19h-21h : conclusion et cocktail

Organisation pratique

BYOD (amenez votre ordinateur)
Pas de critères pour participer, le hackathon est ouvert à tous !
Aucune préparation requise des participants en amont de l’évènement
Logiciels et données en ligne : https://github.com/HackaTAL/2018

Organisateurs

Kevin Deturck (Viseo / ERTIM)
Nicolas Dugué (LIUM)
Loïc Grobol (LaTTiCe)
Gael Guibon (LSIS, Caléa)
Charles Huyghues-Despointes (Bertin)
Damien Nouvel (ERTIM)
Benjamin Piwowarski (LIP6)
Ramon Ruti (Storyzi)
Raphaël Troncy (Eurecom)
Julien Velcin (ERIC)