ESSLLI 2016 : source d’inspiration pour Semios

Publié le Publié dans Semios

Ces derniers mois ont été riches en événements scientifiques : 2 articles acceptés, première présentation devant un public extérieur à mon laboratoire, retours positifs vis-à-vis du contenu de mon travail… Maintenant, le mois d’août se referme sur la 28ème édition de l’université d’été ESSLLI (European Summer School of Logic, Language and Information). Cet événement s’est tenu pendant 15 jours sous le soleil intense et les orages qui se sont déchaînés entre les montagnes de Bolzano.

Terrasse bien connue des participants d'ESSLLI 2016
Terrasse bien connue à Bolzano

 

ESSLLI : Université d’Été Européenne en Logique, Linguistique et Informatique

ESSLLI est une université d’été qui se déroule tous les ans dans un pays différent. L’objectif y est d’étudier les apports et combinaisons de connaissances issues de 3 disciplines majeures. Ces thèmes de recherche rassemblent donc principalement des Européens, parmi lesquels des professionnels de ces champs de recherche et d’application. J’y ai également rencontré des philosophes et mathématiciens sensibles au contenu annoncé par le programme. Cette diversité de profils a permis des échanges riches  pendant ou après les présentations.

https://drive.google.com/open?id=1DOZocjaKEjeZ9Ref8nVp1bFaXzY&usp=sharing

si P= 100% Alors f(principalement)= ¬P

La confrontation intellectuelle de différentes écoles ou habitudes de travail a déclenché plus d’une exclamation très positive. Je pense notamment à une intervention qui illustre avec justesse la volonté de transmission de savoirs et d’interaction des participants d’ESSLLI. À la fin du cours Sentence comprehension […], une personne présente dans l’amphithéâtre a simplement suggéré de prendre le problème à l’envers, ou plus exactement d’inverser l’ordre des séquences d’évaluation pour mieux mesurer l’impact de certains facteurs. Cette idée a provoqué un réel enthousiasme chez les chercheurs qui présentaient leur travail, déclenchant une proposition spontanée de collaboration.

 

Cours quotidiens

Très rapidement, j’ai découvert que suivre 4 cours par jour + les séminaires de soirée pendant une université d’été est assez ambitieux. Je m’en doutais, raison pour laquelle je ne m’étais pas inscrite à une session supplémentaire le week-end. Ma stratégie était de tenir le rythme jusqu’à la fin, sachant que je pouvais sans doute m’inscrire par la suite si je voulais me pencher sur la question de la grammaire formelle. La concentration et l’assiduité sont bien entendu requises pour bénéficier des apports d’ESSLLI. Cependant, certains intervenants attendent des prises d’engagement plus poussées, comme l’utilisation de programmes en direct ou la réalisation d’exercices entre 2 sessions.

Le nombre de personnes impliqué dans ces tâches m’a impressionnée. Curiosité et l’envie de progresser sont définitivement des traits de caractère qu’on peut identifier chez la majorité des participants.

 

Sans distinction de niveau conceptuel, ni recherche d’exhaustivité, grâce aux cours dispensés pendant ces 2 semaines, j’ai appris :

  • Comment on pouvait construire son propre twitterBot. Je ne l’ai pas expérimenté moi-même, mais j’ai désormais une vision globale du processus de mise en place et de la diversité des bots (au moins ceux qui s’appuient sur des techniques de TAL) qui peuplent Twitter. Rien que pendant le dernier cours, près de 10 bots ont vu le jour.
  • Qu’il était possible de représenter les familles de langues sous forme d’arbres phylogénétiques grâce à R.
  • Que d’un point de vue aspectuel, quand on s’intéresse au temps sémantique et référentiel des verbes, le japonais et l’allemand s’opposent ; respectivement “from objects to eventualities” et “from eventualities to objects”.
  • Ce qu’est un “samovar” et que, à l’image de l’apprenant humain, une machine peut s’appuyer sur les contextes d’un mot pour en deviner le sens

 

Workshops et séminaires de soirée

J’ai assisté à deux séries de workshop (DSALT et Referential Semantics) portant sur la sémantique distributionnelle selon des axes et des niveaux d’avancement très variés. J’aurais également aimé participer au workshop COMPOSES, mais pour cette fois je me contenterai des ressources disponibles en ligne.

 

Répartition des champs dans lesquels s'inscrivent les présentations du workshop DSALT - ESSLLI 2016
Répartition des sous-champs dans lesquels s’inscrivent les présentations du workshop DSALT

 

Quatre intervenants ont animé nos soirées du mardi et du jeudi pendant près d’une heure chacun. La session qui m’a le plus marquée est celle de Marco Baroni. Mes recherches s’inspirent, partiellement, de ses travaux, ce qui avait créé un sentiment d’attente depuis le moment où j’ai appris qu’un des séminaires lui était réservé. À la question “Will computers ever be able to chat with us?”, ses pistes de réponses étaient variées, techniquement convaincantes et intellectuellement intéressantes.

 

Parmi les moments saillants de sa présentation, je pense que 2 ont été visiblement bien accueillis par le public

  • Le premier concerne le moment où il devient clair qu’espérer être capable de prédire la prochaine phrase – comme on peut prédire le prochain coup sur le modèle d’AlphaGo – est voué à l’échec.

 

When meaning steps out of semantics at ESSLLI
When meaning steps out of semantics

 

  • L’autre moment qui a soulevé un point important a été la question de l’identité d’une machine à qui l’on donne le langage :

Human: what is your job?

Machine: I’m a lawyer.

Human: what do you do?

Machine: I’m a doctor

L’exemple est tiré des travaux de Vinyal & Le (2015) pour concevoir un chat-bot à partir d’un modèle neuronal. L’analyse de Baroni est cinglante : “If you are a corpus of several million words, you can very well be a lawyer and a doctor”. Il conclut sa présentation en expliquant que tant que certains phénomènes linguistiques ne seront pas maîtrisés par le TAL, il sera impossible d’avoir une conversation qui procure un sentiment de satisfaction, même faible, avec une machine.

 

Aspects relationnels et culturels

Le groupe qui s’est formé spontanément au cours des premiers jours de cette école d’été a continué son expansion jusqu’à la fin. Les rencontres et discussions se sont donc renouvelées sans monotonie. Pour la plupart d’entre nous, il s’agissait d’une première participation à ESSLLI, voire à une école d’été. Pour d’autres, c’était déjà une habitude, à l’image de Julian qui réitérait l’expérience pour la 4ème fois. Et contrairement à mon intuition, l’avancement universitaire n’est pas corrélé avec le nombre de participations, tout comme les conditions de participation sont presque aussi nombreuses que les participants. Parmi ce qui m’a le plus marqué dans notre micro-société, c’est la tolérance générale qui a régné tout du long, malgré des interactions déstabilisantes pour certains. Les prises de parole naturelles n’ont jamais déclenché de tensions malgré la sensibilité de certains à des propos qui auraient pu être qualifiés de brutaux ou impolis. Au contraire, les remarques du type “What you said was a little rude but it was funny” ont été prononcées régulièrement, désamorçant tous les malentendus potentiels.

Les temps non consacrés aux cours et séminaires ont été particulièrement mis à profit pour découvrir la région (Venise, la montagne, des lacs, quelques musées, châteaux et centres culturels).

 

Un des sujets de conversation préférés à ESSLLI 2016
Piramidi di Terra / Erdpyramiden

“Staying in Bolzano is like living in a parallel corpus” (Baroni, 2016)

 

C’est ainsi que j’ai découvert que j’étais dans la région d’Ötzi, a.k.a the Iceman, a.k.a Hibernatus, un homme qui a vécu il y a plus de 5 000 ans et qu’on a retrouvé conservé dans la glace. Aujourd’hui encore son corps dépend du taux d’humidité et de la température sélectionnés par les scientifiques qui s’intéressent à tout ce qu’il peut nous apprendre, notamment sur l’âge de cuivre.

– Have you met Ötzi?
– No, how is he?
– Pretty cool

Le running gag de ceux qui sont allés au musée d’archéologie

 

Lectures et conseils

Fidèle à sa promesse, ESSLLI a été riche en enseignements. En plus des cours et séminaires, chaque conversation a été à l’origine de nouvelles idées, de conseils de lecture ou de méthodes de travail. Par exemple :

  • On m’a vivement déconseillé de tenir compte des indications de WordNet concernant la généricité des termes contenu dans les corpus de spécifications à ma disposition.
  • L’alternative proposée consisterait à s’appuyer uniquement sur les données-sources (i.e. les spécifications) et pourrait fonctionner à partir de plus gros corpus.
  • Avec mon directeur de thèse nous envisagions de proposer un sujet de recherche niveau master qui consisterait à faire une étude comparative de différentes approches pour construire des corpus à partir du web. Au cours d’une discussion, j’ai découvert l’existence d’un 3ème système (Topicrawler) et j’ai rencontré un de ses auteurs (sources et publication). Il va donc falloir réfléchir à intégrer ces travaux au banc de test en cours d’élaboration.
  • Si vous vous intéressez à l’analyse distributionnelle mais que les concepts fondateurs vous échappent, je vous recommande “Singular Value Decomposition Tutorial” de Kirk Baker. J’en profite pour remercier Fabrizio qui m’a fait découvrir cet ouvrage très simple d’accès. Désormais je sais qu’un vecteur à 1 000 dimensions – quand il s’agit d’un mot observé dans le cadre de l’analyse distributionnelle – est un vecteur qui est défini selon 1 000 types de contextes.
  • J’ai également sympathisé avec Esther, une linguiste informaticienne experte de Twitter. J’ai pu observer son aisance en programmation python et en explication de ce qu’elle veut faire faire à son code. En 1h30, elle a créé HungryArt, un bot qui associe le début d’un plat et la fin d’un titre de tableau (en faisant appel à 2 listes distribuées librement sur internet) en connectant le tout sur les conjonctions de coordination. Je lui ai donc déjà annoncé que je la contacterai le jour où je me lancerai dans la conception de mon propre bot ! Si ça vous intéresse aussi, voici une page qui contient suffisamment de ressources pour se lancer.

 

Bonus : ESSLLI 2016 a fait honneur à la tradition du match de football Lecturers vs. Students

 

Si vous avez participé à ESSLLI cette nnée et que vous connaissez le score final, n’hésitez pas à me le faire savoir !
Si vous connaissez le score final, n’hésitez pas à me le faire savoir !

Merci à tous les organisateurs et participants pour l’ambiance studieuse et propice aux échanges passionnés qui ont rythmé la vie de cette école d’été ! Et merci aux arroseurs automatiques du parc de Bolzano de nous avoir épargnés. Jusqu’au dernier soir…

Pourvu que la prochaine édition relève le défi de faire au moins aussi bien, en tout cas, j’y travaillerai. Alors…

RDV à Toulouse du 17 au 28 juillet 2017 !

Enregistrer

Enregistrer

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *