Spécialiste du traitement automatique des langues, Benoît Sagot est directeur de recherche à Inria et titulaire d’une chaire à l’institut PRAIRIE (Paris Artificial Intelligence Research Institute). Il est professeur invité sur la chaire annuelle Informatique et sciences numériques du Collège de France, créée en partenariat avec Inria.
Sommaire
Cette leçon inaugurale lève le voile sur un domaine de recherche auquel il doit son existence, le traitement automatique des langues, ou TAL.
Pas à pas, l’auteur nous conduit à travers l’histoire du TAL afin de dégager les enjeux actuels de cette discipline aussi ancienne que l’informatique et qui s’efforce d’apprendre les langues aux machines.
Comment en est-on arrivé à l’apprentissage automatique, aux réseaux de neurones et aux modèles génératifs ? Quels aspects éthiques requièrent notre vigilance face à l’accélération de la recherche et de l’innovation ? En fin de compte, ChatGPT est-il vraiment une révolution ?
Sommaire
Traitement automatique des langues (TAL) • Les débuts du TAL • Approches symboliques • Approches par apprentissage automatique • Approches neuronales et apprentissage profond • Modèles génératifs et conversationnels • Limites et enjeux des grands modèles de langue • La quatrième révolution de l’accès à l’information
Extraits
Dès son ouverture au public, ChatGPT a vu son nombre d’utilisateurs croître à une vitesse sans précédent : un million d’utilisateurs en cinq jours, cent millions en deux mois, un milliard et demi en dix mois. L’intelligence artificielle, dont les progrès rapides obtenus au cours des dernières années avaient déjà attiré l’attention des médias, des décideurs et du grand public, a pris depuis un an une importance encore plus grande suite à l’arrivée de cet agent conversationnel. […]
Face à ces espoirs et à ces craintes, il me semble que toute réflexion sur l’intelligence artificielle gagnerait à s’appuyer sur une compréhension concrète de ce que sont les agents conversationnels comme ChatGPT, de la façon dont ils fonctionnent et, plus généralement, de l’état actuel des recherches et des technologies qui manipulent les données textuelles.
Collection
Le premier cours d’un nouveau professeur au Collège de France est sa leçon inaugurale.
Solennellement prononcée en présence de ses collègues et d’un large public, elle est pour lui l’occasion de situer ses travaux et son enseignement par rapport à ceux de ses prédécesseurs et aux développements les plus récents de la recherche.
Nombre de ces leçons inaugurales ont constitué, dans leur domaine et en leur temps, des événements marquants, voire retentissants. Elles s’adressent à un large public éclairé, soucieux de mieux comprendre les évolutions de la science et de la vie intellectuelle contemporaines. Publiées par le Collège de France sous forme de livrets depuis 1949, les leçons inaugurales ont fait l’objet pendant vingt ans d’une coédition avec Fayard (no 164 à 318). Depuis l’automne 2023, les livres savants, novateurs et prestigieux composant cette collection-phare de l’institution sont édités et commercialisés par les Éditions du Collège de France. Ils sont parallèlement diffusés sous forme numérique en accès ouvert freemium sur le portail OpenEdition Books.
Parution le 11 avril 2024
Apprendre les langues aux machines
Benoît Sagot
https://www.college-de-france.fr/fr/agenda/cours/apprendre-les-langues-aux-machines/representer-les-unites-textuellesf
Dernière modification le jeudi, 18 avril 2024