Thérèse Vachon (INSA Lyon 74), ex-Global Head of Text Mining Services chez Novartis, aujourd’hui Senior Consultant en Text Mining, encourage les jeunes ingénieurs à déployer leurs talents au service des Big data et de l’Intelligence Artificielle.

 

En quoi consiste le Text Mining dans le secteur pharmaceutique ?

Il est utilisé pour analyser rapidement les publications des scientifiques, les chevauchements dans les essais cliniques… et découvrir des données implicites dans des quantités volumineuses de textes. À l’inverse du « Search », nous partons d’un ensemble de textes et notre travail consiste à découvrir automatiquement les sujets de ces textes, à extraire des concepts scientifiques et leur relations, à créer des descriptifs… Aujourd’hui, l’accès aux données devient clé et permet des analyses très approfondies.

Comment travaillez-vous ?

Dans mon équipe de 30 personnes basées à Bâle et aux Etats-Unis, nous développons des dictionnaires scientifiques de gènes, de protéines, de maladies ou de substances chimiques… pour le compte de -scientifiques de Novartis. Le plus souvent, on nous demande d’analyser des publications, de faire une recherche exhaustive de ce qui a été publié dans le domaine. J’ai sous ma direction des ingénieurs informaticiens, des spécialistes de l’intégration d’ontologies, des médecins, des biologistes, des généticiens, des chimistes. Mon rôle consiste à faire travailler tous ces profils ensemble.

Quelles aptitudes sont essentielles à ces travaux ?

Pour faire du Text Mining, il faut connaître la linguistique informatique (analyse sémantique et syntaxique de textes) et les méthodes d’analyses de textes. Il est possible de suivre un Mastère spécialisé/DEA, de préparer une thèse en linguistique informatique/machine learning/data science en complément de la formation d’ingénieur.

Dans quelle mesure les collaborateurs sont-ils acteurs de leur parcours ?

Novartis sponsorise un concours interne, Genesis Labs, permettant à chaque salarié de faire des propositions innovantes. S’il est sélectionné, il obtient un financement pour travailler pendant trois ans sur son projet. Cela peut concerner l’utilisation des données internes, les méthodes digitales ou la R&D.

(c) NOVARTIS

Si vous étiez étudiante, qu’est-ce qui vous ferait rejoindre le groupe ?

Je suis chez Novartis depuis 31 ans et j’ai déjà exercé plusieurs métiers que ce soit dans l’informatique centrale puis scientifique avec des applications diverses dans la recherche. Nous offrons des opportunités dans plus de 100 pays. Le mélange des cultures crée un climat qui engendre l’innovation. L’industrie pharmaceutique a besoin de data scientists, de data ingénieurs et de spécialistes en Text Mining et Intelligence Artificielle.

Fait-il bon vivre chez Novartis ?

Novartis a pour but de réinventer la médecine. En tant qu’employés, nous recevons tous les outils pour atteindre le meilleur de nous-mêmes, de prendre des risques intelligents et de tenir compte des échecs passés. Tous les associés savent faire preuve d’empathie, ont un œil sur le monde extérieur et sont à l’affût de nouvelles idées qui bénéficient aux patients. Grâce au « Work life balance », les collaborateurs peuvent aménager leur emploi du temps. Le campus de Bâle offre une quantité de services, restaurants et espaces sportifs. Enfin, Bâle est très bien desservi par l’autoroute et les transports en commun. N’hésitez plus à nous rejoindre !

L’INSA : en mode apprentissage: « Mes cours d’informatique, de logique formelle, d’algorithmique, de mathématiques, mais aussi de chimie et de physique m’ont permis d’entrer plus facilement dans l’industrie pharmaceutique. Le créateur du département informatique, Robert Arnal nous répétait souvent : « le plus important ce n’est pas de savoir, mais de savoir apprendre à apprendre ». Dans le domaine du Text Mining, on ne peut pas s’arrêter d’apprendre au risque d’être dépassé. »

 

Contact : nibr_basel.communications@novartis.com

Chiffres-clés : 1er groupe pharmaceutique mondial / 126 000 collaborateurs dans le monde (13 000 en Suisse) / 200+ projets actuellement en développement clinique