Analyse automatique de négations pour la radiologie et autres textes cliniques en français par modèles de langage

Salim Sadoune, Antoine Fraboulet, Antoine Richard, François Talbot, Loic Boussel, Hugues Berry

PFIA 2023, July 2023

Abstract

Nous présentons une approche d'apprentissage supervisé basée sur un modèle de langage de type BERT pour la reconnaissance automatique et la détermination de la portée de négations dans des comptes rendus médicaux en français. Sur un corpus de comptes rendus de scanners thoraciques annoté par nos soins, notre méthode obtient un score F1 global de 96.9%. Nous appliquons ensuite cette approche à des comptes rendus biomédicaux non radiologiques annotés de façon hétérogène. Dans ces conditions, notre méthode montre un score F1 global de 94.1%, confirmant ainsi son potentiel pour l'usage clinique.

Bibtex

@inproceedings{sadoune:hal-04165319,
  TITLE = {{Analyse automatique de négations pour la radiologie et
autres textes cliniques en français par modèles de
langage}},
  AUTHOR = {Sadoune, Salim and Fraboulet, Antoine and Richard, Antoine and Talbot, Fran{\c c}ois and Boussel, Loic and Berry, Hugues},
  URL = {https://inria.hal.science/hal-04165319},
  BOOKTITLE = {PFIA 2023},
  ADDRESS = {Strasbourg, France},
  YEAR = {2023},
  MONTH = {Jul},
  KEYWORDS = {Analyse des négations ; Modèles de langage ; Comptes rendus médicaux ; Reconnaissance d’entités nommées ; CamemBERT},
  PDF = {https://inria.hal.science/hal-04165319v1/file/IAS2023_paper_Sadoune.pdf},
  HAL_ID = {hal-04165319},
  HAL_VERSION = {v1},
  abstract = {Nous présentons une approche d'apprentissage supervisé basée sur un modèle de langage de type BERT pour la reconnaissance automatique et la détermination de la portée de négations dans des comptes rendus médicaux en français. Sur un corpus de comptes rendus de scanners thoraciques annoté par nos soins, notre méthode obtient un score F1 global de 96.9%. Nous appliquons ensuite cette approche à des comptes rendus biomédicaux non radiologiques annotés de façon hétérogène. Dans ces conditions, notre méthode montre un score F1 global de 94.1%, confirmant ainsi son potentiel pour l'usage clinique.}
}