Comparaison de résumés linguistiques - Pôle Systèmes Humains-Machines
Communication Dans Un Congrès Année : 2024

Comparison of Linguistic Summaries

Comparaison de résumés linguistiques

Résumé

When tabular data cannot be directly mined, due to their size or for privacy reasons, their summary may still be available for analysis. The approach proposed in this paper provides users with a linguistic description of the data changes between the fuzzy linguistic summaries of two datasets. A first strategy processes exhaustive summaries containing one sentence for each of the subspaces that can be formed using terms from the vocabulary. A second strategy is proposed for condensed summaries, that involve informative sentences only. Experimentation conducted on artificial datasets confirm the relevance of this second strategy in terms of computational cost and informativity of data changes that can be tracked.
Même lorsque des données tabulaires ne peuvent pas être exploitées directement, à cause de leur volumétrie ou du fait de leur caractère privé, il est possible que leurs résumés soient disponibles pour réaliser des analyses. Cet article propose de fournir des descriptions linguistiques des différences majeures entre deux jeux de données compatibles, c'est-à-dire qui traitent le même sujet. Une première stratégie exhaustive est proposée en générant une phrase décrivant les différences dans chaque sous-espace induit par le vocabulaire flou sur lequel sont construits les résumés. Une seconde stratégie est ensuite proposée pour les résumés condensés, qui ne contiennent que des phrases informatives. Les expériences réalisées sur des données artificielles confirment la pertinence de cette seconde stratégie en termes de coûts de calcul et d'informativité des changements identifiés.
Fichier principal
Vignette du fichier
COPILS__COmParIson_of_Linguistic_Summaries.pdf (446.89 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04743194 , version 1 (18-10-2024)

Identifiants

  • HAL Id : hal-04743194 , version 1

Citer

Marie-Jeanne Lesot, Grégory Smits. Comparaison de résumés linguistiques. Recontres francophones sur la Logique Floue et ses Applications, Nov 2024, Brest, France. ⟨hal-04743194⟩
29 Consultations
19 Téléchargements

Partager

More