Google+

L'ANALYSE DISTRIBUTIONNELLE

Grâce à l'analyse syntaxique, le moteur Synomia structure automatiquement le contenu sémantique intrinsèque du corpus                   

Le moteur Synomia construit une représentation sémantique du contenu analysé, en structurant l’ensemble des syntagmes extraits via une diversité de relations linguistiques. Il le fait de façon entièrement automatique et endogène, sans qu’il soit nécessaire de lui fournir de dictionnaires ou ontologies métiers.

En particulier, grâce à l’analyse syntaxique, le moteur Synomia fait émerger automatiquement du corpus analysé des classes sémantiques de mots et syntagmes, en regroupant ceux qui possèdent les mêmes contextes syntaxiques, c’est-à-dire qui sont sujet ou complément des mêmes verbes, compléments de mêmes noms, modifiés par les mêmes adjectifs.

Par exemple, à partir d’un corpus de textes portant sur la politique de la famille, le moteur construit une classe constituée des expressions : allocation chômage, RSA, pension de réversion, allocations familiales, indemnités journalières, car ces expressions apparaissent toutes dans le corpus comme compléments des verbes percevoir, verser, toucher, recevoir, etc., et compléments des noms paiement, montant, versement, calcul, etc. Le moteur Synomia extrait des dizaines de classes de ce type.

 


Synomia data_conseil_syntagme


La sémantique émerge du corpus via la syntaxe. C’est le principe de l’analyse distributionnelle prôné par le linguistique américain Zellig S. Harris (1909–1992) dans les années 1950.

Le moteur Synomia permet de découvrir le contenu sémantique d’un corpus de textes, sans a priori. Le moteur Synomia effectue l’intégralité des analyses quel que soit le corpus analysé et restitue un résultat prêt à consommer. Il n’est pas nécessaire de lui fournir des dictionnaires métiers, ni de customiser des règles d’extraction spécifiques.

La densité du réseau sémantique autour d’une expression indique quelle est son importance dans le corpus. Puisqu’il n’y a aucun filtre préalable sur la fréquence, on repère non seulement les tendances fortes et  mais aussi les signaux faibles, qui sont de fréquence faible, situés dans les zones moins denses du réseau mais connectées de façon linguistique à des pôles de forte densité sémantique.

 


Contact:

Maurice NDIAYEDirecteur du développement de Synomia

maurice.ndiaye@synomia.com

T / +33 (0)1 46 10 06 46

DES INSIGHTS REGULIERS SUR L’EXPLOITATION DU BIG DATA AU SERVICE DE VOTRE ENTREPRISE ?

NOUS CONTACTER

Synomia
63 bis rue de Sèvres
92100 Boulogne-Billancourt

Tel : +33 (0)1 46 10 06 40

Email :

Scroll to Top