Blog d'un jeune (chercheur) entrepreneur en TAL

Aller au contenu | Aller au menu | Aller à la recherche

Keyword - clustering

Fil des billets - Fil des commentaires

17mar.

Visualiser un espace à plusieurs dimensions en 3D

L'analyse en composantes principales (ACP) permet de calculer les hyperplans d'un espace vectoriel tel qu'une projection sur ces plans conserve un maximum d'entropie. Cette approche permet entre autres choses de projeter des espaces ayant un très grand nombre de dimensions dans des espaces de dimensions réduites tout en limitant la perte d'information.

L'utilisation combinée de scikit-learn et de matplotlib permet de produire très rapidement des réductions de dimension et de les visualiser. J'utilise ces bibliothèques pour visualiser dans un espace à 2 ou 3 dimensions des espaces vectoriels correspondant à des représentations de documents à l'aide de traits particuliers.

Lire la suite

29juin

Regroupement automatique de pages d'un wiki (1ère Partie)

Le Wiki est une invention totalement géniale qui permet de construire très rapidement une incroyable quantité de pages... toutefois cette quantité de pages dans son ensemble est souvent peu structurée ! Pour le wiki de Nantes-Wireless, j'ai décidé de mettre en place une technique de structuration automatique. Première tentative : clusterisation basée sur une distance lexicale.

Lire la suite