TreeCloud a un nouveau site web sur treecloud.org !
Le nuage arboré de mon rapport d'avancement de première année de thèse.
En décembre 2007, Jean Véronis a
construit sur son blog
un nuage de mots organisés en arbre pour refléter la proximité sémantique des mots
à l'intérieur d'un corpus d'articles de presse.
Le programme ci-dessous,
TreeCloud, est un prototype (à utiliser
à vos risques et périls...) qui
permet de construire de tels
nuages arborés pour un texte quelconque.
Les intérêts sont variés : visualisation rapide du contenu global d'un texte (rapport, livre...),
analyse littéraire, comparaison de textes par comparaison de leurs nuages arborés.
Pour en savoir plus, allez écouter
ce diaporama (en anglais)
ou voir
celui-ci en français.
A propos de l'utilisation en analyse littéraire, un exemple d'analyse comparative des
pièces
Cinna et
Othon de Corneille, menée avec TreeCloud et Lexico3,
est disponible
dans cet article.
Si vous utilisez TreeCloud, merci de citer cette page ou bien :
Philippe Gambette, Jean Véronis :
Visualising a Text with a Tree Cloud,
IFCS'09
(
matériel supplémentaire).
Pour des suggestions, des questions,
ou des demandes de fonctionnalités ou rapports de bugs sur TreeCloud, etc.,
contactez-moi,
ou bien laissez un message sur
le
blog de Jean Véronis ou
le mien.
Téléchargements
- TreeCloud 1.3 (13/12/2009) :
téléchargez l'archive Treecloud1.3.zip,
(pour l'utiliser,
Python2.X, Java, et
SplitsTree 4.10 doivent être installés
sur votre système)
et décompressez-la dans n'importe quel dossier de votre ordinateur.
Cette archive contient les fichiers suivants :
- Treecloud.exe, une
interface graphique Windows pour appeler les scripts ci-dessous avec les
bons paramètres.
- Treecloud.py,
le script Python principal.
- TreecloudFunctions.py,
une librairie de fonctions Python utilisée par Treecloud.py.
- manuel d'utilisation
de Treecloud (en anglais), pour en savoir plus sur l'installation et l'utilisation
du programme.
- antidico anglais, français (adapté depuis l'antidico du logiciel Dico), allemand (d'autres antidicos ici).
- HISTORY.txt, historique des versions (en anglais).
- COPYING.txt, la licence GPL (en anglais)
- pour déterminer la localisation dans le texte des mots qui apparaissent dans le nuage arboré,
vous pouvez utiliser l'utilitaire AntConc
(en particulier l'onglet "Concordance plot").
-
Cooccurrence,
un programme de Jean-Charles Bontemps, optimisé en C pour
un calcul rapide du fichier nexus des cooccurrences.
Une interface web
en version beta pour créer les nuages arborés est aussi disponible
sur son site.
-
Programme TreeCloud 0.6 pour Windows
(sources Delphi 6 - en particulier
UPGMA et EqualAngle commentés ici, dans les fonctions
UPGMA, sortLeaves, computeDrawing et draw,
historique des versions).
L'utilisation de ce programme est tout à fait déconseillée dans cette version 2.6.
Une version facile à utiliser de TreeCloud est disponible
dans l'archive Treecloud.zip :
lancez Treecloud.exe et choisissez les paramètres voulus, utilisez le
manuel utilisateur en cas de problème.
Citations, utilisations...