Comment
Author: Admin | 2025-04-28
Mots qui ressortent en comparant les ouvrages d'un corpusdocfreq(dtm, scheme='inverse') 5- Afficher un wordcloud (un nuage de mots)On peut analyser un texte ou un corpus pour voir quels mots y apparaissent le plus :topfeatures(my_dfm[1])) # Quels mots sont les plus fréquents dans le doc 1 de mon corpusLe mieux est toutefois de le visualiser sous forme de diagramme en barres (barplot(topfeatures(my_dfm[1]))) ou d'un nuage de mots.Ou encore :my_tsf plot(my_tsf$frequency)text(x=2:15,y=my_tsf$frequency,labels=my_tsf$feature)textplot_wordcloud(my_dfm[3],min_count = 20,col=1:7) # Ici on n'affiche que les mots qui apparaissent plus de 20 fois# L'affichage s'est fait sur le 3ème document de mon corpus d'om le my_dfm[3]Nuage de mots réalisé sur les "Lettres de mon Moulin" d'Alphonse Daudet.Afficher les ngrams : association de 2 mots ou plus (paramètre n)N2 % dfm(.)textplot_wordcloud(N2,min_count = 10)Afficher les skipgrams : association de n mots dans un contexte de x mots (paramètres skip)N2 % dfm(.)textplot_wordcloud(N2,min_count = 10, col=1:10)NGRAM en skipgram sur l'oeuvre Bel Ami de Maupassant6- Identifier les mots caractéristiques : keynessIl est particulièrement intéressant d'identifier les mots qui caractérisent une oeuvre/un document par comparaison avec d'autres.C'est le rôle du keyness :tstat_key Méthode : "chi2" ; Très efficace."exact" (test exact de Fisher) ; "lr" pour le rapport de vraisemblance ; "pmi" pour l'information mutuelle ponctuelle. - s'intéresse aux mots rares plutôt que ceux à forte fréquence# Visualisertextplot_keyness(tstat_key)Résultats de keyness chi2 sur les "lettres de mon moulin" comparé à 5 autres œuvres.Le mieux est aussi de visualiser les résultats du keyness sous forme de wordcloud, en faisant une petite fonctionkeyness_wordcloud temp for (i in 1:n) {
Add Comment