Analyse des sentiments - Astuces Excel

Analyse des sentiments dans Excel! Il existe un complément gratuit de Microsoft Labs qui vous permettra d'effectuer une analyse des sentiments dans Excel. Et si vous deviez parcourir des centaines de commentaires d'enquête pour voir ce que les gens pensent de votre entreprise? Excel peut attribuer une probabilité indiquant à quel point chaque commentaire est positif ou négatif.

Regarder la vidéo

  • Il est facile de quantifier les données d'enquête lorsqu'il s'agit de choix multiples
  • Vous pouvez utiliser un tableau croisé dynamique pour déterminer le pourcentage de chaque réponse
  • Mais qu'en est-il des réponses textuelles de forme libre? Ceux-ci sont difficiles à traiter si vous en avez des centaines ou des milliers.
  • L'analyse des sentiments est une méthode automatisée permettant de prédire si une réponse est positive ou négative.
  • Microsoft propose un outil qui effectue l'analyse des sentiments dans Excel - Azure Machine Learning.
  • L'analyse traditionnelle des sentiments nécessite qu'un humain analyse et catégorise 5% des déclarations.
  • L'analyse traditionnelle des sentiments n'est pas flexible - vous reconstruirez le dictionnaire pour chaque secteur.
  • Excel utilise le Lexique de subjectivité MPQA (lisez à ce sujet sur http: // bit. Ly / 1SRNevt)
  • Ce dictionnaire générique comprend 5097 mots négatifs et 2533 mots positifs
  • Chaque mot se voit attribuer une polarité forte ou faible
  • Cela fonctionne très bien pour les phrases courtes, telles que les Tweets ou les publications Facebook
  • Il peut être trompé par les doubles négatifs
  • Pour installer, accédez à Insertion, Excel Store, recherchez Azure Machine Learning
  • Spécifiez une plage d'entrée et deux colonnes vides pour la plage de sortie.
  • L'en-tête de la plage d'entrée doit correspondre au schéma: tweet_text
  • Article complémentaire sur: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transcription vidéo

Apprendre Excel à partir du podcast, épisode 2062: Analyse des sentiments dans Excel

Oh hé, c'était une nuit de Thanksgiving et nous étions assis autour de la tarte à la citrouille et Jes, ami à nous, a commencé à parler de faire une analyse des sentiments sur les données Twitter. Et j'ai dit: "Hé, vous savez qu'Excel a un moyen de faire une analyse des sentiments." Et j'ai réalisé que je n'avais pas de bonne vidéo sur ceci ou sur aucune vidéo à ce sujet, donc cette vidéo concerne l'analyse des sentiments dans Excel.

Maintenant, la première question est: qu'est-ce que l'analyse des sentiments? Et si vous faites une enquête auprès de vos clients et qu'ils ont une sélection à choix multiples où ils peuvent choisir de 1 à 5, eh bien, c'est vraiment très facile à analyser. Vous pouvez simplement créer un petit tableau croisé dynamique: Insérer un tableau croisé dynamique, feuille de calcul existante ici, cliquez sur OK. Nous voulons savoir la question là-bas ou la réponse à la question, puis combien de réponses il y avait pour chacune d'elles, et cela nous donne le nombre absolu. Vous pouvez même venir ici et changer cela de Paramètres de champ à Afficher les valeurs en tant que% du total de la colonne, comme ça.

Très bien, vous pouvez donc voir pour chaque réponse quel pourcentage de personnes obtient une réponse. D'accord, mais l'analyse des sentiments est utilisée lorsque vous avez une réponse très longue dans laquelle vous dites: "Hé, d'accord, et bien vous savez, dites-nous pourquoi vous nous avez donné cette réponse?" Et ils, vous savez, utilisent des phrases ou des paragraphes. Eh bien, si vous en avez des centaines ou des milliers, il est très difficile pour quelqu'un de les parcourir, de les lire tous et de comprendre ce qui se passe, d'accord?

Il existe donc deux types différents d'analyse des sentiments. Dans le passé, vous utilisiez généralement un algorithme d'apprentissage supervisé par l'homme. Donc, si vous avez 5 000 réponses, parcourez, vous savez, 200 d'entre elles et choisissez les mots et les phrases positifs et négatifs. Vous construisez essentiellement un dictionnaire des mots positifs et négatifs; mais, vous savez, c'était très limitatif. Si vous avez fait cela pour un endroit qui faisait de la réparation automobile et qui avait ensuite un client différent, vous savez, qui faisait du nettoyage de tapis, ces deux dictionnaires sont complètement différents. Vous devez faire l'apprentissage automatique ou l'apprentissage supervisé par l'homme encore et encore. Donc, Excel utilise cette chose appelée le Lexique de subjectivité MPQA et vous pouvez aller sur Google. Il a des informations à ce sujet - 5 097 mots négatifs, 2533 mots positifs. Et donc,cela fonctionne très bien pour les phrases courtes, les Tweets ou les publications Facebook. Mais une chose que j'ai remarquée, c'est que si quelqu'un écrit en double négatif, je ne peux pas dire que je ne déteste pas cette fonctionnalité, eh bien, l'apprentissage automatique échouera là-bas. Et diable, j'échoue. Je ne peux pas dire s'ils sont heureux ou non.

Très bien, alors voici ce que nous faisons. Dans Excel 2013 ou Excel 2016, accédez à l'onglet Insertion, accédez au Store, lorsque le champ de recherche apparaît, recherchez Azure Machine et vous obtenez Azure Machine Learning directement. Nous cliquons sur Ajouter. D'accord, et deux outils différents ici: le Titanic Survivor Predictor, qui est amusant; et le complément Excel d'analyse des sentiments de texte. Utilisons celui-là. Très bien, voici quelques trucs qui vous feront trébucher. Votre titre: prenez un paragraphe pour expliquer votre réponse. Il doit correspondre au schéma et le schéma indique que l'en-tête doit indiquer tweet_text. Donc, ici: tweet_text, bien sûr, les questions sensibles à la casse, d'accord. Et puis fermez le schéma, puis prédire, Entrée: A1 à 100, Mes données ont des en-têtes, Sortie: DataB1, Inclure les en-têtes. Ils vont nous donner 2 colonnes.Assurez-vous que vous avez 2 colonnes vides ici; sinon, il remplacera les données. Vous avez 2 choix: quelques lignes à la fois ou en lot. C'est juste une centaine, donc ça n'a vraiment pas d'importance. Je choisirai Predict et BAM! Juste aussi vite.

Très bien maintenant, nous obtenons 2 colonnes: nous obtenons un sentiment et un score, d'accord. Donc, représentons les scores ici sous forme de pourcentages avec un tas de décimales. D'accord, donc 47.496, cela passe de 0 à 100%. Près de 100 est extrêmement positif, près de 0 est extrêmement négatif, d'accord? Donc ici, nous en avons un où il y a un problème mineur, me rend fou. Vous ne trouvez pas la solution, vous pouvez donc voir pourquoi cela est considéré comme extrêmement négatif. Regardons celui qui est extrêmement positif. Très bien, donc vous le savez, nous avons donc quelques mots heureux ici: merci et merci, points d'exclamation, etc. Cela pourrait contribuer au score élevé. D'accord, alors est-ce parfait? Non, mais cela vous donnera un moyen rapide et rapide de vous dire, vous savez, combien de personnes sont extrêmement satisfaites ou extrêmement négatives de ces réponses.

Et bien sûr, encore une fois, nous pouvons le faire ici avec un tableau croisé dynamique: Insertion, Tableau croisé dynamique, accédez à une feuille de calcul existante ici, cliquez sur OK, et nous sommes intéressés par le sentiment, puis peut-être avec le score moyen pour chacun de ceux-ci. Nous allons donc changer cela sous Paramètres de champ pour être une moyenne, cliquez sur OK. Et donc, ou peut-être même un comte. Je suppose que nous voudrions connaître le comte, combien de personnes. Nous allons donc prendre un autre domaine, et ainsi, nous savons combien de personnes étaient négatives. Ooh, combien de personnes étaient neutres, combien de personnes étaient positives et quel était le score moyen de chacune d'elles.

D'accord, donc si vous avez des données d'enquête et qu'il s'agit d'un choix multiple, il est facile d'utiliser un tableau croisé dynamique pour déterminer le pourcentage de chaque réponse. Mais pour les réponses textuelles de forme libre, c'est difficile à traiter. Si vous en avez des centaines ou des milliers, l'analyse des sentiments est une méthode automatisée pour prédire si une réponse est positive ou négative. Microsoft propose un outil gratuit pour cela. Fonctionne dans Excel 2013 ou Excel 2016, appelé Azure Machine Learning. Doit généralement passer par et classer 5% des déclarations manuellement à la main. Ce n'est pas flexible, vous devez recatégoriser pour chaque nouvel ensemble de données, mais Excel utilise ce lexique de subjectivité MPQA. C'est un dictionnaire générique. Cela fonctionnera pour des phrases courtes, des tweets, des publications Facebook. Je peux me laisser berner par les doubles négatifs. Alors allez simplement dans l'Excel Store,recherchez Azure Machine Learning. Spécifiez une entrée et deux colonnes pour une plage de sortie. N'oubliez pas de changer l'en-tête pour qu'il corresponde au schéma, tweet_text, dans ce cas particulier.

Très bien, alors voilà. La prochaine fois que vous aurez une grande quantité de données à analyser, utilisez Azure Machine Learning, le complément gratuit pour Excel 2013. Merci d'être passé, nous vous verrons la prochaine fois pour un autre netcast à partir de.

Télécharger un fichier

Téléchargez l'exemple de fichier ici: Podcast2062.xlsm

Articles intéressants...