Wir stellen vor: Iris - Ein KI-Analyst für bessere Insights. Sehen Sie Iris in Aktion
Marketing

Veröffentlicht 15. Oktober 2018

Interview mit Paul Siegel: Tipps für die Fragestellung bei der Datenanalyse

Manchmal kann das Formulieren von Fragen, welche die Grundlage einer jeden Datenanalyse bilden, der schwierigste Teil für einen Analysten sein. Im Interview mit Data Scientist Paul Siegel sprechen wir über die besten Vorgehensweisen und Methoden.

Freitagnachmittage sind nicht unbedingt mein Lieblingszeitpunkt für Diskussionen (außer sie finden in einer Bar statt), aber als ich mit meinem geschätzten Kollegen, Data Scientist Paul Siegel, telefonierte, wusste ich, dass es interessant werden würde.

Der Grund für unser Telefonat war es, Fragen zu diskutieren: Welche Fragen sind die besten Fragen, um diese mit Social-Media-Daten beantworten zu können? Ist es möglich, zu viel Zeit mit der Formulierung von Fragen zu verbringen und nicht genug Zeit mit der Analyse? Gibt es Raum für Kreativität?

Es wurden viele Fragen über Fragen gestellt. In diesem Artikel zeigen wir, wie Analysten das Beste aus Social Intelligence herausholen können, indem sie in der Phase der Frageerstellung eine starke Grundlage schaffen.

Gute Fragen stellen

Was macht eine gute Frage für Social Intelligence aus? Paul sagt:

„Gute Fragen für Brandwatch und unsere Kunden sind Fragen, die ein Gleichgewicht zwischen zwei Faktoren einhalten – eine Frage, die ein Problem in Bezug zum Unternehmen anspricht und eine Frage, die eine tatsächliche, handfeste Antwort liefern kann – eine Frage, die mithilfe von Tests und Experimenten bewertet werden kann.“

Dazu fallen mir die 5 W-Fragen ein, die ich in meiner Journalistenausbildung lernte: Wer? Was? Wann? Warum? und Wie? – Welche von diesen sind die besten Fragen, die wir mit Social-Media-Daten beantworten können?

Es gibt drei Hauptkomponenten von Social-Media-Daten sagt Paul:

  1. Das informative Element – Der Text und die Worte, die wir posten
  2. Das menschliche Element – Wer wir sind und was wir machen
  3. Das zeitliche Element – Die temporeiche Natur und unsere Fähigkeit, die Welt sofort auf dem Laufenden zu halten, wenn etwas geschieht

Wenn wir Social-Media-Daten als die interessante Verflechtung von all diesen Dingen betrachten, dann erscheinen das wer, was und warum als die passendsten Fragen, mit denen wir starten können.

Das stellt eine interessante Gegenüberstellung zu den Suchdaten dar, bei denen das „Was“ die primäre Startfrage ist. Der Unterschied zwischen Such- und Social-Media-Daten ist, dass der Analyst bei den Suchdaten das was erhält und bei den Social-Media-Daten das warum.

Paul stimmt zu und verdeutlicht das an einem Beispiel mit Käse.

“Social-Media-Daten können zeigen, dass es einen Aufwärtstrend bei den Gesprächen über Käse gibt, genau wie es Suchdaten aufzeigen. Aber Social Media kann aufzeigen, warum sich die Gespräche über Käse verändern. Vielleicht nahmen die Gespräche in einer bestimmten Demographie zu, vielleicht reden die Leute über eine bestimmte Sorte von Käse zu einer bestimmten Tageszeit.“

Die beiden Quellen können beide betrachtet werden, um branchenrelevante Fragen zu beantworten.

Geeignete Fragen aus Anfragen von Nicht-Analysten erstellen

Ich stellte Paul vor ein Szenario: Du erhältst als Analyst von einem Mitglied eines anderen Teams die Anfrage, ob Social-Media-Daten zu einem bestimmten Thema analysiert werden können. Wie können Analysten die Ausdrucksweisen von jemandem, der nicht mit Social-Media-Daten arbeitet in Fragen umwandeln, die beantwortet werden können?

“Es mag sinnvoll erscheinen, nach Themen zu fragen, die stark in Ihrer Branche besprochen werden, aber bereits treffend zu beschreiben, was das Thema ist, ist schwierig….Wenn Sie anfangen, besteht der Hauptteil Ihrer Arbeit (60%) daraus, die richtige Frage zu finden. Die anderen 40% sind die Analyse.“

Diese Aufschlüsselung überraschte mich. Als jemand, der oft eine eher forschende Vorgehensweise bei Social-Media-Daten wählt und verschiedene Elemente der Gespräche betrachtet, bevor ich eine Geschichte aus den Daten entwickle, erschienen mir 60% für die Fragestellung sehr viel.

„Mit der Zeit als Analyst machte ich es zu meiner Priorität die anfängliche Zeit zu reduzieren“, sagt Paul. Er macht deutlich, dass Prozesse zusammenzustellen, die vorhersehbare Fragen auf einer regelmäßigen Basis beantworten können ein guter Weg ist, um ein System zu haben, bei dem nicht ständig Zeit in das Erwägen investiert werden muss.

Es gibt allerdings keine Vorgehensweise, die auf alle Fälle angewandt werden kann, um Social-Media-Daten zu kategorisieren. Als Beispiel spricht Paul die Sentimentanalyse an. „Die Realität ist, dass Einheitsmodelle für das Sentiment sich nicht für jedes Vorhaben eignen: Sie haben Schwierigkeiten mit der Sprache, die spezifisch für eine Marke, ein Publikum, eine Branche oder ein Event ist.“

Paul sagt, dass die Teams, die das Beste aus Sentimentklassifikatoren herausholen, sich die Wortwahl von Personen aus der Branche ansehen und die Klassifikatoren mit diesen Informationen anreichern und sicherstellen, dass sie konsistent und genau sind. Wenn Sie beispielsweise in einer Branche arbeiten, in der Ihr Publikum oft Umgangssprache benutzt, erstellen Sie Regeln, die aktuelle positive und negative Wörter korrekt kategorisiert und Sie so nichts verpassen.

“In anderen Worten: der Großteil der Arbeit besteht darin, die Frage „Was ist Sentiment?“ präzise abgestimmt auf Ihre Geschäftsanforderungen zu formulieren“, sagt Paul.

Mit einem Tool wie Brandwatch Analytics können Sie eigene Regeln für das Sentiment erstellen, um automatisch das positive und negative Sentiment rund um die Gespräche um Ihre Marke monitoren zu können.

Zu viel oder zu wenig nachdenken

Wenn ich mir den Zeitrahmen ansehe, den Paul für das Zusammenstellen der Forschungsfragen vorschlägt, dann frage ich mich, ob hier die Gefahr besteht, etwas zu philosophisch zu werden.

Er lacht.

„Sie müssen es nicht auf die Spitze treiben und sich fragen: ‚Was ist eigentlich Sprache?'“

Stattdessen verdeutlicht Paul den Schaden, denn schlecht durchdachte Fragen später in der Analyse anrichten:

 “Das Risiko bei der Fragestellung zu viel nachzudenken ist kleiner als zu wenig darüber nachzudenken. Wenn Sie diesen Schritt überstürzen, werden Sie später für den Fehler bezahlen.“

Allerdings bedeutet das Festlegen von Fragestellungen nicht, dass es keinen Raum gibt, die Daten zu erforschen und ein Gefühl für diese zu erhalten und die Erkenntnisse dafür zu nutzen, um daraus mehr Fragen zu entwickeln.

„Erwähnungen durchzulesen und Zusammenhänge zu erkennen, aus denen Fragen formuliert werden können, ist eine gute Sache. Ein Teil der Arbeit sollte daraus bestehen, die Social-Media-Daten zu erforschen und unvoreingenommen zu betrachten“, sagt Paul.

Fragen Sie die richtigen Fragen?

Der wichtigste Punkt, den ich aus dem Gespräch mit Paul mitnehme, ist, wie wichtig es für ihn und sein Team ist, die richtigen Fragen zu stellen.

Frühere Meetings mit dem Data Science Team bei Brandwatch verließ ich mit Kopfschmerzen, nicht sicher, wie ich mit einem Thema, worüber ich schreiben möchte, beginnen soll, nachdem wir das Thema  und die Annahmen, mit denen ich ursprünglich begann, komplett aufgegliedert hatten. Es erinnerte mich fast an einen Philosophiekurs, in der der Dozent uns dazu aufforderte, zu beweisen, dass der Tisch vor ihm echt ist und dann unsere Argumente auseinandernahm.

Der Ausgangspunkt kann frustrierend sein, aber wie Paul sagte, wenn Sie die Natur der Sprache diskutieren, sind Sie beim Auseinandernehmen der Fragestellung ein paar Schritte zu weit gegangen. Ein Gleichgewicht zu finden, in dem Sie nicht zu viel oder zu wenig darüber nachdenken, ist nicht einfach, aber behalten Sie im Hinterkopf, dass eine umfangreiche Analyse one eine Frage, die direkt beantwortet werden kann, nicht zielführend sein wird.

Kategorien
Updates
Blog durchsuchen
Newsletter

Bleiben Sie auf dem Laufenden über die neuesten Trends, Events und Produktentwicklungen.

Anmelden
Plot Curve
Brandwatch Analytics

Brandwatch Analytics ist eine der weltweit führenden Social Listening-Plattformen

Eine der besten und schnellsten Social Listening- und Analytics-Plattformen auf dem Markt

Mehr erfahren
Airline Analysis DashboardOverviewKey InsightsLast 7 MonthsLast 7 MonthsLast 7 MonthsShare of VoiceTopicsSentimentDemographicsProjectAirlinesAditi@analyst.comDashboardsDataToolsReportsAlerts5kSepOctNovDecJanFebMarApr10k15k20k05k10k15k20k0Historical ComparisonGoQuick Search20%35%5%10%30%SepOctNovDecJanFebMarMention VolumeMention VolumeJet AirwaysFly FirstRoyal AirwaysAir AtlanticPacific AirlinesJet AirwaysFly FirstRoyal AirwaysAir AtlanticPacific AirlinesJet AirwaysFly FirstRoyal AirwaysAir AtlanticPacific Airlines