{"id":53512,"date":"2017-03-02T12:05:33","date_gmt":"2017-03-02T10:05:33","guid":{"rendered":"https:\/\/www.brandwatch.com\/de\/?p=53512"},"modified":"2024-09-07T03:35:32","modified_gmt":"2024-09-07T01:35:32","slug":"amy-collins-ueber-daten-7-antworten-zu-brandwatch-instagram-daten","status":"publish","type":"post","link":"https:\/\/www.brandwatch.com\/de\/blog\/amy-collins-ueber-daten-7-antworten-zu-brandwatch-instagram-daten\/","title":{"rendered":"Amy Collins \u00fcber Daten: 7 Antworten zu Brandwatch Instagram-Daten"},"content":{"rendered":"<p>Im <a href=\"https:\/\/www.brandwatch.com\/de\/2017\/02\/amy-collins-ueber-daten-fokus-asien-pazifik-abdeckung\/\" target=\"_blank\" rel=\"noopener\">letzten Blogpost<\/a> schrieb ich \u00fcber unseren gro\u00dfen Fokus im ersten Quartal 2017: die Datenabdeckung in der Asien-Pazifik-Region.<\/p>\n<p>Ich erw\u00e4hnte in dem Post nicht unsere anderen Punkte, auf die wir vom Data Team uns dieses Jahr fokussieren: Verbesserungen an unseren hauseigenen Crawling-Technologien. Unser Daten-Crawling-Team k\u00fcmmert sich um all unsere gecrawlten Quellen wie Facebook, Instagram, Blogs, Foren und News-Seiten.<\/p>\n<p>In diesem Blogpost beantworte ich 7 Fragen, wie unsere Abdeckung von Instagram-Daten funktioniert.<\/p>\n<hr \/>\n<h2>1. Erhaltet ihr die Instagram Firehose?<\/h2>\n<p>Das ist eine h\u00e4ufig gestellte Frage.<\/p>\n<p>Der Begriff &#8222;Firehose&#8220; ist ein Branchenbegriff f\u00fcr eine bezahlte, volle Zufuhr von allen Daten einer bestimmten Quelle. Der bekannteste Anbieter einer Firehose ist Twitter. Wir bezahlen Twitter f\u00fcr die Daten und bekommen 100 Prozent aller Tweets f\u00fcr jede Kunden-Query. Wir haben \u00e4hnliche \u00dcbereinkommen mit Disqus und einer Zahl an anderen Anbietern.<\/p>\n<p>Aber anders als bei Twitter gibt es keine Firehose f\u00fcr Instagram.<\/p>\n<p><a href=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-505342776-1024x1024.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-53514 size-full\" src=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-505342776-1024x1024.jpg\" width=\"1024\" height=\"1024\" srcset=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-505342776-1024x1024.jpg 1024w, https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/..\/..\/..\/themes\/brandwatch\/src\/core\/endpoints\/resize.php?image=uploads\/2017\/02\/iStock-505342776-1024x1024.jpg&amp;width=150 150w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><\/p>\n<p>Instagram ist Teil des Facebook-Konzerns, ein Werbeunternehmen. Gut, eigentlich positioniert sich Facebook als Medienunternehmen, aber es ist im Wesentlichen eine riesige, erfolgreiche Werbemaschine. Der Verkauf von Daten f\u00fcr Analytics-Zwecke passt nicht zu ihrem Gesch\u00e4ftsmodell. Facebook konzentriert sich darauf, eine gute Kundenerfahrung f\u00fcr seine Nutzer zu schaffen und die Werbungtreibenden dazu zu bringen, mehr Geld auszugeben. Mit dem Teilen von Daten unterst\u00fctzt Facebook Werbungtreibende dabei, gezieltere und n\u00fctzlichere Werbung f\u00fcr die Nutzer zu erstellen. Das Liefern von Verbraucher-Insights f\u00fcr Unternehmen ist nicht das Hauptaugenmerk und das ist der Grund, warum weder Facebook noch Instagram eine Firehose oder ein \u00e4hnliches Datenzahlungsmodell anbieten.<\/p>\n<p>Datenanbieter, die ihnen sagen, sie haben &#8222;100 Prozent aller Instagram-Daten&#8220; oder die &#8222;Instagram Firehose&#8220; sollten mit gro\u00dfer Skepsis behandelt werden.<\/p>\n<hr \/>\n<h2>2. Wie kommt ihr nun an Instagram-Daten?<\/h2>\n<p>Wir sitzen im gleichen Boot wie jeder andere: wir haben Zugriff auf die \u00f6ffentlichen Instagram-APIs und crawlen diese Daten.<\/p>\n<p>Einige Anbieter \u00fcberspringen diesen Schritt und Bezahlen einen Aggregator, um f\u00fcr diese zu crawlen. Wir entschieden uns dagegen, das hei\u00dft wir haben die Kontrolle dar\u00fcber, welche Daten wir sammeln (oft mehr als unsere Kunden fordern, aber mit weniger Spam und irrelevanten Erw\u00e4hnungen). Da es \u00f6ffentliche Daten sind und keine bezahlte API, haben wir wie alle Anbieter Ratenbegrenzungen. Daher m\u00fcssen wir sehr genau darauf achten, wie wir die Dinge abw\u00e4gen, die wir crawlen.<\/p>\n<p><a href=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-505595254.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-53515 size-full\" src=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-505595254.jpg\" width=\"3017\" height=\"994\" \/><\/a><\/p>\n<p>Da es keine komplexe Such-API gibt (wie bei anderen Datenanbietern wie Twitter), k\u00f6nnen wir nicht die umfangreiche, Boolean Logik anwenden, die Sie normalerweise in einer Brandwatch Query anwenden w\u00fcrden.<\/p>\n<p>Die API liefert eine Reihe an Endpunkten, um Instagram-Daten zu bekommen. F\u00fcr die Nicht-Entwickler unter ihnen: Ein Endpunkt ist einfach ein Ort, von dem wir Daten von der API in einem bestimmten Format anfordern k\u00f6nnen. Gegenw\u00e4rtig crawlen wir Posts f\u00fcr angeforderte Hashtags und Posts von spezifischen Nutzern. Vor kurzem haben wir die Kommentarsuche f\u00fcr Nutzer-Posts eingef\u00fchrt.<\/p>\n<hr \/>\n<h2>3. Wie funktioniert das Crawlen von Instagram Hashtag Posts?<\/h2>\n<p>Konzeptionell kann das in zwei Aktivit\u00e4ten aufgeteilt werden. Als erstes die Posts von Instagram zu bekommen und als zweites, es Ihren Queries zuzuordnen.<\/p>\n<p><strong>Posts von Instagram erhalten:<\/strong> Da es keine komplexe Such-API gibt, durchsuchen wir Instagram Tags-Endpunkte.<br \/>\nDadurch erhalten wir eine Liste an Posts f\u00fcr ein bestimmtes Hashtag. Wir sammeln eine Liste aller Hashtags, die in unseren Kunden-Queries erw\u00e4hnt wurden (indem Nutzer mithilfe des hashtag:-Operatoren suchten). Die Liste wird dann durchgearbeitet und wir fordern die Posts f\u00fcr jedes Hashtag an.<\/p>\n<p>Die Aufforderung gibt eine Seite mit mehreren Posts zur\u00fcck, das wiederholen wir und erhalten so mehrere Seiten mit Posts. Jeder Posts wird dann aufbewahrt und stehen Kunden-Queries zur Verf\u00fcgung, die nach diesen Posts suchen.<\/p>\n<p><strong>Den Kunden-Queries zuordnen:<\/strong> Sobald sich ein Post im Brandwatch Datenarchiv befindet, k\u00f6nnen sie jeder Kunden-Query zugeordnet werden, egal ob es sich auf das Hashtag, das sich im Post befindet, bezieht.<\/p>\n<p>Beispielsweise, wenn ein Kunde eine Query f\u00fcr hashtag:cats erstellt und wir finden einen Instagram Post, der folgenden Text enth\u00e4lt &#8222;I\u2019m so glad I don\u2019t have a dog. #cats&#8220;, dann ordnen wir diesen Post der Query zu. Wir ordnen diesen Post aber auch einer Suchanfrage zu, die nach jeder Erw\u00e4hnung zum Word &#8222;dog&#8220; sucht (auch, wenn nach keinem Hashtag gesucht wird).<\/p>\n<p>Wir nennen das &#8222;einhergehende Daten&#8220; \u2013 es ist eine Art Netzwerkeffekt, wenn die Daten, die wir von einem Kunden abfragen, einen Nutzen f\u00fcr alle unsere Kunden liefern kann.<\/p>\n<p>Nur um das Klarzustellen: Ich bin eigentlich keine Katzenliebhaberin.<\/p>\n<p><a href=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-525207466.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-53516 size-full\" src=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-525207466.jpg\" width=\"2121\" height=\"1414\" \/><\/a><\/p>\n<hr \/>\n<h2>4. Wie funktioniert das Crawlen von Instagram User-Posts und -Kommentaren<\/h2>\n<p>Diese M\u00f6glichkeit gibt es in unserer Brandwatch Analytics Channels-Feature f\u00fcr Instagram.<\/p>\n<p>Die Anwendung ist sehr einfach im Vergleich zum Aufsetzen einer regul\u00e4ren Query. Daf\u00fcr setzen Sie einfach einen Channel auf und geben an, welchen Instagram-Nutzer Sie hinzuf\u00fcgen m\u00f6chten. Daraufhin fangen wir an, die Posts des Nutzer zu durchsuchen, sowie die dazugeh\u00f6rigen Kommentare oder Likes.<\/p>\n<p>Wenn Sie einen Channel aufsetzen, erhalten wir nach dem ersten Crawl die letzten 100 Posts, die in den letzten sieben Tagen ver\u00f6ffentlicht wurden. F\u00fcr jeden Post erhalten wir bis zu 150 Kommentare. Danach besuchen wir die Nutzerseite alle ein bis zwei Stunden (das h\u00e4ngt davon ab, wie lange der letzt Crawling-Zyklus gedauert hat und die Hardware, die daf\u00fcr verwendet wurde) und erhalten dadurch die Top 100 Posts und bis zu 150 Kommentare je Post.<\/p>\n<hr \/>\n<h2>5. Warum bittet mich Brandwatch darum, mich mit Instagram zu authentifizieren?<\/h2>\n<p>Sie haben vielleicht die Nachricht in Brandwatch gesehen, die danach fragt, dass Sie sich mit Instagram authentifizieren oder Ihnen ist das Authentifizierungsmen\u00fc in der oberen rechten Ecke der App aufgefallen:<\/p>\n<p><a href=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/Screen-Shot-2017-02-16-at-10.55.55-300x179.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-53517\" src=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/Screen-Shot-2017-02-16-at-10.55.55-300x179.png\" alt=\"\" width=\"300\" height=\"179\" \/><\/a><\/p>\n<p>Jedes Mal, wenn wir uns mit der API verbinden, m\u00fcssen wir ein &#8222;Token&#8220; pr\u00e4sentieren. Ein Token ist im Grunde einfach ein Ticket, um Zutritt zu erhalten.<\/p>\n<p>Die Herausforderung besteht darin, dass diese Tokens nur begrenzt oft genutzt werden k\u00f6nnen und m\u00fcssen nach einem Zeitraum erneuert werden. Umso mehr Tokens wir haben, umso mehr Crawling-Kapazit\u00e4ten haben wir. Jeder Instagramnutzer-Account kann ein Token erzeugen, welches wir speichern und nutzen k\u00f6nnen, um die Crawling-Kapazit\u00e4ten zu erh\u00f6hen.<\/p>\n<p>An verschiedenen Stellen in Brandwatch bieten wir ein hohes Service-Level f\u00fcr Personen an, die sich in der Plattform authentifiziert haben und dadurch ein Token erstellten. Das sind gegenw\u00e4rtig zwei Bereiche:<\/p>\n<ul>\n<li>Crawling von Hashtags \u2013 Wir verf\u00fcgen \u00fcber eine zweite M\u00f6glichkeit des Hashtag-Crawlings, den \u201eAuthenticated Hashtag Crawler\u201c, der Kapazit\u00e4ten f\u00fcr Hashtags liefert, die von Klienten gesucht werden, die einen oder mehrere Instagram-Accounts authentifiziert haben.<\/li>\n<li>Crawling von User-Posts und Kommentaren \u2013 Dieser Crawler befindet sich im Brandwatch Analytics Channels Feature. Jedes authentifizierte Token kann bis zu 50 Channels bearbeiten (oder in Instagramsprache: kann Analysen f\u00fcr bis zu 50 Instagram Accounts liefern). F\u00fcr einige Channels, die ein hohes Volumen liefern (die viele Posts und Kommentare enthalten), kann es zu Abdeckungsproblemen kommen, wenn unser Nutzer ein geringes Level an Tokens liefern. Die Authentifizierung kann in diesen F\u00e4llen also helfen.<\/li>\n<\/ul>\n<hr \/>\n<h2>6. Was kann ich tun, um mehr Instagram-Daten zu erhalten?<\/h2>\n<p>Wir haben einige Vorschl\u00e4ge, um das Beste aus unseren Datenabfrageprozessen zu holen.<\/p>\n<ol>\n<li>Optimieren Sie Ihre Brandwatch Analytics Queries, indem Sie Instagram Hashtags hinzuf\u00fcgen, die wir f\u00fcr Sie abfragen sollen.<\/li>\n<li>Erstellen Sie einen Brandwatch Analytics Instagram Channel f\u00fcr die Accounts, die wir verfolgen sollten (wie zum Beispiel Ihre markeneigene Instagram-Seite).<\/li>\n<li>Authentifizieren Sie Ihre Instagram Accounts mit Brandwatch Analytics. Das stellt sicher, dass Sie ein bisschen extra Crawling-Kapazit\u00e4t erhalten; das wirkt sich vor allem f\u00fcr Brandwatch Analytics Channels mit hohem Volumen positiv aus.<\/li>\n<li>Wenn Sie Influencer haben, die sehr wichtig f\u00fcr Sie sind, erstellen Sie Instagram Channels von ihren Accounts und diese Daten stehen dann all Ihren anderen Queries zur Verf\u00fcgung.<\/li>\n<\/ol>\n<hr \/>\n<h2>7. Was steht auf der Roadmap f\u00fcr das Instagram Crawling?<\/h2>\n<p><a href=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-168276393-1024x768.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-53518 size-full\" src=\"https:\/\/www.brandwatch.com\/de\/wp-content\/uploads\/2017\/02\/iStock-168276393-1024x768.jpg\" width=\"1024\" height=\"768\" \/><\/a><\/p>\n<p>Wir wollen mehr und uns in naher Zukunft in diesen drei Bereichen verbessern:<\/p>\n<p>1. Tiefgang der Hashtag-Abdeckung \u2013 Sicherzustellen, dass wir jeden letzten Post f\u00fcr alle von Nutzern angefragten Hashtags erhalten, auch denen mit sehr hohem Volumen.<br \/>\n2. Breite der Hashtag-Abdeckung \u2013 Mehr Crawling von nicht-angefragten Hashtags, so dass wir mit der Zeit \u00fcber bessere historische Daten verf\u00fcgen. Eine interessante Richtung k\u00f6nnte sein, andere Hashtags, die wir bei eingehenden Posts von unseren Crawlern sehen, hinzuzuf\u00fcgen.<br \/>\n3. Kommentare f\u00fcr die Hashtag-Abdeckung \u2013 Es liegt ein gro\u00dfer Nutzen darin, die Antworten und Gespr\u00e4che rund um relevante Posts einzufangen &#8211; unter Umst\u00e4nden nicht nur jene im Ursprungspost.<\/p>\n<p>Im Moment ist der erste Punkt unsere Priorit\u00e4t. Wir haben ein neues Technikteam zusammengestellt, welches sich darum k\u00fcmmert und sie machen rasche Fortschritte bei einigen gro\u00dfen architektonischen Verbesserungen. Dadurch erh\u00f6ht sich die Anzahl an Posts, die wir erhalten radikal.<\/p>\n<p>CTA<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im letzten Blogpost schrieb ich \u00fcber unseren gro\u00dfen Fokus im ersten Quartal 2017: die Datenabdeckung in der Asien-Pazifik-Region. Ich erw\u00e4hnte in dem Post nicht unsere anderen Punkte, auf die wir vom Data Team uns dieses Jahr fokussieren: Verbesserungen an unseren hauseigenen Crawling-Technologien. Unser Daten-Crawling-Team k\u00fcmmert sich um all unsere gecrawlten Quellen wie Facebook, Instagram, Blogs, [&hellip;]<\/p>\n","protected":false},"author":161,"featured_media":53526,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false},"categories":[566],"tags":[3214,63,3002,1988,1444,3004,3003],"class_list":["post-53512","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-updates","tag-amy-collins","tag-brandwatch","tag-brandwatch-channels","tag-datenabdeckung","tag-instagram","tag-instagramabdeckung","tag-instagramdaten"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/posts\/53512","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/users\/161"}],"replies":[{"embeddable":true,"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/comments?post=53512"}],"version-history":[{"count":0,"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/posts\/53512\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/media\/53526"}],"wp:attachment":[{"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/media?parent=53512"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/categories?post=53512"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.brandwatch.com\/de\/wp-json\/wp\/v2\/tags?post=53512"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}