Das Leben und den Tod von Nachrichten verfolgen

Das Leben und den Tod von Nachrichten verfolgen
Das Leben und den Tod von Nachrichten verfolgen
Anonim

Da immer mehr Nachrichten sowohl im Internet als auch in gedruckter Form erscheinen, wird es möglich, den globalen Nachrichtenfluss durch Online-Beobachtung abzubilden. Mit dieser Strategie ist es Cornell-Informatikern gelungen, den "Nachrichtenzyklus" zu verfolgen und zu analysieren - die Art und Weise, wie Geschichten an Popularität gewinnen und fallen.

Jon Kleinberg, Professor für Informatik an der Tisch University in Cornell, Postdoktorand Jure Leskovec und Doktorand Lars Backstrom verfolgten 1,6 Millionen Online-Nachrichtenseiten, darunter 20.000 Mainstream-Medienseiten und eine Vielzahl von Blogs Dreimonatszeitraum vor den Präsidentschaftswahlen 2008 - insgesamt 90 Millionen Artikel, eine der umfangreichsten Analysen von Online-Nachrichten überhaupt.Sie fanden einen konsistenten Rhythmus, als Geschichten an Bedeutung gewannen und dann innerhalb weniger Tage nachließen, mit einem „Herzschlag“-Muster von Übergaben zwischen Blogs und Mainstream-Medien. Sie fanden heraus, dass eine Geschichte in den Mainstream-Medien langsam an Bedeutung gewinnt und dann schnell stirbt; In der Blogosphäre gewinnen Geschichten sehr schnell an Popularität, bleiben dann aber länger, da die Diskussion hin und her geht. Irgendwann wird aber fast jede Geschichte von etwas Neuerem beiseite geschoben.

"Die Bewegung von Nachrichten ins Internet macht es möglich, etwas zu quantifizieren, was ansonsten sehr schwer zu messen war - die zeitliche Dynamik der Nachrichten", sagte Kleinberg. „Wir wollen das gesamte Nachrichten-Ökosystem verstehen, und Online-Nachrichten spiegeln jetzt das gesamte Ökosystem genau genug wider, um dies zu ermöglichen. Dies ist ein [sehr früher] Schritt zur Entwicklung von Tools, die den Menschen helfen würden, die Nachrichten zu verstehen, wo sie herkommen aus und wie es aus dem Zusammenfluss vieler Quellen entsteht."

Die Forscher sagen auch, dass ihre Arbeit eine Antwort auf eine seit langem bestehende Frage nahelegt: Ist der "Nachrichtenzyklus" nur eine Möglichkeit, unsere Wahrnehmung dessen zu beschreiben, was in den Medien vor sich geht, oder ist er ein reales Phänomen, das gemessen werden kann ? Sie entscheiden sich für Letzteres und bieten eine mathematische Erklärung dafür, wie es funktioniert.

Die Forschungsergebnisse wurden bei der Association for Computing Machinery Special Interest Group on Conference on Knowledge Discovery and Data Mining Conference vom 28. Juni bis 1. Juli in Paris vorgestellt.

Das Ideal, sagte Kleinberg, wäre es, "Meme" oder Ideen durch den Cyberspace zu verfolgen, aber die Entscheidung, worum es in einem Artikel geht, ist immer noch eine große Herausforderung für die Computer. Die Forscher umgingen dieses Hindernis, indem sie Zitate verfolgten, die in Nachrichtenartikeln erscheinen, da Zitate ziemlich konsistent bleiben, obwohl die gesamte Geschichte von verschiedenen Autoren auf sehr unterschiedliche Weise dargestellt werden kann.

Sogar Zitate können sich leicht ändern oder "mutieren", wenn sie von einem Artikel zum anderen übergehen, daher haben die Forscher einen Algorithmus entwickelt, der ähnliche, aber leicht unterschiedliche Sätze identifizieren und gruppieren kann.Einfach ausgedrückt identifizierte der Computer kurze Phrasen, die Teil längerer Phrasen waren, und nutzte diese Verbindungen, um „Phrasen-Cluster“zu erstellen. Dann verfolgten sie das Volumen der Posts in jedem Phrasen-Cluster im Laufe der Zeit. In den August- und September-Daten fanden sie mehr oder weniger wöchentlich steigende und fallende Fäden, mit großen Spitzen, die den Konventionen der Demokraten und Republikaner, der „Lippenstift auf einem Schwein“-Diskussion, der zunehmenden Besorgnis über die Finanzkrise und Diskussionen über a entsprachen Rettungsplan.

Der langsame Aufstieg einer neuen Geschichte in den Mainstream, schlagen die Forscher vor, resultiert aus Nachahmung - je mehr Websites eine Geschichte verbreiteten, desto wahrscheinlicher war es, dass andere Websites sie aufgriffen. Aber die Lebensdauer einer Geschichte ist begrenzt, da neue Geschichten die alten schnell verdrängen. Ein mathematisches Modell, das auf der Wechselwirkung von Nachahmung und Aktualität basiert, sagte das Muster ziemlich gut voraus, sagten die Forscher, während Vorhersagen, die entweder auf Nachahmung oder Aktualität allein basieren, nicht nahe kommen konnten.

Das Beobachten, wie sich Geschichten zwischen den Mainstream-Medien und Blogs bewegten, offenbarte einen scharfen Einbruch und Anstieg, den die Forscher als „Herzschlag“bezeichneten. Wenn eine Geschichte zum ersten Mal erscheint, gibt es einen kleinen Anstieg der Aktivität in beiden Bereichen; mit zunehmender Mainstream-Aktivität wird der Anteil, den Blogs beitragen, gering; aber bald schießt die Blog-Aktivität in die Höhe und erreicht ihren Höhepunkt durchschnittlich 2,5 Stunden nach dem Mainstream-Höhepunkt. Fast alle Geschichten begannen im Mainstream. Nur 3,5 Prozent der verfolgten Geschichten tauchten zunächst dominant in der Blogosphäre auf und wanderten dann in den Mainstream.

Das mathematische Modell muss verfeinert werden, sagten die Forscher, und sie schlugen vor, weiter zu untersuchen, wie sich Geschichten zwischen Orten mit gegensätzlicher politischer Ausrichtung bewegen. „Es wird nützlich sein, die Rollen, die die verschiedenen Teilnehmer in diesem Prozess spielen, besser zu verstehen“, schlossen die Forscher, „da ihr kollektives Verh alten direkt zu der Art und Weise führt, wie wir alle Nachrichten und ihre Folgen erfahren."

Beliebtes Thema