Was sind Markov-Ketten? 5 raffinierte Anwendungen in der realen Welt

| Von

Markov-Ketten

Sie haben vielleicht schon einmal den Begriff „Markov-Kette“ gehört, aber wenn Sie nicht einige Kurse zum Wahrscheinlichkeitskonzept oder zu Computertechnologieformeln besucht haben, verstehen Sie möglicherweise nicht, was sie sind, wie sie genau funktionieren und warum sie auch funktionieren so wichtig.

Der Begriff einer Markov-Kette ist eine Idee „unter der Haube“, was bedeutet, dass Sie nicht wirklich erkennen müssen, was sie noch sind, um von ihnen zu profitieren. Trotzdem können Sie sicher davon profitieren, genau zu verstehen, wie sie funktionieren. Sie sind unkompliziert und in vielerlei Hinsicht vorteilhaft.

Hier ist also ein Auffrischungskurs – was auch immer Sie brauchen, um mehr über Markov-Ketten zu erfahren, die direkt zu einem einsamen, resorbierbaren Kurzartikel komprimiert wurden. Wenn Sie auch tiefer tauchen möchten, versuchen Sie das kostenloses Detailtheorie-Programm auf der Khan Academy (und berücksichtigen Sie auch andere Online-Kurs-Websites).

Markov-Ketten 101

Nehmen wir an, Sie möchten vorhersehen, wie das Wetter morgen aussehen wird. Eine echte Vorhersage – wie sie von professionellen Meteorologen gemacht wird – würde Hunderte oder vielleicht Tausende verschiedener Variablen beinhalten, die sich ständig ändern. Klimasysteme sind äußerst komplex und unmöglich zu entwerfen, ein Minimum für Laien wie Sie und mich. Wir können das Problem jedoch rationalisieren, indem wir mögliche Anführungszeichen verwenden.

Stellen Sie sich vor, Sie hatten Zugang zu 30 Jahren Klimainformationen. Sie beginnen am Anfang und denken daran, dass Tag 1 hell war. Sie machen weiter und stellen fest, dass Tag 2 ebenfalls warm war, aber Tag 3 vorbei war, nachdem Tag 4 stürmisch war, was an Tag 5 zu einem Gewitter führte, an dem sowohl sonniger als auch klarer Himmel an Tag 6 festhielt.

Am liebsten wären Sie viel detaillierter und würden eher eine stundenweise Analyse als eine tägliche Auswertung durchführen, aber dies ist nur ein Beispiel, um das Konzept zu veranschaulichen, also gebären Sie mit mir!

Sie tun dies über die gesamte 30-jährige Informationssammlung (die nur knapp 11.000 Tage betragen würde) und berechnen auch die Möglichkeiten, wie das Wetter von morgen auf der Grundlage des heutigen Klimas aussehen wird. Zum Beispiel, wenn heute warm ist, danach:

  • Eine 50-prozentige Möglichkeit, dass morgen sicherlich wieder hell wird.
  • Eine 30-prozentige Chance, die morgen düster sein wird.
  • Eine 20-prozentige Chance, dass morgen sicherlich stürmisch wird.

Wiederholen Sie dies nun für jede einzelne mögliche Wetterbedingung. Wenn heute düster ist, welche Möglichkeiten gibt es dann, dass morgen sonnig, stürmisch, unklar, elektrische Stürme, Hagelstürme, Tornados usw. sein werden? Ziemlich schnell haben Sie ein ganzes System von Möglichkeiten, mit denen Sie nicht nur die Wetterbedingungen von morgen, sondern auch die Wetterbedingungen des nächsten Tages und auch des nächsten Tages vorhersehen können.

Übergangsstaaten

Dies ist die Bedeutung einer Markov-Kette. Sie haben einzelne Zustände (in diesem Fall Wetter), in denen sich jeder Zustand direkt in einen anderen Zustand ändern kann (z. B. helle Tage können sich direkt in bewölkte Tage verschieben), und diese Verschiebungen basieren auf Möglichkeiten. Wenn Sie vorhersagen möchten, wie das Klima in einer Woche aussehen könnte, können Sie die verschiedenen Wahrscheinlichkeiten in den folgenden 7 Tagen untersuchen und feststellen, welche wahrscheinlich sind. Daher eine Markov „Kette“.

Das ist Markov? Er war ein russischer Mathematiker, der anhand einer bestimmten Wahrscheinlichkeit begründete, dass ein Staat direkt zu einem anderen Staat führte, wobei nichts anderes die Übergangschance beeinflusste. Grundsätzlich schuf er die Markov-Kette, also die Identifikation.

Genau wie Markov-Ketten in der realen Welt verwendet werden

Wenn die Beschreibung abseits der ausgetretenen Pfade liegt, können Sie einige der realen Anwendungen überprüfen, in denen sie nützlich sind. Sie könnten erstaunt sein, wenn Sie feststellen, dass Sie die ganze Zeit über Markov-Ketten verwendet haben, ohne es zu verstehen!

Namensgenerierung

Haben Sie sich schon einmal mit Tabletop-Videospielen, MMORPG-PC-Spielen und sogar mit dem Schreiben von Belletristik beschäftigt? Möglicherweise haben Sie sich um die Benennung Ihrer Charaktere gekämpft (zumindest an einem oder mehreren Punkten) – und als Sie einfach nicht an einen Namen denken konnten, den Sie mögen, haben Sie sich wahrscheinlich an einen Online-Namensgenerator gewandt.

Haben Sie sich jemals gefragt, wie diese Namensgeneratoren funktionieren? Am Ende verwenden viele von ihnen Markov-Ketten, was es zu einem der am häufigsten verwendeten Mittel macht. (Es gibt andere Algorithmen, die sicherlich genauso effektiv sind!)

Alles, was Sie brauchen, ist eine Sammlung von Briefen, in denen jeder Brief eine Liste potenzieller Folgebriefe mit Wahrscheinlichkeiten enthält. So hat beispielsweise der Buchstabe „M“ eine 60-prozentige Chance, den Buchstaben „A“ zu ergeben, sowie eine 40-prozentige Chance, den Buchstaben „I“ zu erhalten. Führen Sie dies für eine ganze Reihe anderer Buchstaben aus, und führen Sie dann den Algorithmus aus. Boom, du hast einen Namen, der Sinn macht! (Jedenfalls die meiste Zeit.)

Google PageRank

Zu den faszinierenden Auswirkungen der Markov-Kettentheorie gehört, dass mit zunehmender Größe der Kette (dh mit zunehmender Anzahl von Zustandsänderungen) die Möglichkeit, dass Sie in einem bestimmten Zustand landen, auf einer festen Anzahl konvergiert und diese Möglichkeit unabhängig davon ist wo Sie im System beginnen.

Dies ist unglaublich faszinierend, wenn Sie sich das gesamte World Wide Web als ein Markov-System vorstellen, bei dem jede Webseite ein Zustand ist und auch die Links zwischen den Webseiten sich mit Wahrscheinlichkeiten ändern. Diese These besagt im Wesentlichen, dass Unabhängig davon, auf welcher Webseite Sie beginnen, ist Ihre Möglichkeit, auf einer bestimmten Seite X zu landen, eine feste Wahrscheinlichkeit, vorausgesetzt, Sie surfen „lange“

markov-chain-example-google-pagerank Fotokredit: 345Kai über Wikimedia

Und dies ist die Grundlage dafür, wie Google Webseiten platziert. Sicherlich ist der PageRank-Algorithmus ein modifizierter (gelesen: fortgeschrittener) Typ des Markov-Kettenalgorithmus.

Je größer die „festgelegte Chance“ ist, auf eine bestimmte Webseite zu gelangen, desto höher ist ihr PageRank. Dies liegt daran, dass eine höhere Wahrscheinlichkeit bedeutet, dass auf der Website viele eingehende Links von anderen Webseiten vorhanden sind. Google geht davon aus, dass es wichtig sein sollte, wenn eine Webseite viele eingehende Links enthält. Je mehr eingehende Weblinks vorhanden sind, desto wertvoller ist es.

Es ist natürlich viel komplexer als das, aber es macht Sinn. Warum hat eine Website wie About.com auf den Seiten der Suchergebnisseiten eine höhere Priorität? Weil sich herausstellt, dass Einzelpersonen dazu neigen, dort anzukommen, wenn sie im Internet surfen. Interessant, nicht wahr?

Eingabe der Wortvorhersage

Mobiltelefone haben seit Jahrzehnten Predictive Keying, aber können Sie davon ausgehen, wie diese Vorhersagen getroffen werden? Unabhängig davon, ob Sie Android (alternative Tastaturoptionen) oder iPhone (alternative Tastaturoptionen) verwenden, besteht eine gute Chance, dass Ihre optionale App Markov-Ketten verwendet.

Aus diesem Grund fragen Tastaturanwendungen, ob sie Daten zu Ihren Eingaberoutinen erfassen können. In Google Keyboard gibt es beispielsweise ein Setup namens Fragmente teilen Das fordert Sie auf, „Ausschnitte darüber zu teilen, was und wie Sie Google Apps eingeben, um die Google-Tastatur zu verbessern“. Grundsätzlich werden Ihre Wörter bewertet und in die Markov-Kettenmöglichkeiten der Anwendung integriert.

Das ist auch der Grund, warum Tastatur-Apps häufig drei oder sogar mehr Alternativen bieten, im Allgemeinen in der Reihenfolge vieler, die wahrscheinlich bis zum geringstmöglichen Wert sind. Es kann nicht sicher verstehen, was Sie als nächstes vorgeschlagen haben, aber es ist im Allgemeinen richtig.

Subreddit-Simulation

Wenn Sie Reddit noch nie benutzt haben, motivieren wir Sie, sich zumindest mit diesem faszinierenden Experiment zu befassen / r / SubredditSimulator

Grundsätzlich nimmt der Subreddit-Simulator einen großen Teil ALLER Kommentare und Titel auf, die in den vielen Bereichen von Reddit abgegeben wurden, und untersucht anschließend die wortweise Zusammensetzung jedes Satzes. Mithilfe dieser Daten werden Wort-zu-Wort-Chancen generiert. Anschließend werden diese Chancen genutzt, um Titel und Kommentare von Grund auf neu zu finden.

Markov-Chain-Beispiel-Subreddit-Simulator

Eine faszinierende Ebene dieses Experiments ist, dass Kommentare und Titel nach der Nachbarschaft klassifiziert werden, aus der die Informationen stammen, sodass sich die Arten von Bemerkungen und Titeln, die durch die Datenerfassung von / r / food erzeugt werden, stark von den Kommentaren und Titeln unterscheiden durch / r / Fußball Informationssatz.

Die verrückteste – oder möglicherweise störendste – Komponente von all dem ist, dass die erstellten Kommentare und Titel oft mit denen von echten Menschen identisch sein können. Es ist definitiv faszinierend.

Erkennen Sie andere großartige Verwendungsmöglichkeiten für Markov-Ketten? Haben Sie irgendwelche Bedenken, die noch beantwortet werden müssen? Lassen Sie uns in einer Bemerkung unten verstehen!

Sie haben vielleicht schon einmal den Begriff „Markov-Kette“ gehört, aber wenn Sie nicht einige Kurse über Möglichkeitskonzepte oder Informatikformeln besucht haben, erkennen Sie höchstwahrscheinlich nicht, was sie sind, wie sie funktionieren und warum sie sind so wichtig. Eine der faszinierenden Auswirkungen der Markov-Kettentheorie ist, dass sich mit zunehmender Länge der Kette (dh mit zunehmender Anzahl von Zustandsübergängen) die Wahrscheinlichkeit, dass Sie in einem bestimmten Zustand landen, auf einer festgelegten Anzahl zusammensetzt und diese Wahrscheinlichkeit unabhängig davon ist, wo Sie beginnen im System. In der Bedeutung werden Ihre Wörter analysiert und direkt in die Markov-Kettenmöglichkeiten der App integriert. Unter Verwendung dieser Daten werden Wort-zu-Wort-Möglichkeiten generiert – danach werden diese Wahrscheinlichkeiten genutzt, um Titel und auch Bemerkungen von Scrape zu produzieren.[

Klicken Sie, um diesen Beitrag zu bewerten!
[Gesamt: 0 Durchschnitt: 0]

Andere verwandte Artikel

Wie funktioniert Google Maps?

Google Maps ist seit über einem Jahr ein fester Bestandteil des Webs, doch einige verstehen tatsächlich, wie es funktioniert. Für…

Schreibe einen Kommentar