Theorem von Bayes/Beispiel: Spam Mail filtering: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „== Beispiel: E-Mail filtering == https://de.wikipedia.org/wiki/Satz_von_Bayes Jeder der E-Mail benutzt kennt das Problem: man erhält Tag für Tag Spam-Mails,…“)
 
Zeile 20: Zeile 20:


Der Bayes Filter berechnet die Wahrscheinlichkeit des Ereignisses SPAM = {E-Mail ist SPAM} anhand der Worte, die in der E-Mail verwendet werden.
Der Bayes Filter berechnet die Wahrscheinlichkeit des Ereignisses SPAM = {E-Mail ist SPAM} anhand der Worte, die in der E-Mail verwendet werden.
<br><br><br>
<br><br>
<math>
<math>
\begin{align}
\begin{align}
Zeile 27: Zeile 27:
\end{align}
\end{align}
</math>
</math>
<br><br><br>
<br><br>
Wird die  totale Wahrscheinlichkeit
Wird die  totale Wahrscheinlichkeit
<br><br><br>
<br><br>
<math>
<math>
\begin{align}
\begin{align}
Zeile 38: Zeile 38:
\end{align}
\end{align}
</math>
</math>
<br><br><br>
<br><br>
weiter aufgelöst, dann sieht man die Anwendung des Theorem von Bayes.
weiter aufgelöst, dann sieht man die Anwendung des Theorem von Bayes. Wäre jetzt
<br><br>
<math>P(SPAM|Deutscher\text{ }Strassenpenner..) > c</math>
<br><br>
dann würde eine E-Mail als SPAM Mail klassifiziert und in den Junk Ordner verschoben statt in die Inbox.
 
=== Problem: Totale Wahrscheinlichkeit ===
 
Um sich die Berechnung der totalen Wahrscheinlichkeit zu ersparen wird stattdessen
<br><br>
<math>
\frac{P(SPAM|Deutscher\text{ }Strassenpenner..)}{P(\overline{SPAM}|Deutscher\text{ }Strassenpenner..)}
= \frac{P(Deutscher\text{ }Strassenpenner...|SPAM)\cdot P(SPAM)}{P(Deutscher\text{ }Strassenpenner...|\overline{SPAM})\cdot P(\overline{SPAM})} > c
</math>
<br><br>
 
betrachtet, da sich die totale Wahrscheinlichkeit hier rauskürzt. Man schaut also darauf wie viel wahrscheinlicher ist es, dass eine E-Mail mit dem Text ''Deutscher Strassenpenner...'' eine SPAM E-Mail ist im Verhältnis dazu sie keine SPAM E-Mail ist. <math>c</math> liegt meist in einem Bereich von 5 - 10.

Version vom 5. Juli 2020, 05:50 Uhr

Beispiel: E-Mail filtering

https://de.wikipedia.org/wiki/Satz_von_Bayes Jeder der E-Mail benutzt kennt das Problem: man erhält Tag für Tag Spam-Mails, die meist von der E-Mail-Software in den Junk Ordner verschoben wird. Eine Methode um Spam-Mails zu erkennen ist der Bayes-Filter.

Deutscher Strassenpenner wurde zum Superreichen mit einem Vermögen von 82.000.000 Euro (Mio. Euro) ...und das in nur einem Jahr!

Diese Geschichte ist erst paar Tage alt. Doch schon sehr viele TV-Sender berichteten darüber...

...

Für Anfänger hat er jetzt eine Webseite erstellt, die jedem ganz leicht zeigt wie er es gemacht hat und wie es geht!

1000 Mal möchte er dieses System kostenfrei weitergeben. Danach wird es 1499 Euro kosten. Es ist nur noch für 49 Interessenten kostenfrei erhältlich, danach wird die Seite offline genommen!

Bayes Filter

Der Bayes Filter berechnet die Wahrscheinlichkeit des Ereignisses SPAM = {E-Mail ist SPAM} anhand der Worte, die in der E-Mail verwendet werden.



Wird die totale Wahrscheinlichkeit



weiter aufgelöst, dann sieht man die Anwendung des Theorem von Bayes. Wäre jetzt



dann würde eine E-Mail als SPAM Mail klassifiziert und in den Junk Ordner verschoben statt in die Inbox.

Problem: Totale Wahrscheinlichkeit

Um sich die Berechnung der totalen Wahrscheinlichkeit zu ersparen wird stattdessen



betrachtet, da sich die totale Wahrscheinlichkeit hier rauskürzt. Man schaut also darauf wie viel wahrscheinlicher ist es, dass eine E-Mail mit dem Text Deutscher Strassenpenner... eine SPAM E-Mail ist im Verhältnis dazu sie keine SPAM E-Mail ist. liegt meist in einem Bereich von 5 - 10.