Vor 250 Jahren stellte der Mönch und Mathematiker Thomas Bayes seine Formel zur
Errechnung der inversen Wahrscheinlichkeit vor: mit statistischen Methoden lässt sich aus einem Ereignis (in unserem Beispiel eine eingehende Email)
durch Inhalts-Vergleich mit bekannten Daten (vorher eingegangene Emails) abschätzen, um was für eine Email es sich handelt (Abmeldung, Beschwerde, Urlaubsmail, etc.).
Die Bayesschen Formeln werden heute in leistungsstarken Spam-Filtern eingesetzt um die Wahrscheinlichkeit zu errechnen, ob eine Email aus der Kategorie Spam ist oder nicht.
Lernfähig
Das Melin 2 Bayes-Plug-In geht einen Schritt weiter: Es lassen sich beliebige Kategorien anlegen, denen dann vorhandene Emails zugeordnet werden (Trainingsphase). Über die Oberfläche kann man prüfen, ob neue Emails schon richtig erkannt werden oder ob mehr Emails zum Filtertraining erforderlich sind.
Manuelles Tuning
Eine weitere Verbesserung lässt sich durch manuelle Gewichtung
von Schlagworten erreichen die mit in die Wahrscheinlichkeitsrechnung
einbezogen werden. Im Betrieb ermittelt der Bayes-Filter nun für jede
eingehende Email in welche Kategorie diese mit der höchsten Wahrscheinlichkeit
einzuordnen ist. Im Workflow-Grid ist es möglich Fallweise zu verzweigen und
nur Aktionen auszuführen wenn die Erkennungswahrscheinlichkeit einen frei
wählbaren Schwellenwert überschreitet.
Weitere Funktionen zur BounceMail-Bearbeitung:
AUTOMATISCHES BOUNCE-MAIL-HANDLING - Melin bearbeitet alle Rückläufer (BounceMails) mit speziellen Filtern und reduziert so den Verwaltungsaufand zur Pflege des Adressdatenbestands auf ein Minimum. Hierbei wird genau unterschieden zwischen harten Rückläufern von ungültigen Emailadressen und weichen Rückläufern aufgrund von überfüllten Mailboxen, automatischen Urlaubsinformationen und manuellen Rückfragen der Empfänger. Ob und nach wievielen Rückläufern ein Abonnent endgültig gelöscht wird, kann in der Workflow-Logik frei eingestellt werden.
Bayes-Filter und die inverse Wahrscheinlichkeit
Die Funktionsweise des Bayes-Filters lässt sich am besten an einem Beispiel aus der Medizin nachvollziehen:
Angenommen, es gibt eine seltene Krankheit, die von 10.000 Menschen einen befällt und durch eine Operarion geheilt werden kann. Dazu gibt es einen Test eines Herstellers, der die Krankheit zu 99% sicher erkennt. Lassen sich nun die 10.000 Menschen testen, so erkennt der Test bei 9.900 Personen sicher, daß diese gesund sind, bei 100 erkennt der Test die Krankheit und diese müssten operiert werden.
Mit Hilfe der inversen Wahrscheinlichkeit kann man nun jedoch das Ergebnis korrigieren,
denn man weiß auch,
daß von 10.000 Personen im Mittel nur eine erkrankt ist. Von den 100 sind also 99 gesund, obwohl der Test eine Krankheit erkannt hat.
Die Bayes-Formeln ermitteln in diesem Fall, daß ein Patient, der als krank erkannt wird, trotzdem zu 98% gesund ist.
Der Melin-Bayes-Filter ermittelt Häfigkeiten von Wörtern und Wortmustern in den in Klassen eingeordneten Emails und vergleicht diese mit eingehenden Emails. Auf diese Weise kann eine Wahrscheinlichkeit ermittelt werden, mit welcher Absicht diese Mail geschickt wurde. Ab einem definierbaren
Schwellenwert wird die Mail dann klassifiziert.
Hier zeigt sich auch wieder der Vorteil des Workflow-Ansatzes von Melin, da je nach Klasse und Gewichtung mit unterschiedlichen Workflows gearbeitet werden kann.
|
|
 |
Einsatz im Gesundheitswesen - Krankenversicherungen können personalisierte, vertrauliche Informationen über Vorsorgemaßnahmen an ihre Mitglieder versenden. Rechtzeitige Hinweise auf alterbedingte Risiken und Vorsorgemöglichkeiten kann das Auftreten von nicht rechtzeitig diagnostizierten Krankheiten verringern.
|