Objectif

Eliminer le pourriel en fonction de la ponctuation

Chaque langue a ses règles de ponctuation.

En français, l’usage veut que l’on mette un espace après le dernier mot d’une phrase si cette dernière est ponctuée d’un signe double :

  • le point virgule ( ;), le point d’exclamation (!) et d’interrogation (?), les deux points ( :).
  • Avant les signes de ponctuation uniques comme le point et la virgule, on ne met pas d’espace.

En anglais, le signe de ponctuation, même double, suit immédiatement le dernier mot de la phrase.
D’où problème lorsqu’il s’agit de filtrer les spams en fonction de leur ponctuation terminale.

1) Ponctuation finale

Certains sujets de messages sont volontairement mal ponctués.
Ainsi :

  • 1) scanty umbra heine - se termine par un espace suivi d’un trait d’union.
  • 2) pressure verona glottis— se termine par 2 traits d’union sans espace.
  • 3) infusion arizona doorkeep _ se termine par 1 espace suivi d’un tiret bas.

Chacun des messages donnés en exemple peut en plus se terminer avec un espace après le signe de ponctuation. Cet espace est difficile à percevoir.

Pour éliminer ces messages :

Avec un signe de ponctuation accolé à la dernière lettre :

  • 1) et 2) : *- : en mode exact.
  • 3) *_ : en mode exact.
    ainsi de suite pour tout signe de ponctuation irrecevable.

Le pourriel suivant :

  • L’évènement ! - 50 euros sur votre prochain mobile !!!

est éliminé par le filtre !! en mode partiel qui refuse un nombre de points d’exclamation supérieur ou égal à 2. En mode exact il faudrait créer le filtre : * !!!
On peut appliquer le même principe pour le point d’interrogation.

Niveau expert :
Vérifiez toujours si un sujet se termine par un espace.
Pour éliminer tout message ou adresse de polluposteur se terminant par un espace le joker perso £ qui remplace l’espace s’avère très utile :

  • : en mode exact.

Voir l’article £ pour filtrer les sujets avec suite d’espaces