Objectif

Eliminer le pourriel en fonction de la ponctuation

Chaque langue a ses règles de ponctuation.

En français, l’usage veut que l’on mette un espace après le dernier mot d’une phrase si cette dernière est ponctuée d’un signe double :

  • le point virgule ( ;), le point d’exclamation (!) et d’interrogation (?), les deux points ( :).
  • Avant les signes de ponctuation uniques comme le point et la virgule, on ne met pas d’espace.

En anglais, le signe de ponctuation, même double, suit immédiatement le dernier mot de la phrase.
D’où problème lorsqu’il s’agit de filtrer les spams en fonction de leur ponctuation terminale.

1) Ponctuation finale

Certains sujets de messages sont volontairement mal ponctués.
Ainsi :

  • 1) scanty umbra heine - se termine par un espace suivi d’un trait d’union.
  • 2) pressure verona glottis— se termine par 2 traits d’union sans espace.
  • 3) infusion arizona doorkeep _ se termine par 1 espace suivi d’un tiret bas.

Chacun des messages donnés en exemple peut en plus se terminer avec un espace après le signe de ponctuation. Cet espace est difficile à percevoir.

Pour éliminer ces messages :

Avec un signe de ponctuation accolé à la dernière lettre :

  • 1) et 2) : *- : en mode exact.
  • 3) *_ : en mode exact.
    ainsi de suite pour tout signe de ponctuation irrecevable.

Le pourriel suivant :

  • L’évènement ! - 50 euros sur votre prochain mobile !!!

est éliminé par le filtre !! en mode partiel qui refuse un nombre de points d’exclamation supérieur ou égal à 2. En mode exact il faudrait créer le filtre : * !!!
On peut appliquer le même principe pour le point d’interrogation.

Niveau expert :
Vérifiez toujours si un sujet se termine par un espace.
Pour éliminer tout message ou adresse de polluposteur se terminant par un espace le joker perso £ qui remplace l’espace s’avère très utile :

  • : en mode exact.

Voir l’article £ pour filtrer les sujets avec suite d’espaces


Jokers perso proposés : ¢ en association avec la liste perso ¥.
Filtres créés : *¥¢ et *¥¢* en mode exact dans le gestionnaire de filtres par sujets ().

Objectif :
Eliminer les signes de ponctuation anglo-saxons immédiatement collés à la dernière lettre d’un mot en fin de phrase dans les sujets de messages.
Signes de ponctuation concernés : ? ! ; :

Prérequis / Conditions préalables :
Lire la rubrique Jokers Perso et plus particulièrement Créer un joker perso.
Lire l’article Le B.A.-BA des jokers intégrés.

Méthode :
1) Créez une liste perso ¢ (alt+162) dans la section [JokerPerso] du fichier outclock.ini.

  • ListePonctuationGB-US=¢,?!;:

2) Créez une liste perso ¥ (alt+165) dans la section [JokerPerso] du fichier outclock.ini.

  • ListeAlphabetGB-US=¥,abcdefghijklmnopqrstuvwxyz1234567890
  • Vous pouvez donner aux listes perso le nom qui vous convient.
  • Les symboles ¥ et ¢ sont choisis arbitrairement.

Ce qui donne dans outclock.ini en début de fichier :

  • [JokerPerso]
    ListeAlphabetGB-US=¥,abcdefghijklmnopqrstuvwxyz1234567890
    ListePonctuationGB-US=¢,?!;:

La liste ListeAlphabetGB-US, comme toutes les listes perso, peut naturellement être personnalisée. On peut y ajouter des signes et des lettres qui normalement ne se trouvent pas à la fin d’une phrase anglaise « acceptable » devant un point d’interrogation, d’exclamation ou autre comme ({}§[)~] etc.
A ces listes perso peuvent s’ajouter d’autres listes perso de votre cru ou des listes comme celles décrites dans Créer un joker perso.

N’oubliez pas la virgule après ¥ et ¢

Chacun peut créer une liste de sa propre composition en fonction des pourriels reçus.
On peut utiliser la temporisation de 30secondes par défaut avant d’adopter définitivement la liste.

En pratique :

Dans le gestionnaire de filtres par sujets
a) Le gestionnaire de filtres par sujets

gest_filtres_sujets

Gestionnaire de filtres par sujets

A noter les options :

  • Rejeter d’office.

  • Détruire au bout de 30 s.

  • Garder au bout de 30s.

  • Garder toujours.

b) Le gestionnaire de création/modification de filtres par sujets :

gest_filtres_sujets-3

Créer un filtre sujet

Créez le filtre suivant en mode exact : *¥¢

Ce filtre élimine des messages tels que :
Why don't you join?
Happy April Fools Day!
Send your subscription form right now!
Our new offer;
This is what you get:
Take 5!
Take five!


3) Pourquoi ?

  • ¢ remplace l’un quelconque des signes ? ; : !
  • ¥ remplace l’une quelconque des lettres abcdefghijklmnopqrstuvwxyz et l’un quelconque des chiffres 1234567890 immédiatement placés avant ¢ sans espace.

Il n’élimine pas les mêmes messages si les signes de ponctuation sont séparés de la dernière lettre par un espace comme en français.

Risque :
Le risque d’éliminer un message français existe si l’expéditeur ne respecte pas les règles de la ponctuation française qui veulent qu’une ponctuation composée de 2 signes soit séparée de la dernière lettre d’une phrase par un espace. Ce qui n’est pas le cas en anglais.

  • Attention : Les sujets de messages commençant par Re: (sans espace) seront considérés comme indésirables ! fwd: également.
  • Si vous en recevez, et que vous les considérez comme acceptables, vous pouvez enlever les deux points ( :) de la liste ListePonctuationGB-US=¢,?!;:

Autres cas :
Dans le gestionnaire de filtres par sujets créez le filtre suivant en mode exact :

  • *¥¢* qui élimine :

Don't be vague! Ask for Haig.
Why not try our new offer? It's free.
This is what you get: a 15-day free trial of our cutting edge software.
New application; new software.
Take 5! And say no more.
Take five! And say no more.

Les plus
Le filtre *¥¢* élimine aussi les points d’interrogation et d’exclamation à répétition :
No way!!!
What did you say????
Did you say 5????

Pourquoi ?

  • ¢ remplace l’un quelconque des signes ? ; : !
  • ¥ remplace l’une quelconque des lettres abcdefghijklmnopqrstuvwxyz et l’un quelconque des chiffres 1234567890 immédiatement placés avant ¢ sans espace
  • * remplace toute chaîne de caractères placée avant ¥ et après ¢
Par prudence, choisissez l’option « Demander mais détruire si pas d’action pendant 30secondes » ou « Demander mais garder si pas d’action pendant 30secondes ».

N.B. On ne peut pas choisir n’importe quel signe comme joker perso.
Il faut opter pour des signes qui ne figurent dans aucun des filtres, même dans les filtres expéditeurs ou destinataires.
« @ » est exclu car il est présent dans toute adresse électronique.
Si on choisit le signe « - » comme joker perso d’une autre liste perso, le filtre interprète les « - » des adresses d’expéditeurs comme étant à rejeter, par exemple Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser..
Il faut prendre des signes qui ne se trouvent pas normalement dans des en-têtes analysées par OutClock.
En conséquence, il faut choisir comme joker perso des signes…

  • 1) absents la Liste elle-même.
  • 2) absents des filtres déjà existants.
  • 3) absents des en-têtes sinon rarement dans celles de spams.