[spamassassin] autolearn

autolearn [spamassassin] - Codes et scripts - Linux et OS Alternatifs

Marsh Posté le 18-04-2004 à 13:50:06    

salut
je suis entrain d'essayer d emettre en place l'autolearn de spamassassin ...
donc heureusement j'ai deux maildir, un avec plein de spam, et l'autre avec plein de bons messages (environ 300 chacun)...
j'ai donc lancé tout simplement:

Code :
  1. sa-learn --ham /le/bon/dossier
  2. .... 300 messages marqués comme bon ....
  3. sa-learn --spam /le/mechant/dossier
  4. .... 340 messages marqués comme méchant ....
  5. sa-learn --rebuild


mais pourtant je continue de recevoir des messages avec, dans l'entête par exemple:
 
X-Spam-Level: *
X-Spam-Status: No, hits=1.8 required=5.0 tests=AWL,PRIORITY_NO_NAME
     autolearn=no version=2.63
 
 
 
voila donc je voudrais vous demander s'il y a un fichier de conf à modifier quelque part pour activer l'autolearn, ou que faut il faire pour que ca marche !
merci:jap:

Reply

Marsh Posté le 18-04-2004 à 13:50:06   

Reply

Marsh Posté le 18-04-2004 à 13:58:30    

Je pense qu'il s'active quand il estime avoir assez appris.
 
extrait du man de sa-learn
 

Citation :


SpamAssassin 2.50 and later supports Bayesian spam analysis, in the form of the BAYES rules. This is a new feature,
       quite powerful, and is disabled until enough messages have been learnt.


Message édité par cassidy le 18-04-2004 à 13:59:31
Reply

Marsh Posté le 18-04-2004 à 14:34:31    

snif je veux le tester tel quel :'( je veux qu'il me filtre mes mechants messages :'(

Reply

Marsh Posté le 18-04-2004 à 14:42:47    

k666 a écrit :

X-Spam-Level: *
X-Spam-Status: No, hits=1.8 required=5.0 tests=AWL,PRIORITY_NO_NAME
     autolearn=no version=2.63
 
voila donc je voudrais vous demander s'il y a un fichier de conf à modifier quelque part pour activer l'autolearn, ou que faut il faire pour que ca marche !
merci:jap:

Tu n'auras autolearn=yes, que pour les spams avec un gros score
 
Pour activer le bayes il suffit de mettre
auto_learn              1
dans ~/.spamassassin/user_prefs
 
Et quand il aura assez de message tu vas commencer à avoir des points pour le score bayésien dans la note du message. Mais 300 & 300 ca devrait suffire :)


---------------
Fluctuat nec mergitur
Reply

Marsh Posté le 18-04-2004 à 15:07:51    

je viens de rajouter auto_learn 1 dans ledit fichier et me suis envoyé un mail et j'ai toujours le autolearn à no !
j'ai donc essayé avec autolearn 1 mais pareil !
la syntax est bien auto_learn ? :/

Reply

Marsh Posté le 18-04-2004 à 15:10:29    

k666 a écrit :

je viens de rajouter auto_learn 1 dans ledit fichier et me suis envoyé un mail et j'ai toujours le autolearn à no !
j'ai donc essayé avec autolearn 1 mais pareil !
la syntax est bien auto_learn ? :/

je t'ai dit que le autolearn=yes dans les headers tu l'auras que pour les messages avec des gros scores. CA n'a rien à voir avec l'utilisation ou non du bayes


---------------
Fluctuat nec mergitur
Reply

Marsh Posté le 18-04-2004 à 15:44:38    

ah je croyais en fait que suite au passage par bayes il attribuait aussi une pénalité qui compte dans le calcul final de points !
mais apparemment c pas ça ? donc j'ai un peu de mal à voir ou ça intervient le bayes ?
et sinon j'ai eu des messages avec 20points mais pourtant autolearn est otujours resté à no :/
snif voilà si tu te le sens de m'expliquer un chtit poil plus histoire que j mette bien au point tout ça *? :)
merci:jap:

Reply

Marsh Posté le 18-04-2004 à 20:54:39    

bon bah d'apres ce que j'ai pu lire dans la doc:

Code :
  1. perldoc Mail::SpamAssassin::Conf


il ya plusieurs choses réglables, comme l'autolearn etc...
on peut activer ou désactiver, par défaut c'est activé, et le flag à mettre dans ~/.spamassassin/user_prefs est:
 
bayes_auto_learn ( 0 | 1 )      (default: 1)
 
s'ensuit plein d'autres trucs comme bayes_learn_during_report et autres qu'on peut tweaker !
 
voila merci à vous maintenant mon truc marche :)

Reply

Marsh Posté le 19-04-2004 à 16:18:04    

bon bin en effet mon truc autolearn quand les messages ont un hitpoints plus que 10; la je peux voir dans les entetes un autolearn=spam donc super ca améliore mon filtre bayesien sans que j'aie rien à faire !
 
tu avais donc raison floups et je t'en remercie:jap:

Reply

Marsh Posté le 22-04-2004 à 13:16:23    

bon bin mes doutes sont erradiqués; en effet spamassassin automatiquement, à partir d'un apprentissage suffisant, se met à utiliser le filtre bayésien, la pondération n'est par contre pas assez importante à mes yeux et je vais essayer de trouver le réglage;

Code :
  1. Détails de l'analyse du message:   (8.8 points, 5.0 requis)
  2. 0.1 HTML_FONTCOLOR_UNKNOWN BODY: Police HTML de couleur inconnue
  3. 2.1 BAYES_90               BODY: L'algorithme Bayésien a évalué la probabilité de
  4. spam entre 90 et 99%
  5.                             [score: 0.9780]
  6. 0.1 HTML_MESSAGE           BODY: HTML inclus dans le message
  7. 0.3 MIME_HTML_ONLY         BODY: Le message possède uniquement des parties MIME
  8. text/html
  9. 1.0 HTML_IMAGE_ONLY_04     BODY: HTML contient images avec 200 à 400 octets de texte
  10. 1.2 RCVD_IN_SORBS_SOCKS    RBL: SORBS: Envoyé par un proxy SOCKS ouvert
  11.                             [200.162.243.227 listed in dnsbl.sorbs.net]
  12. 1.1 RCVD_IN_SORBS_HTTP     RBL: SORBS: Envoyé par un proxy HTTP ouvert
  13.                             [200.162.243.227 listed in dnsbl.sorbs.net]
  14. 0.7 RCVD_IN_DSBL           RBL: Relais listé dans list.dsbl.org, voir http://dsbl.org
  15.                             [<http://dsbl.org/listing?ip=200.162.243.227>]
  16. 1.5 RCVD_IN_BL_SPAMCOP_NET RBL: Relais listé dans http://spamcop.net/bl.shtml
  17.              [Blocked - see <http://www.spamcop.net/bl.shtml?200.162.243.227>]
  18. 0.5 RCVD_IN_NJABL_PROXY    RBL: NJABL: Envoyé depuis un proxy ouvert
  19.                             [200.162.243.227 listed in dnsbl.njabl.org]
  20. 0.1 RCVD_IN_SORBS          RBL: SORBS: Relais listé dans SORBS
  21.                             [200.162.243.227 listed in dnsbl.sorbs.net]
  22. 0.1 RCVD_IN_NJABL          RBL: Relais listé dans http://www.njabl.org (dnsbl)
  23.                             [200.162.243.227 listed in dnsbl.njabl.org]

Reply

Marsh Posté le 22-04-2004 à 13:16:23   

Reply

Marsh Posté le 22-04-2004 à 14:09:52    

k666 a écrit :

bon bin mes doutes sont erradiqués; en effet spamassassin automatiquement, à partir d'un apprentissage suffisant, se met à utiliser le filtre bayésien, la pondération n'est par contre pas assez importante à mes yeux et je vais essayer de trouver le réglage


 
Moi au contraire je vais relever les points pour les sites d'openrelay.
Ces derniers temps plusieurs spams ont réussi à arriver dans ma inbox (ce qui était pas arrivé depuis des mois), en trompant les filtres et l'algorithme bayésien.
 
- Pour les filtres en coupant les mots avec des tags HTML bidons (le message s'affiche quand même correctement). Par exemple: V</aol>I</aol>A</aol>G</aol>R</aol>A
 
- Pour le bayes, en intégrant des listes de mots aléatoires, et même plusieurs paragraphes qui semblent copiés / collés d'un livre, cachés dans le message ou même visibles.
 
Donc j'espere qu'une nouvelle version de spamassassin va bientot sortir pour corriger tout ça parce que les spammeurs sont en train de reprendre l'ascendant :(
 
Ou il me suffirait peut etre de baisser le seuil de détection du spam à 0 points. Presque tous mes mails légitimes sont dans les -4 / -5


---------------
Fluctuat nec mergitur
Reply

Marsh Posté le 22-04-2004 à 14:58:32    

ah comment tu fais pour faire du score négatif mis à part les whitelist ? et d'ailleurs as tu une astuce pour faciliter l'insertion en white list ? paske l'édition al la mano c auche


Message édité par k666 le 22-04-2004 à 14:58:49
Reply

Marsh Posté le 22-04-2004 à 15:19:10    

BAYES_00 -> score négatif
 
Pour les whitelist j'utilise pas mais y a une fonction qui autowhitelist en fonction du score.
 
Et pour les spams, j'ai rajouté tout un tas de scripts customs venant de http://wiki.apache.org/spamassassin/CustomRulesets et http://www.emtinc.net/spamhammers.htm , et ça fait à nouveau péter les scores :bounce:


---------------
Fluctuat nec mergitur
Reply

Marsh Posté le 06-02-2006 à 13:03:05    

Comment on fait pour rajouter ces règles ?
[pas du tout pro de spamassassin pour ma part]

Reply

Marsh Posté le 28-02-2007 à 11:33:14    

Bonjour,
 
J'ai le même soucis que vous à savoir des spam qui passe malgré miltergrylist (comment cela se face)
 
Comment et dans qu'elle fichier peut t'on modifier les sites d'openrelay
 
Comment faire apprendre a spamassasin les e-mails qu'il à laissé passés sont des spams.
 
J'ai cru lire dans la doc qu'il était possible de lui faire scanner des mails en lui disant que c'était des spams afin qu'il apprenne.
 
Merci de votre aide.
 
Et bonne journée.
 

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed