Segunda-feira, 20 de Agosto de 2007

Servidor caseiro - XXII

O FuzzyOCR é um plugin para o SpamAssassin que se destina a apanhar SPAM por palavras contidas em imagens nas mensagens de correio electrónico, algo que se está a tornar moda no basfond dos spammers.

O FuzzyOCR necessita primeiro que seja instalado algum software antes dele próprio:

Dois módulos PERL:
String::Approx
Time::HiRes
# perl Makefile.PL && make && make install

A giflib:
# ./configure && make && make install && ldconfig

A libungif:
./configure && make && make install && ldconfig

O ocrad:
./configure && make && make install

A netpbm:
# ./configure
# make
# make package pkgdir=/usr/local/lib/netpbm
# ./installnetpbm

O gocr com suporte a netpbm:
# ./configure --prefix=/usr/local --with-netpbm=../netpbm-10.26.42
# make
# make install

O gifsicle:
# ./configure
# make
# make install

O FuzzyOCR:
# cp -p -r FuzzyOcr* /etc/mail/spamassassin/


Em /etc/mail/spamassassin, está agora um ficheiro chamado FuzzyOcr.words que contém a lista de palavras que ele procura nas imagens.
Podemos acrescentar a gosto quantas quisermos.

Convém acrescentar o PATH dos binários do netpbm ao PATH do sistema:
# export PATH=$PATH::/usr/local/netpbm/bin/


Vou agora enviar um e-mail da minha conta do GMail, sem qualquer texto, apenas com a seguinte imagem:


e verificar qual o resultado.

Chegada a mensagem, vou ver o envelope para verificar o resultado:

From - Mon Aug 20 22:37:21 2007
X-Account-Key: account6
X-UIDL: 1187645780.11464.planetgeek.dynip.sapo.pt,S=28372
X-Mozilla-Status: 0001
X-Mozilla-Status2: 10000000
X-Mozilla-Keys:                                                                                
Return-Path: <gamito@gmail.com>
Delivered-To: teste@planetgeek.dynip.sapo.pt
Received: (qmail 11461 invoked by uid 513); 20 Aug 2007 21:36:20 -0000
Received: from 209.85.128.185 by planetgeek.dynip.sapo.pt (envelope-from <gamito@gmail.com>, uid 0) with qmail-scanner-2.01
 (f-prot: 4.6.7/3.16.15. spamassassin: 3.2.3. 
 Clear:RC:0(209.85.128.185):SA:1(8.0/5.0):.
 Processed in 14.989563 secs); 20 Aug 2007 21:36:20 -0000
X-Spam-Status: Yes, score=8.0 required=5.0
X-Spam-Level: ++++++++

(...)

Received: by 10.82.108.9 with SMTP id g9mr5049417buc.1187645797008;
        Mon, 20 Aug 2007 14:36:37 -0700 (PDT)
Received: by 10.82.100.10 with HTTP; Mon, 20 Aug 2007 14:36:36 -0700 (PDT)
Message-ID: <91df29a20708201436lb3458a6j3c4fe5c266baed3d@mail.gmail.com>
Date: Mon, 20 Aug 2007 22:36:36 +0100
From: "=?ISO-8859-1?Q?M=E1rio_Gamito?=" <gamito@gmail.com>
To: teste@planetgeek.dynip.sapo.pt
Subject: [+++ SPAM +++] Teste FuzzyOCR
MIME-Version: 1.0
Content-Type: multipart/mixed;

(...)


Conforme se pode verificar, a mensagem apenas com a imagem foi classificada com um score de 8.0, logo é SPAM.

E pode ver-se no Thunderbird:



Cool, isnt't it ?
tags:
publicado por gamito às 22:42
link do post | comentar
Os comentários são da exclusiva resonsabilidade dos seus autores.
Mário Gamito, 2004 - 2007
Todos os direitos reservados.

Mais sobre mim

pesquisar

Janeiro 2008

Dom
Seg
Ter
Qua
Qui
Sex
Sab
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Posts recentes

Portagens

Há 20 anos atrás... *sigh...

Vou criar a minha própria...

Finalmente

SAPO codebits

Sporting

Caixa Mágica e Mandriva

A1 Aveiro - Lisboa

Browser mamão

gFTP

PlayStation 3 e Sony

Mas quem é o gajo ?

Negócios do Open Source

Não estão fartos disto ?

Naughty, naughty

PHP chrooted

Joomla

Novo Projecto

MySQL :: It's the ctl, st...

MySQL :: Just a little ti...

MySQL chrooted

BASH, stdout e stderr

4 kb stack ou 8kb stack

A funny guy...

Truques, Minas e Alçapões...

Truques, Minas e Alçapões...

Logs do mrtg

Salmos, 23

Servidor caseiro - XXVII

Servidor caseiro - XXVI

Servidor caseiro - XXV

Números de telemóvel aban...

Servidor caseiro - XXIV

Humm...

Servidor caseiro - XXIII

Servidor caseiro - XXII

Servidor caseiro - XXI

Servidor caseiro - XX

Servidor caseiro - XIX

Ubuntu : O Enigma

Leixões 1 - Benfica 1

Servidor caseiro - XVIII

Servidor caseiro - XVII

Servidor caseiro - XVI

Servidor caseiro - XV

Servidor caseiro - XIV

Servidor caseiro - XIII

Servidor caseiro - XII

Servidor caseiro - XI

Servidor caseiro - X

Arquivos

Contacto

gamito@gmail.com

No Planeta Geek

tags

todas as tags

subscrever feeds