Sì, avevo pensato di estrarre anche gli spamvertised sites, ma a volte sono joe-jobs - oppure qualcuno ci infila "ad arte"
http://www.spamhaus.org o
http://www.spews.org, tanto per causare un po' di danni...
I problemi tecnici (mime encoded mail, oppure commenti html all'interno del testo) sono ampiamente superabili. Diciamo così che verso la 1.1 ci farò un pensierino.
Pjfry, se hai linux, per trovare chi lartare (non è il modo più veloce, ma funziona) di solito faccio così:
1) cerco il nameserver authoritative per il dominio (vabbé, qualcuno lo ricordo a memoria)
dig +norecurse +authority ns biz
2) ammesso che sia 1.2.3.4, cerco il nameserver authoritative per il dominio dello spammer
dig +norecurse +authority ns spammersite.biz @1.2.3.4
3) ammesso che sia 4.5.6.7, gli chiedo (e controllo che mi risponda con il flag authority, e che non sia un risultato "cached") l'indirizzo del sito
dig +norecurse +authority a
http://www.spammersite.biz @4.5.6.7
4) larto nella solita maniera il provider che ospita il sito e chi ospita i nameservers (di solito sono più di uno, a volte qualcuno è falso).
E' peraltro possibile che ricorrano a "strani trucchi", come nascondere il vero host dietro ad un proxy (non consentendone l'accesso diretto), oppure piazzando "falsi" record dns (e quindi controllali prima di lartare).
E' anche importante usare direttamente il nameserver authoritative, perché i risultati "cached" nel tuo nameserver potrebbero essere errati (si spostano spesso, i vigliacchi).
Beh, tutto sommato temo che mi toccherà scrivere un tutorial anche su questo...
Il faut être toujours ivre. Tout est là : c'est l'unique question. Pour ne pas sentir l'horrible fardeau du Temps qui brise vos épaules et vous penche vers la terre,il faut vous enivrer sans trêve...