前の日 / 次の日 / 最新

swk's log

2006-04-09 Sun

* コメントスパムと戦ってみる [logging]

結論から言うと,敗北です.

kuttukibbs に,できるだけ簡単な修正を加えるだけでどこまでコメントスパムをブロックできるか試してみた.

巷でよく行われているのは,「2 byte 文字がいっさい含まれていないものは無条件で弾く」というもの.日本語サイトの場合,ほぼこれで問題無いわけなのだけど,なんていうか,ほら,技術的に 負け って感じがするじゃないですか(ぉ.というわけでもう少しギリギリの所で戦えないかと試してみたかったわけですよ.

戦略は以下の通り:

  • 投稿 form に hidden な input 要素を埋め込んでおく.これがが送られて来なかったら弾く
  • 投稿 form のページで cookie を配る.書き込みリクエストのときにこの cookie が一致しなかったら弾く
  • いかにもな NG ワードを弾く.いまのところ ringtone, casino, cialis, viagra が対象
  • 妙にテンションの高い書き出しを弾く.いまのところ /^(cool|very good|good|nice|great|excellent) (job|site|website|work)\W/i が対象

やってみるといずれもそれなりに有効で,そこそこ引っかかってくれる.最初の hidden なタグを埋め込んどく程度の低レベルなやつでも,全く無力というわけではないみたい.

だけど,ある特定の記事 (具体的には [2006-03-07-2] なのだが) については,これらをすり抜けて来る奴ら続出.強力なのにマトかけられちゃったっぽい.というわけで「この記事限定」で「2 byte 文字が含まれておらず,かつ URL らしき文字列で終わっているもの」はすべて弾くことにした.

一応これでいまのところ完全封殺.なのだけど,勝ち負けで言ったら敗北ですな.

Movable Type とかだと,いったん必ず Preview ページを表示して,そこで hidden なパラメータを配るなんて方法がよく使われているらしい.でもこれも対策が取られるのは時間の問題かなという気もする.

結論:

  • 2 byte 文字の有無でのフィルタリングは,日本語サイトの場合,かなり最適に近い現実解っぽい
  • 真面目にやるならベイジアンフィルタでもかますのが正しそう
関連記事:
[2007-04-21-1] コメントスパム対策として,計算問題を入れてみた
[ コメントを全部見る / コメントを書く] [ TrackBack ( )] [固定リンク]

* [Pd8ruxef2l] goose jacket yoke wong improvisation in ... (2014-10-23 18:38:30)

* [Whktjmfl] France - In the past few months, we expe... (2014-04-25 18:41:30)

* [Fkhluizl] , <a href="">オ... (2014-04-14 22:49:27)

* ドメイン移管 [homenet] 1 user

kagami.org のドメインは onamae.com を通して取得した.2002 年頃の話.で,実はだんだん不満が溜ってきていた.

onamae.com の嫌なところ:

whois には自宅住所を登録していたのだけど,1 年前に物理的に引っ越したのを実は反映しないまま放置していた.まずいなあとは思っていたのだけど,上記のような状況なので,あまり住所更新したくなかったんである.

というわけで,レンタルサーバを移動したのを機に,ドメインもさくらインターネットに移管することにした.

で,.org の場合は AuthCode ってのを移管元から聞いて移管先に伝えなくてはならないらしい.どこに書いてあるんだろう.と思って調べたら,メールで聞け,らしい.めんどくさ.送ってみたところ,翌営業日には返事が来て AuthCode が届いた.

さくらインターネット側では,この AuthCode を使って 移管の申し込み をウェブからする.ものの数分で 承認依頼 メールが届く.メールに従って,Melbourne IT のサイトで承認手続き.

さて待つこと約 1 週間,ドメイン移管完了のメールがさくらインターネットから届く.どれどれ,と whois を引いてみると,Registrant と Admin は以前のまま (引っ越す前の住所) 変わっていない.FAQ には 『ドメイン登録時に「登録者のお名前(英字表記を含む)」以外の項目(登録者住所・担当者等)は、すべて弊社情報にて登録します。』 とあったので,自動的にそうなっているのを期待していたのだけど.というわけでサポートにメールを書く.

翌日にメールで回答.メールには会社の住所等が書かれていて,その内容に自分で書き変えて下さいと来た.確かにウェブの設定ページから書き換えられるようになっているんだけど,そんなもん自由に書き換えられたらまずいじゃないですか.とか思いつつ書き換えてみたら,瞬時に whois に反映されている.いいのかおい.

しかも,メールで伝えられた住所が,既に登録されている Tech のものと微妙に (英語表記のスペリングとかが) 違っていて気持ち悪い.あと, Registrant の名前がなぜか「ShingoKagami」とくっついちゃってるのはなぜだろう.というわけで再度サポートへメール送信.

やはり翌日返事が来て,住所のスペル違いは直しました,らしい. ShingoKagami の方は,移管前からそうだったらしい.手元にある 2002 年当時のログだと,ちゃんと Shingo Kagami になっているんだけどな.その後なにかの拍子に変わっちゃったのかな.レジストリが PIR に変わったときとか? (← 根拠無し)

まあこのままでも全然困らないし,Registrant 名を変えるには 1,800 円かかるらしいので,放置で.


(*1) onamae.com の主張では,これは .org のレジストリである PIR の要請らしいので,一概に onamae.com を責められないのだけど.

で,当の PIR はというと,ICANN との契約のせいだと主張している.なんだかよくわからん.

<< 2006-04 >>
SuMoTuWeThFrSa
1
2345678
9101112131415
16171819202122
23242526272829
30

2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12
2002 : 01 02 03 04 05 06 07 08 09 10 11 12
2001 : 01 02 03 04 05 06 07 08 09 10 11 12
2000 : 01 02 03 04 05 06 07 08 09 10 11 12
1999 : 01 02 03 04 05 06 07 08 09 10 11 12
1998 : 01 02 03 04 05 06 07 08 09 10 11 12
1997 : 01 02 03 04 05 06 07 08 09 10 11 12
1996 : 01 02 03 04 05 06 07 08 09 10 11 12

最終更新時間: 2012-02-13 02:02


Shingo W. Kagami - swk(at)kagami.org