HOME  >  研究内容  >  電子メールフィルタリング  >  電子メールフィルタリング 概要

電子メールフィルタリング

近年の通信技術の発展に伴い、インターネットや携帯電話などが身近になり、電子メールは生活に必要不可欠な存在となっている。たくさんの人が利用している一方で、スパムメールと呼ばれる、不特定多数の人に向けた電子メールを利用した広告やフィッシング詐欺メールなどを送る業者が出現し問題となっている。2013年3月時点でのスパムメールの割合は全メールの60%以上を占めている。(図1)


図1 日本における受信メールのスパムメール・正規メールの割合

当初のスパムメールは特定のメールアドレスやサーバー名を含んでいる単純なものであった為、対処も簡単であった。しかし、最近では、第三者のメールアドレスやでたらめなメールアドレスを表示するなど、特定のメールアドレスを使用しなくなった。

現在、広く使われているメールフィルタにベイジアンフィルタリングがある。あらかじめ分類した、スパムメール郡と正規メール郡を基に、メール中に含まれる単語からベイズの定理を利用して、その単語がスパムメールに含まれている頻度を算出し、その頻度を基に判定用のメールスパム確率を算出して判定を行う。

しかし、最近の迷惑メールの内容は多種多様に変化しており、一定期間において単語の分類の更新を行う必要がある。

そこで、本研究室では機械学習システムBONSAIを用いることにより、人の手間を少なくし単語の分類を行う手法を提案している。

 

現在進行中の研究

電子メールフィルタリングにおける機械学習システムBONSAIの学習例数と精度の関係性

 

学会発表論文情報はこちら