- お知らせ -
  • 当wikiのプログラムコードの表示を直してみました(ついでに長い行があると全体が下にぶっ飛ぶのも修正)。不具合があればBBSまでご連絡下さい。

ベイズ

ベイズの定理 Edit

ベイズ理論の応用事例 // 起業家・Webデザイナー・SE→CIOを目指しつつの大学生のアレ
より。

メールをham(非スパム)とspamに分類する例
H:カテゴリham
S:カテゴリspam
M:メール

ベイズの定理より

ham確率:P(H|M)=P(M|H)P(H)/P(M)
spam確率:P(S|M)=P(M|S)P(S)/P(M)

P(M)が一定なので、高いか低いかを比較するだけでいい。
そのまま答えを求めなくていい。
P(M)を定数として、

P(H|M)∝P(M|H)P(H)/P(M)
P(S|M)∝P(M|S)P(S)/P(M)

事前確率:P(H), P(S)
これは単なる統計データ

尤度:P(M|H),P(M|S)
各カテゴリで、メールMが生起される確率
計算できないので、近似するが、その近似方法がアルゴリズムが違う。
アルゴリズムの違いは、計算量、精度に関わってくる。

方式 Edit

  • Paul Graham方式
  • Gary Robinson方式(2002年、2004年)



Front page   Edit Freeze Diff Backup Upload Copy Rename Reload   New Pages Search Recent changes   Help   RSS of recent changes
Last-modified: 2008-02-24 Sun 12:06:52 JST (3501d)