愚痴(メモ)
今やっていることについてのまとめ
IPがホスティングIPでなくshared IPのため、ホスティングIPにする。
先行研究のUnixTimeの計算が大幅に間違っているためそれを修正し、arffに追加
とりあえず、なぜ時系列に着目するかだけを書き記す。
今までの解析法だと時系列には着目されておらず、文章解析などが主流である。
時系列を機械学習で扱っているものはネットワーク異常検知など時系列単体で
解析を行っているものであり、あっても時系列を含め1−4の変数を含む解析であることは間違いない。
スパム解析がなぜ時系列に注目しなかったかというと「文章解析」に力を入れる方がより良いからである。
なおかつ、スパマーのIPやネットワークの監視をする方が効果は得られやすい。
ただ文章メインになった場合ある時文章の破壊的革新が起きてしまえば、
文章解析のノウハウ蓄積が意味を為さなくなる。
時系列の視点を加え解析することにより、株価予想や天気予報などの解析と同じく来るスパマーの攻撃に耐えるものを考えたい。
と、スパマー予備軍である私の研究内容