インターネット上のコミュニティにおいて、
時折発生する祭について調べてみた。
"祭"の定義は聖性があり、非定常であり、集団が関与する、
およそ周期的なものということだ。
インターネット上のコミュニティによるそれは周期的なものはなく
(というより年がら年中起こっている?)
聖性というよりは、時々生贄の羊みたいなものだったりするが、
非定常であり、集団関与ということについては
上記の定義どおりといえるだろう。
虹裏にはスレッドのタイトルはないが、スレ立て人はその
スレッドの趣旨を示したメッセージを一番初めに記した上で
スレッドを進行させる。
そのスレッドに対する住人の反駁、同意、自分の意見などは
スレッド自体にも示されるが、
「その画像に追随する」、「その画像は違う」などの意味で
画像とともに新しいスレッドで示すことがある。
発生したスレッドに多くの住人が共感・共鳴した場合、
多くの住人はPOMる(ROMるの方言)らずに、
スレッドに書き込むか、返信(>)付きの同じメッセージと画像付きで
スレッドを立てる。
その結果として、同種のメッセージの記されたスレッドが
大量に示される時がある。
これが"祭"である。
平安の貴族たちの歌会で、趣の有る歌を詠んだ歌人に対して
返歌が数多く届く状況を思い浮かべて頂ければいい。
返歌が多い歌ほど、その歌には返すべき価値があったのだと言えよう。
この "祭" は大抵 1000スレッドも進行すると飽きられ、
住人たちは次の話題へと遷移していく。中には長きにわたり、
祭状態が続くキーワードもあり、これは掲示板の看板と
なっていくこととなる。
祭を捕捉する事で、住人たちの現在の話題の中心を
把握する事が可能となる。
コミュニティマイニングの一例として、
TF(Term Frequency)法と、IDF(Inverse Document Frequency)法
を組み合わせてそのスレッド群での特徴的なキーワードを抽出してみた。
TF法は 文字の出現回数で特徴語を選定する手法である。
しかし、これだけでは問題が有る。
TF法だけを使用すると、頻出する「キター!!」を拾ってしまう。
しかし、この語は全ての時点で発生しており別に特徴語ではない。
この理由は本文なしのスレッドは自動的にこのメッセージがつけられるためである。
本文を付けない住人も多いため 自ずとこの言葉は全スレッドの中でも多い
単語となってしまう。
これは祭ではない。定常的に存在するホワイトノイズのようなものである。
そこで、スレッドのメッセージから語の発生回数 databaseを作り、
ある時間窓で発生している語の出現数を、全ての時刻でその語を含む記事数で
割ることで、ありふれた単語の重みを低くし、特徴的な語を拾い出す事とした。
これが IDF(Inverse Document Frequency)法である。
上記の手段により、括弧内を
(ある日のスレッド内での単語発生回数 : 全体での発生回数 , ポイント)
であるとしたとして、以下のように判定される。
- キター (42 : 6006, 0.0069)
- ハーたん祭 (15 : 15, 1.0000)
ここでは「キター」は回数こそ多いが、今までに出現している回数も膨大であるため、
なんら特徴的ではないと判定されている。
一方、「ハーたん祭」は今回はじめて出現した語であるため、
特徴的な語として判定されている事が判る。
では、先日の解析結果を以下に示す。
スレッドの数, メッセージの数で以下に示す。
- datサーバー (3/13 朝)
- 155 : 響鬼のピンチにこの男が駆けつけた!
- 46 : ルリ祭り支援
- 7 : タマ姉祭りやろうぜ
- imgサーバー (3/13 朝)
- 20 : ダンマク
- 12 : 誰かここを説明するのに適当な画像をくれ。
- 10 : 押しの強い画像ないんか
なお、「ダンマク」と言えばあの人なのだが、
ちょっと前を見てみると壮絶な祭になっている事がわかった。
いたるところにそれがあった。関連するスレッド多すぎ。
腹がよじれたよ。
なにやら新しいキャラクターが生まれた予感。
しかし、日曜の夜半から早朝にかけて何やってるんだ。喪前らは。
あほだ。
だが、、愛すべきあほだ。
posted by jitterbug at 00:16|
Comment(0)
|
TrackBack(0)
|
日記
|

|