Discussion and Future Work

Performance

サーバー側では一日に何百もの記事をインデクシングする。30分ぐらいかかるので、早朝にやればよいだろう。クライアント側では最初のページを表示するのに1分ぐらいかかる。その後はバックグラウンドプロセスで記事を取得するので結構いけるはず。レイアウトの変更は大体3秒ぐらい。よーするに、「結構遅い」よと。

Extracting User Profiles

記事を見ている時間を計測とか他に方法も有るが、このシステムでは次の3つの方法を使っている。ユーザーのアクションの監視・興味度をユーザーがスクロールバーで変更・ユーザープロファイルをユーザーに書いてもらう。2つ目と3つ目はユーザーに優しく無いね。興味が無いという事を伝えられないのはきついね。

Personalization

やっぱレイアウトとか変えられるのは良くない?でも興味値を算出する所がやっぱり問題。
世間でもてはやされているニュースって有るけど、”もてはやされている”ってどういう基準なのかが分からない。
communityという集まりを作ってそれに属する人のキーワードの傾向などを調査する。そして新規に入ってきた人にcommunityを選んでもらい、そのcommunityのプロファイルをコピーする。類は友を呼ぶって事。