Gunosyはこんなもんだし、自称情報強者落ち着きなさいよという話。

スポンサーリンク

[衝撃]Gunosyはただの「はてブ拡張サービス」だった?衝撃の分析まとめ – NAVER まとめ
[Gunosy検証] やっぱり全部はてブだった&流用の痕跡もあった – NAVERまとめ
検閲?Gunosyが自社批判記事を一切配信しなかったことが判明 – NAVER まとめ
Gunosyのレコメンドエンジンの仕組み解説
近い将来、Gunosyが私達から奪うもの
ここ最近のGunosy関連の批判についての所感 – Gunosy blog

ゴールデンウィーク後半、Gunosyがかなり話題になっているようです。
が、こう様々な発言を見ていると、ちょっとなんだかなぁと思うところもあるので、これまで思っていたところについて書いておきたいと思います。

■Gunosy配信記事とホッテントリがカブる件について

「Gunosyの情報はどれもこれもはてブがついているものばかり。はてブをまとめ直しているだけだ」という指摘がされていますが、これに関しては「はてなブックマークの新着RSSもソースの1つとして活用している」とGunosyマーケティングがコメントしているように、まず半分は事実です。
これによって、「配信ニュースとしての範囲設定で、1はてブ以上のページが多く含有されている」ということになります。

そして残り半分を考えるとおそらくスッキリすると思うのですが、Gunosyのレコメンドシステムが有能であればあるほど、ユーザーに対して刺さるニュースを配信できる仕組みであればあるほど、よりはてブホッテントリに近づくシステムになっているはずです。Gunosyマーケティングのコメントの中に「各ページに対してスコアが割り振られている」という記述があることから、「ユーザーにマッチングする情報の中で、より話題になっているニュースを配信する」という目的が存在していることがわかります。

例えば、
・ある配信ユーザーに対していくつかのカテゴリを付与する
・各RSSからページをリスト化カテゴリ分けし、tweet/like/ブクマの多いページを高スコアなページとして抽出
・配信ユーザーのカテゴリ毎に高スコアなページを配信
する仕組みであれば、自然と「はてブ数の多い、もしくははてブされる可能性の高いページ」が送られてくるはずです。

「話題になっているページを表示する」という最終的なアウトプットがはてブホッテントリとGunosy両方の目的であるならば、「より似通っているほど双方の精度が高い」ということであるので、この類似を以ってGunosyを叩くというのはちょっとおかしいよね、と思うところです。
「はてブが存在するからはてブホッテントリになっていない話題の記事だけを引っ張ってこい」というのは無理筋なわけで。

むしろ、レコメンドしているのにまったくはてブがついていないようなページばかり送られて来るのだとしたら、莫大な量の個人情報やWEBの行動履歴を監視し吸い上げた上で先読みして情報を配信できるだけの超高度なレコメンドシステムを持っていることになるので、「オーディエンスデータ取得に協力している」「図書館が貸出履歴を保持している」ことに大騒ぎされる皆様にとっては逆に恐ろしいサービスであると判断されることでしょう。場合によってはひろみちゅが出てきて大炎上するんじゃないでしょうか。

少し単純に、「Gunosyのレコメンド記事決定前に、そのユーザーが連結したアカウントを精査し、既にリンクが存在するページを表示から除外する」という動作を含めればより有益であろうとは思うのですが、相応の負荷がかかるのでやっていないのでしょう。このあたり、「レコメンドを使ってるけど、レコメンドしているだけ」と感じるところではあります。

■ユーザーごとの配信記事重複について

Gunosyの批判ポイントとして、「配信記事の重複が見られ、これでは一人ひとりの好みに応じて配信しますということにはならない」というものがありますが、これも「配信一覧のうち50%程度が重複していて、残りが分かれているのであれば概ね期待通りに動いてくれてるんじゃない?」と思えるところです。
これはレコメンドのカテゴリ分けがされる時点で一定数の重複は当然起こりうるというものでもありますし、そもそもレコメンドされる我々自身それほど差があるわけでなく、趣味嗜好が多少違っても同じ人気ニュースを眺めるし、似通った評価をするものなので、「実は全くレコメンドシステムなんて存在していなくて、3~5パターンのテンプレートを配信している実質メールマガジン状態」でなければ特に批難するようなものではないでしょう。

こちらもむしろ逆に「本当にあなた一人にしか刺さらない情報」ばかりが送られてきても、話題が共有できなくて困るっていうか、ネットの話題から完全に隔絶されてて役に立たないっていうか。

■そもそもレコメンドって…

で、Gunosyに限らず、推薦エンジン全般の課題として、機械任せのレコメンドってみんな満足してるの?っていうところがありまして。
Gunosyの関喜史氏がSlideshareにプレゼン資料を上げられていてこれがわかりやすいのですが(リンク http://www.slideshare.net/YoshifumiSeki/world-ia-day-16506953)、現状協調フィルタリング以外の手法というのはあまり上手く行っていない状況で、その精度満足度には大いに課題を残している状況です。

レコメンドシステムが最も進んだ企業であり、協調フィルタリングを「おすすめの商品」で上手く活用しているAmazonにしても、そこからの成果はあまり高くないのか、メールなどレコメンドよりもユーザーの商品ページ閲覧履歴を元にしたリマーケティングを重視していることからもわかります(リマーケティングとは=ざっくり言えば過去に閲覧したことのある情報を再度おすすめする仕組み。能動的に見た情報は強い関心があるため成果に結びつきやすい、ということで広告分野で活用されていて、実際効果はハイパー高いです)。
あるいはYahoo!や楽天のように「国内最大級のビッグデータを保有しているが、あまりに情報がデカすぎユーザーが多すぎて、パーソナライズに役立てにくい」といった話題も(ビッグデータという言葉がバズワードになる以前のAdtechなどで)出ていたりします。

で、レコメンドの解析ってWEBの行動では見えないところを行動データから推測するものなので、当然限界があるわけです。「先週までビジネス情報ばかりを見ていたのに、今週に入ってからやたらとエンタメ方向の情報ばかり見始めている」という状況が会ったとして、レコメンドエンジンは「A:先週会社をクビになってビジネス関連の情報を見る気をなくした」のか「B:長期休暇を取得したのでめいっぱい遊ぶことにした」のか「C:念願のiPhoneを購入したのでそちらでビジネス情報を取得することにした」のかを判断することができません。最も情報として有用なのは「ユーザーがAパターンであれば転職情報をレコメンドするし、CパターンであればおすすめiPhoneアプリをレコメンドする」ことでしょうが、なかなかこれに対応するのは難しい。
行動データから「iPhone」と検索する回数が増えたのでCパターンと推測したものの、実はiPhoneを買ってはおらず検討段階だった…ということもあるわけで。

ってなわけで、レコメンドエンジンを使った情報サービスが「ニーズに合った情報を提供してくれない」というのは現在の技術上ある程度当たり前だよねと思っています。

■その上で。

という感じで、「Gunosy叩き」に関してどうなのよ、と書き連ねてきました。ここまでの結論としては「別にGunosyがEvilであるとは言えないだろう、ただGunosyのレコメンドってこういうものだ」というところ。
で、個人的にはGunosy使ってません。昨年10月後半時点で「俺に向いてねぇ」と思って一度止めましたし、以後もたまに話題になるので再度入れて時折確認していますが、「はてブに常駐、RSSで関心のある話題をチェック、Twitterやfacebookで話題のニュースを流し見る」というネット生活を送っている廃人にとってはあまり実りのある体験ではありません。

というか、そういうネット廃人にとって1日25記事のレコメンド情報が送られるサービスなんて、そもそも必要ねぇだろうという話であって、それ以上のものではないでしょう。

しかし一方でGunosyを便利だというユーザーは確かにいるのです。
はてなブックマークを知らない人というのは実に多くいますし、ましてや「マイホットエントリーメール」などははてブ廃人の私でも「ヒサシブリニキイタワー」と思えるようなもの。

我々のように「情報収集が趣味になってる」人たちにとってはRSSやはてブでの情報収集はごく当たり前の活動ですが、これらにかけている時間は相応なものがあります。最適化されていない生の情報をものすごい時間をかけて手動で選り分け、そのうちほんの少しを知識として収集しているその姿は、情報リテラシーの本来の意味から言うと「効率的とは言い難い」ライフスタイルです。故にこれはもう「趣味」と言って良いでしょう。
しかし趣味のインターネットユーザーではない多くの人たちにとって、「ネットであなた好みに多少チューニングした話題のニュース25点」というのは非常に効果的で効率的な情報獲得手段であると言えます(レコメンドと話題の重要度の設定さえ適切なら)。

今回、Gunosy周りのコメントで気になったのは「Gunosyをありがたがっているような情報弱者」と評する人の多さです。
情報をリアルタイムに収集することが本当に効率的なのか、自分たちの情報収集手段は適切で効率的であるか、インターネット廃人としての論理に囚われすぎていないか、多くの人達にとって必要な情報ってなんなのか……そういう広い視点が持てていないのはあまり喜ばしい状況ではないなぁと感じています。

んで、その上でGoodpatch Inc.のCEO土屋尚史氏の炎上以後の発言などを見るにGunosy自体は多分「現状のままこんな感じ」のサービスで進むと思われますので、冷静に各々の情報収集手段を最適化していくことに集中すれば良いんじゃね?と思いますよ。

 

追記:Gunosyが自社批判記事を一切配信しなかったことについて
このあたりの検閲の話は、インターネットユーザーが異様に理想主義的だなぁ…と思う すごく大きなポイントなのですが、普段見ているはてながむしろ批判などに対しておおらかすぎるという話であって、まぁ普通のことじゃないの?と思います。
「批判記事を消した」というよりも「批判記事は消すが、肯定する記事は残す」というあたりが「運営ちょうかっこわるい」ポイントで、実際クールでグッドな企業の対応としてはちょうかっこわるいのですが、 「うはははははは、ちょうかっこわるいねー」と笑う程度のもので、青筋立てて「これはいかん!」というものでもないとおもいますよ。

コメント

  1. […] Gunosyはこんなもんだし、自称情報強者落ち着きなさいよという話。 […]