YouTubeには毎分500時間分の動画が投稿されています(外部記事)。そんな大量の動画の中には視聴回数を稼ぐため、他の動画より目立つサムネなど工夫を凝らしたものが多く含まれています。ユーザーが長時間見てくれる動画を優先している(といわれている)YouTubeでは、ユーザーを惹きつける魅力的な内容を提供することが肝心です。
そんな視聴時間を重視するアルゴリズムを逆手にとった動画がたくさん発見されました。どのようにアルゴリズムを欺いているのでしょうか?その目的は何なのでしょうか?
YouTuberのデスティン・サンドリン(SmarterEveryDay)が解説をしているので、紹介します。
以下はこちらの動画の内容に即しています。
似た内容で大量投稿
いつも通りYouTubeで動画を見ていたデスティン。YouTubeがおすすめする動画をそのまま見はじめました。※YouTubeはユーザーの滞在時間を延ばすために、ユーザーの閲覧履歴から興味がありそうな動画をおすすめ動画に表示します。
1日前に投稿されたおすすめ動画は政治に関するもので、すでに13万回再生されていました。政治的な内容でこれだけ視聴されているということは重要な内容なんだ、と思いクリックしました。すると、すぐさま動画に違和感を感じます。
このような動画です。
安っぽい音楽、自動音声のナレーション、誤字脱字だらけの原稿で真っ当なニュースとは思えません。
しかし、動画には94%の高評価が付き、コメント欄には活発にユーザーがコメントを書き込んでいます。
「何でこんな質が低い動画が視聴されてるんだ?」と疑問に思ったデスティンは同じ題名で動画を検索しました。
すると、同じ題名の動画が大量に投稿されていると知ります。サムネ画像は似たり寄ったり、原稿は同じ、ナレーションの自動音声は音程が変わった程度です。細かい違いはありますがほぼ同じ内容の動画です。
動画のからくり
YouTubeには同じ動画の複数投稿を防ぐアルゴリズム(仕組み)があります。詳細は公表されていませんが、動画の各瞬間の画像から数値(ハッシュ値)を算出して、同じ値が出てきたら同じ画像だと判断するものだと推測されています1。ところが、動画を左右反転したり縮尺を変えたり、回転したり、フィルターをかけたりするとハッシュ値は変化してしまいます。動画を少し加工するだけで同一の動画と判定されにくくなります。
デスティンが観た「質が低い動画」はこの判定方法を逆手にとって制作されているのは明らかです。無意味に回転する地球儀を挿入したり、内容と関係ないのに雪が降るエフェクトを施したりしているのもハッシュ値を変化させるためです。
最初に観た政治ニュース動画は右派に偏向した内容でしたが、左派寄りの内容でも同様の現象が見られました。
目的は?
こういった同じ内容の動画を大量に投稿している一つのチャンネルを見に行くと、10年前に開設されていました。初期はゲーム動画を投稿していましたが、ある日を境に政治的な動画を投稿していました。このようなチャンネルが多く見つかります。
目的はなんでしょう? デスティンはGoogleの社員とレネ・ドゥレスタ(Renée DiResta)にインタビューしています。レネはネットのプロパガンダを研究している専門家です。
目的その1:儲けるため
投稿者は大量の「質が低い動画」を投稿し、そのうちのどれかが当たれば広告収入が見込めます。動画の内容が突然ゲームから政治に変わったのは売り出されたアカウントを広告収入目的で誰かが購入したのかもしれません(ゲーム動画も収益目的で質の低いものだった可能性もあります)。
目的その2:イデオロギーの対立煽り
政治的に偏向した内容を投稿し、争いを起こさせる目的で投稿している可能性があります。
レネはこれらの2つの目的のために動画が作られていると話しています。昨今、政治的な緊張感が高まっているので過激な内容の動画を投稿すれば人々の注目を集めやすいそうです。
しかし、実際に人の目に触れるには、ある程度再生された動画にならなくてはいけません。そのために利用されるのがクリック・ファームです。
クリックも動画も偽り
クリック・ファーム(click farm)を取り上げたニュース動画です。
クリック・ファームはSNSで大量のいいね!とフォロワーを水増しするクリック詐欺をしている会社を指します。こういった会社は再生回数も水増ししています。ずらりと並んだスマホが自動でピコピコ動いているのは圧巻です。
動画も自動生成が簡単にできます。デスティンは自動生成を専門にしている会社を紹介しています。
この会社が動画を大量に作り、投稿して、人工的に再生回数が水増しされていたら、そのうちどれかはたまたま多くのユーザーがクリックして観てくれることがあります。そしてユーザーがその動画にコメントし、YouTubeはこの動画をコメントのついた動画だからよいものだと判断します。YouTubeはこの動画を多くのユーザーにおすすめし、この動画はさらに視聴され、コメントが書き込まれます。これがデスティンに「質が低い動画」がおすすめされるに至った経緯だったのです。
現在のYouTubeではこの「下手な鉄砲も数打ちゃ当たる」方式で再生数と収益を稼げるとデスティンは説明しています。
このような「質が低い動画」がおすすめに入ってしまうことを防ぐ方法はないのでしょうか。ほとんど同じ内容の量産動画は巧みにYouTubeの同一性判定アルゴリズムの裏をかいているので対策が難しいようです。もちろん、1分間に500時間という膨大な量を人力で対処するのは不可能です。
人工知能技術を使えば少しだけ変えた画像がそっくりなことはある程度は判断できますが、ハッシュ値を使う方が格段に高速なので現状では導入が難しいでしょう。
最近、自動音声動画が収益化できない方針になりました。これも大量生産された動画を一掃する施策の一つだと思われます。このようにYouTubeは日々改善されていますが、いずれまたその裏をかく動画が出てくるでしょう。
注
- 特定のピクセルの画素値からハッシュ値を計算しているようだが、正確な方式は企業秘密。