Youtubeの多すぎる動画達とアルゴリズム

 

【初めに】

こんにちは、自称好奇心至上主義者です。

Youtubeは素晴らしい。(初手媚びを売る)

私たちの生活の中でYoutubeを見聞きしないほど日常に溶け込んでいる。

驚きなのが、この動画サイトが設立されたのは2005年2月ということだ。

設立されてから17年しか経過していないのに関わらず、今ではYoutubeがなかったころの生活を想像することができないほど不可欠なものとなっている(少なくとも私は)。

 

さて、そんなYoutubeに私は思うところがある。

Youtubeの動画は多すぎる‼(某CM風)

Youtubeの統計】

統計情報を公開しているStatistaというサイトによると、

1分間に500時間もの動画がアップロードされているとのこと!!

つまり、1分間に30,000分の動画がアップロードされ続けているということだ。

つまりあなたが健康的な生活をしていて、仮に8時間寝ているならその間に240,000時間分の動画がYoutubeにアップロードされているということになる。

 

→とてもじゃないがコンテンツを消費するスピードに対して、生産されるスピードが大きすぎる。

Hours of video uploaded to YouTube every minute as of February 2020

www.statista.com

 

ちなみにこのStatistaというサイト、あらゆる統計情報を紹介してくれるそうだが、

サブスクで月額59$だそうだ。

高すぎる‼(某CM風)

信憑性のある情報にはお金を払うべきだとは思うけど、趣味としてみるのは厳しい。

 

そして、膨大な情報量の動画達は各地域のデータセンターのサーバー上にすべて保管されている。

ところでYoutubeのデータセンターの容量はどの程度なのかと調べると…

→結論として正確な値は公表されていないため、推察するしかない。

2020年時点のデータ量をフェルミ推察している記事が見つかった。

jp.quora.com

・2019年4月時点で、一分あたりに500時間の動画がアップロードされている。(1日あたり、82年)

・2012年2月時点で、120億分の動画が存在している。

・アップロードされた動画全て1920*1080@30fpsであり、25種類の様々なビットレートに変換され総ビットレートは10Mbpsである。

こう仮定すると、

 

2020年時点で、存在する動画時間の合計は

500時間*60*24*365*4=1051200000時間=10.512億時間

10.512億時間+(120億分/60)=12.512億時間

 

総データ量は

10Mbps*60*60/8=4.5GB/h

12.512億時間*4.5GB=5.63EB

 

理系大好きなフェルミ推定、オーダーとしてはこの程度だと思う。

(ところで彼はなぜ2013年~2020年を4年分で計算しているのだろうか?)

2020年時点のデータ量=2012年時点のデータ量+2013年~2020年のデータ量(8年間)

 

ちなみにこういったサイトもあった。

GoogleYoutubeのサーバーストレージ容量は一体何バイトなのか?」

notissary.net

 

推定の仕方が雑だが、こちらでの2020年の推定データ総量は330PBとのことだ。

仮に30億個の10分の高画質動画(720p)が今Youtube上にアップロードされているとすると、10分での動画サイズが約110MBなので、110MBが30億個あるとしてだいたい330,000TB。

 

また、Youtube Official blogを見ているとこういった記事もあった。

まだ設立から4年しか経過していない2009年の公式ブログだ。

 

Zoinks! 20 Hours of Video Uploaded Every Minute!

blog.youtube

 

要約すると

・2005年Youtube設立

・2007年中期:6 hours/min

・2009年1月:15 hours/min

・2009年中期:20 hours/min

「So thanks, and let's see if we can get to 24 hours -- a full day's worth of video uploaded every minute.」

 

一分間に24時間の動画がアップロードされることを願っていたそうだ。

今では500時間/分もの動画(2020年)がアップロードされていることを考えると、なんと可愛らしいことやら。

また、これらの値は上記のStatistaの値と整合性が取れているため、信用できる。

(Statistaの統計情報については、このYoutube公式ブログが1次ソースに相当するかと思われる、Statistaのソース確認には課金が必要なためしたくない、誰か代わりに確認してくれるのであれば教えてください。)

 

ちなみにZoinksというのは「驚き・恐怖を表す感嘆詞または効果音」だそうだ。

使いどころに困るが、いつかTOEICで出たときに備えて覚えておこう(多分出ない)

zoinksの意味・使い方・読み方 | Weblio英和辞書

 

また、こちらの統計データをまとめたサイトも興味深かった。

2021年最新版!「YouTubeをめぐる16の統計データ」

www.infocubic.co.jp

 

Youtubeの統計情報を調べているだけでも楽しいものだ。

 

Youtubeアルゴリズム

話がそれたが、要は私が言いたいことは、

「動画の数が多すぎる‼」

ということだ。

 

現在、私を含む多くの人はYoutube様が提供しているアルゴリズムがおすすめする動画をよく見ている(と考えている)。

しかし、体感6割くらいの動画は、別に見なくてもよかったかなと思えるような動画達だ。

Youtubeアルゴリズムは無難な動画を進めてくれる分には優秀だが、この動画最高!と思えるものはなかなか紹介してくれない。

個人の好みに合わせて動画をピックアップしてくれるのは嬉しいものだが・・・

 

私の主観によるYoutubeアルゴリズム

 

この機械学習(AI)によるおすすめは好みでもない動画を何度もおすすめしてくる。

たまに切り抜き動画とかを開いてしまうと、ホーム画面が地獄絵図のようになるのは苦痛だ。

これらは表示しないボタンを押しても一向に改善されない。

つまり何が言いたいかというと、YoutubeのAIは悪くはないが、私の好みを理解しきれていないということだ。

 

Youtubeアルゴリズムがどう構築されているのか、調べてみるのも興味深そうだ、今日は疲れたのでまた後日気が向いたらやる)

 

アルゴリズムではなく、人によるおすすめを所望する】

これは私の望みであり、そして予想でもあるのだが、これからのインターネットには各領域にとがった、ニッチなキュレーターの役割が大きく求められると考えている。

キュレーターとは要するに情報を整理してくれる人だ。

インターネット上の大量の情報を収集・整理し他のユーザー(読者)に共有する行為や行為者を指す言葉として[9]、キュレーションという言葉が2010年頃から使われるようになり、キュレーションを行う者をキュレーターと呼ぶようになった[9][10]

キュレーター - Wikipedia

 

私が求めているのは、特に好奇心を刺激してくれる質の高い情報達だ。私の好奇心に響く情報を発信してくれる人が欲しい...

 

・・・と、思っていたが、なかなか見つからないので、逆に私が面白いと思うものを紹介することにした。

ここまで3000文字以上書いてきたが、結論としてただ単純に好きな動画を紹介したいだけ。

 

次回、私のおすすめ動画チャンネル集(随時更新予定)。