【シャドバ×統計】テキストマイニングで、シャドバを分析してみた。
シャドバを「テキストマインング」の側面から解剖する。
お疲れ様です。
今回は、シャドウバース(以下、シャドバ)のデータを解析しようと思う。以前も似たようなことをやってるので、気になる方は下の記事を参照して欲しい。
さて、今回解析するデータはYouTubeのコメントだ。機械学習的に言うと「テキストマイニング」を実施する。
シャドバに関するコメントをテキストマイニングして、シャドバを解剖しようと思う。テキストマイニング?何それ?な方は下の記事を参照だ。端的に言えば、文章をコンパクト化して解析対象の「傾向」「特徴」を発見する手法のこと。文章という把握しづらい媒体をテキストマイニングすることで、新たな発見をがあるのだ。
◇どんなデータ?
では、具体的にどんなコメントを解析するのか?解析で何を調べるのか?述べていこう。
今回は、「新パックで出た時の反響コメント」。これに主眼を置いた解析をしようと思う。よって、新パックを紹介するYouTuberの「コメント」を新パックごとに収集していった。
対象にしたYouTuberは「むじょっくすTV」というチャンネル。シャドバに関する動画を投稿されているYouTuberさんのチャンネルだ。勿論、新パックが出る際は、必ず新パックに関する動画を投稿してる。俺は、そこからコメントを収集した。
↑むじょっくすTV様の動画。
↑同チャンネルに寄せられたコメント。
さて、抽出したコメントを”テキストマイニング”するぞ。新パックが出た時の、ユーザーの反響・反応等が、手に取るように把握できるはずだ。
◇抽出しました!
と、いうことで抽出した。Pythonと呼ばれるプログラミング言語と、YouTubeのAPIを使って取得することに成功した。
例として「青空の騎士」が初登場した際に、寄せられたコメントをお見せしよう。エクセルに落とし込んだものだ↓↓↓
新パックごとに、コメントを抽出。エクセルごとにまとめた。
◇解析結果!
と、いうことで解析結果をお見せしよう。テキストマイニングでは「ある品詞に着目して分析していく」。これが定石。
と言うことで、それぞれのカードパックごとに「名詞」「形容詞」「動詞」に着目して、使われている頻度を調べた。以下、結果を列挙しよう!
(この章では、idfの大きな単語ではなく、単純に登場した回数が多い単語を紹介する。そのため、「カード」という『カードゲームだったら、必ず登場する様な単語』も上位に登場するが、ご勘弁。次の節で、idfの大きい単語を紹介しようと思う。)
●反響の様子を「名詞」から確認
<第2弾:ダークネスエボルブ>
「エイラが嫌いなら‥」「エイラ強すぎ」「エイラ、反則だろ」など。エイラに対するヘイトがたまっていることが良くわかる。また、「新環境に期待」「次の環境は●●が流行る」などなど、シャドバを継続的にプレイする意思の高いコメントが多く見られた。
<第3弾:バハムート降臨>
「相手」という単語が多いが、解析にしようした動画内での誤り訂正だった。直接関係ないので、無視だ。
「カード」という単語が多いのは、シャドバは「カードゲーム」だから。多くなるのは当然だ。これも無視。
着目すべきは「ネクロ」「ドラゴン」「環境」。実際に書き込まれたコメントを確認すると「ネクロが弱い」「次はドラゴン環境が流行る」など。ファンがシャドバを純粋に楽しんでいる様子がうかがえる。
<第4弾:神々の騒乱>
ファフニール、糸蜘蛛の悪魔など、個別のカード名に対するコメントが目立ったパック。「新弾、楽しみ」などと言った、全盛期のシャドバを感じさせるコメントも多く散見されたぞ。
<第5弾:ワンダーランド>
「ニュートラル」という単語が多く登場。ニュートラル重視のデッキに危機感を覚えるコメントが多く散見された。
また、「刃ネズミ」の異常人気は何なんだろうか?w。刃ネズミについては、見た目だけでなく、カード能力に期待を寄せる声が多く見られた。
<第6弾:星神の伝説>
「ゾディアックデーモン」。同パックのメインとも言えるキャラだ。パックのイラストにも、全面的に打ち出されている。
コメントでもゾディアックデーモンに対する期待度は高い。そのポテンシャルを発掘すべくと、コメントが書かれてる。
パックに描かれているキャラに対してコメントが多く書き込まれているのは、同パックが初となる。
バハムート降臨の時も、神々の騒乱の時も、ワンダーランドドリームズの時も、そこまでメインキャラは注目されてこなかった。
<第7弾:時空転生>
新クラス「ネメシス」が初登場。当然、コメントでも多く書き込まれている。また、クロノスに関するコメントも多い。前回のパックに続き、その能力どうすれば有効活用できるか?大いに議論がなされていた。
新クラス「ネメシス」については、賛否両論。「ネメシスで、シャドバが面白くなってきた」というコメントもあれば、「ネメシスは、今後の為にもTier1になって欲しくない」という否定的なコメントもある。
<第8弾:起源の光・終焉の闇>
ヴァンピィちゃんに関するコメントが多くみられる。単純に「可愛い」などの容姿に関するコメントが大半。カードゲーム、見た目も大事だよな。
<第9弾:蒼空の騎士>
グラブルとの初コラボ。今パックでは、グラブルに登場したキャラが多く登場する。当然コメントにも「グラブル」という単語が多く登場。
これに関しては賛同する声がとても多い。「コラボ、嬉しい」「シャドバもグラブルも両方やってる」。などなど。
<第10弾:十禍絶傑>
マゼルベインに関するコメントが多い。ただ、コメントの内容は否定的である。登場後、マゼルベインの強さが認知され始めたが、発売前では彼の強さが視聴者には伝わらなかった様だ。
<第11弾:次元歪曲>
かつて登場したキャラが、クラスを変えて再登場したパック。「乙姫」という単語が多い。「乙姫」に関しては、否定的なコメントが多いぞ。
<第12弾:鋼鉄のリベリオン>
今回から、「機械フォロワー」という新しい概念が登場した。しかし、視聴者は機械フォロワーよりも、リモニウム・イージスに興味深々。
<第13弾:リバースオブグローリー>
「ロイヤル」に関する否定的なコメントが多かった。「ロイヤル優遇されすぎ」「ロイヤル環境かよ、アンストしよ‥」などなど。ロイヤルを毛嫌いする人多いんですね…。
●反響の様子を「形容詞」から確認
と言っても、これと言って面白い結果を得ることができなかった。テキストマイニング界隈では、「名詞」を確認するのが一番という定説があるが本当の様だ。
一応、解析しているので軽くご連携。どのパックにも「強い」という単語が大体トップ。↓の様な感じ。
◇別の視点で確認
先ほどとは、別の視点でコメントを見てみよう。コメントの重要度を測る「idf」と呼ばれる指標を単語ごとに求める。そして、idfの高いモノをパックごとに並べてみよう。
単語の使用頻度ではなく、単語の重要度をパックごとに見ているぞ。↓↓↓
パックごと「注目のカード」が、重要度の高い単語として出てくるね。
◎次は、N-gram
次は、N-gramと呼ばれる「単語の繋がり」に着目した方法でパックごとに解析を試みた。ちなみに、N=3としている。
<第2弾:ダークネスエボルブ>
先ほどの解析結果から「エイラ」に対するコメントが多いのが分かった。さて、エイラを含む単語の繋がりを見てみよう。
<第5弾:ワンダーランド>
ワンダーランドドリームズでは、「ニュートラル」に対するコメントが多いのが分かった。さて、ニュートラルを含む単語の繋がりを見てみよう。
<第7弾:時空転生>
続いては、第7弾。ネメシスを含む単語の繋がりを見てみよう。
<第9弾:蒼空の騎士>
続いては、第9弾。グラブルを含む単語の繋がりを見てみよう。
<第10弾:十禍絶傑>
続いては、第10弾。マゼルベインを含む単語の繋がりを見てみよう。
<第13弾:リバースオブグローリー>
続いては、第13弾。ロイヤルを含む単語の繋がりを見てみよう。
こんな感じですは~。
◇似たようなパックは?
最後は、YouTubeのコメントを基に、パックの特徴を2次元に描写してみよう。似たようなパックが、近くに点プロットされるのだが、どんな感じなんだろうか?
こんな感じ↓↓
似たようなパックは無い。うまい具合にパックごとに差別化されているようだ。
◇パックを分類
最後に、k-meansと呼ばれる手法で、パックをクラスタリングしてみた。こんな感じ。
以上。では~。
分析に使ったプログラムは、キータにでも連携しようかな。