ソーシャル×ECについて分析してみた

 昨年10月に発表されたYahoo!ショッピングのeコマース革命など、非常にホットで、これからますます成長していくであろうEC分野ですが、ソーシャルとも非常に相性が良いということでも知られています。TwitterFacebook上で友人・知人が話題にしている商品に反応し、思わず購入してしまった経験がある人も多いのではないでしょうか。特にTwitterは、ECにおいて商品選びに最も影響するSNSであると言われています。今回、Twitter上でどのような商品が最も話題になっているのか調べてみました。

f:id:hongo35:20121105005317j:plain

分析方法

 Amazon楽天Yahoo!ショッピングなどさまざまなECサイトがありますが、今回はAmazonの商品のみを対象としました。(1)ツイート本文中にアマゾンの短縮URL「amzn.to」(bit.lyの独自ドメイン利用)が含まれているツイートを収集し、(2)その短縮URLを展開、(3)そしてその展開したURLの中にアマゾンの商品コード(ASIN)が含まれていれば、それを集計するという流れで行いました。

(1) ツイートの収集
 API制限にかからないよう、Twitterのsearch APIを1回/minの間隔でcron実行して叩きました。

(2) 短縮URLの展開
 以下のようなスクリプトで展開し、展開したURLをDBに保存します。

gist11326277

(3) ASINの集計
 一般に、世の中で売られている各商品には商品識別コードEAN(JAN)が振られており、商品ページのURL中にそのコードが含まれている場合が多いのですが、Amazonの場合は、URL中にEANは含まれておらず、ASINと呼ばれるAmazon内部の独自コードが含まれています。したがって、展開したURLからASIN部分のみを抜き出し、同じ商品がどのくらいつぶやかれているのかを集計しました。

分析結果1(bot込み)

 分析対象日を2014年4月25日(金)として分析しました。まずは「amzn.to」を含むツイート件数の一分ごとの時系列推移です。

f:id:hongo35:20140429133842p:plain

ツイート総数: 172,251

 普通、ツイートの件数は昼に一度山があり、いったん下がって、夕方から夜にかけて再度件数が増えてくという曲線を描きますが、このグラフは1時間単位くらいの視点で見るとほとんど時間によって変動がありません。予想はしていましたが、Amazonの商品をおすすめしているのはほとんどがbotであるということがこのことからわかります。また、ある特定の時間だけツイート数が上昇していることからもbotが多いことが伺えます。
 実際にツイートをしているクライアントツール上位15位は以下のようになりました。

f:id:hongo35:20140429133900p:plain

 統計によると、普段使用されるクライアントツールの上位1,2,3位はTwitter for iPhone, Twitter for Android, webであるらしいので、それとはかなり違うことがわかります。
 そして、botによるツイートも含めて、ツイートされている商品の中で最もよく出現する商品(ASIN)のランキングは以下のようになりました。

1位.

手取り18万からの資産運用術

手取り18万からの資産運用術

2位. ええじゃないか【初回盤(WEST盤)】(CD+DVD)
3位. iPhone5s iPhone5 iPad mini 対応 充電 データ通信用ケーブル 巻き取り式
4位. ドラゴンエイジ:インクイジション デラックス エディション (限定版) (ダウンロードコード(スカイホールドの王座、赤角のハラ、沼のユニコーン、審問会の炎)、デジタルサウンドトラック、ボーナスデジタルコンテンツ 同梱)
5位. 確実に稼げる不動産投資 副業入門

いかにもbotがつぶやいていそうな商品が上位を占めています。。。
 これこそGIGO(Garbase in, Garbage out)で、ゴミをたくさん入れたらゴミな結果が出てきましたという感じなので、次にbotを除いたツイートのみで分析してみます。

分析結果2(人によるツイートのみ)

 人間によるつぶやきのみを抽出して分析します。人によるツイートの抽出方法としては、人間が使用するクライアントツールであるTwitter for iPhone, Twitter for Android, web, Keitai Web, Twitter for iPadからの投稿を、簡易的に人間がつぶやいたものと判断し、それらのツイートを分析しました。まずはツイート件数の時系列推移から見てみます。

f:id:hongo35:20140429183303p:plain

ツイート総数: 12,596

 分析結果1と比較すると件数が非常に少ないことがわかります。Twitter上に出回るAmazon商品は意外と少ないんですね。
 ツイートの中で最もよく出現する商品(ASIN)のランキングはこのようになりました。

1位.

2位. 幻想書庫 (ショートショート集?)
3位. WHITE ALBUM2 雪が紡ぐ旋律 5 (GA文庫)
4位. 妖怪ウォッチ お知らせブザー ジバニャン YW-01A
5位. 医療につける薬: 内田樹・鷲田清一に聞く (筑摩選書)

 こちらは、ランクインしている商品の商品ページを見てみると、最近話題になっているものや新着フラグがついているものなどが上位に来ていることから、その時話題になっている商品がきちんと抽出できているようです。アニメ系が多いのはTwitterAmazonのユーザー層からしてなんとなくわかりますね。。

まとめ

 Botによる投稿があまりにも多いので、実際に人がおすすめしている商品を抽出するには本分析の分析2のようなやり方をする必要があり、ノイズを取り除いた上でシグナルを見つけなければならないのだと思います。また、いくらECとソーシャルの相性が良いと言っても、これだけbotが多いと、本当の声がbotに打ち消されてしまう可能性が大きいよな、などと思ったりしました。