さて、前回までで
- ASINを集める
- 集めたASINから日本/アメリカの商品情報を集める
といった作業をスムーズにできるようになりました。
今回は、どんどん増える集めたデータをどう管理していくのがおすすめか・・・です。
アマゾンから取得したデータの中身を見てみよう
ASINから自作のPA-APIツールで取得した商品情報、以前サンプルで紹介した通り、こんな感じのCSVファイルでした。
この中の実際のデータをサンプルに、各取得項目を紹介します。
サンプル商品のアマゾンページ
https://www.amazon.co.jp/dp/B000UPK31Q
ASINコード:B000UPK31Q
取得日:20150615_141738
※アマゾンから取得したデータではなく取得日時を記録しています
メーカー:壽屋
カテゴリー:Hobby
サブカテゴリー:キッズのためのお誕生日ストア
EANコード:4934050000000
UPCコード:
メーカー型番:ZD07
重量:313(グラム)
長さ:488(mm)
幅:1606(mm)
奥行:1307(mm)
画像URL:http://ecx.images-amazon.com/images/I/41L%2BUws-g4L.jpg
商品名:ZOIDS ブレードライガー (1/72スケールプラスチックキット)
ランキング:50619
新品最低価格:7020
出品者数:2
どうでしょう?けっこう取れてませんか?
これだけあると、用途もいろいろ浮かんできますね、たとえば・・・
- カテゴリーからアマゾンの販売手数料率(15%など)を紐づけ、販売手数料の概算をコストに見積もって利益計算する
- 重量からFBA発送重量手数料をコストに見積もって利益計算する
- 三辺の長さから小型・標準・大型商品に区分して、FBA出荷作業手数料をコストに見積もって利益計算する
おぉ、なかなか使えそうな気がしませんか?
さらには、もし毎日や1日2回、といった定期的な情報取得ができれば・・・
- 定期的に情報を更新して、最低価格の変動をウォッチする
- 定期的に情報を更新して、ランキングの変動をウォッチする
さらに夢が広がりそうです!
データが1万件を超えたらAccessを使おう
最初のうちは、Excel等の表計算ソフトにどんどん集めていくので十分だと思います。
(ボクはKing SoftのKing Officeを使ってました)
でも、データがある程度たまってくると、データベースソフトを使いたくなってきます。
理由はExcelの動作がどんどん重くなってくることと、
複数のデータの結合やグループ集計等を多用するには、データベースソフトの方が向いているからです。
データベースソフト、WindowsならMS-Accessがおすすめです。
ボクも3月にデータを取得し始めて、4/4にはMS-AccessをAmazonで購入していました(当時は2013版)
いわゆるWord/Excel/PowerPointのビジネス3種の神器には入っていませんが、Accessは多量のデータを扱うには超使えるソフトです!
それが15,000円くらいで買えるとは!すばらしくお買い得ではないですか!
50万件~100万件くらいまでは問題なくAccessにデータを一元化していました。
100万件くらいからは、Accessの持つファイルサイズ:2GBの限界値が何かと作業の妨げになってきたため、データそのものはMYSQLサーバーへ移行しましたが、各種処理は今でも変わらずAccessベースで行っています。
クエリによるテーブル結合で価格差を計算しよう
たとえば、取得した日本の商品情報を集めたJP商品マスタと、アメリカの商品情報を集めたUS商品マスタの2つのテーブルをAccessに作成することで、こんなことができます。
例:アメリカのアマゾンでの販売価格と日本の販売価格を比較する
まずは、Accessでクエリという「テーブルやデータの抽出条件、並べ方などの設定をまとめたもの」を作っていきます。
今回はシンプルにアマゾンのサーバーから取得した
・日本の商品マスタ(JP商品マスタ)
・アメリカの商品マスタ「US商品マスタ」
の2つのテーブル(データ)のみを組み合わせてクエリを作成していきます。
条件1:JPとUSのASINが一致するもの(クエリ作成画面で2つのテーブルのASINを紐づけます)


条件2&3:JP新品価格(日本マスタの新品価格)とUS新品価格(アメリカマスタの新品価格)が0円($0)以外の場合に、
条件4:カテゴリーは”Music”以外のもの(単にボクが取り扱わないだけですが)
ついでに「US/JP率」としてUS新品価格*105(仮定ドル円レート)÷JP新品価格を小数点以下2桁までで算出する項目をクエリ内で新たに設定して、US/JP率が低いものから順番に出力する設定にしました。
このクエリの実行結果はこんな感じになります
※US/JP率があんまり低いものは面白みがないので0.5近辺までスクロールしています。
ASIN含めて生データが思いっきり出ていますが、去年使っていた古いデータベースのデータだし気にしないこととします!
ちなみに当時ボクがUSから取得した新品価格データはセント単位のため、2495=$24.95を表しています。
もちろん、作成するクエリ設定の抽出条件は自分次第で、
- 新品価格の範囲指定(高額商品はあまり取り扱いたくない、など)
- 出品者数の範囲指定(競合出品者が多い商品はいやだ・・・でも0人もいやだっ・・・など)
- (ここでは出力していませんが)ランキングの範囲指定
- さらには自分で作成した「US/JP率」の範囲指定(0.5までOK、0.2未満は無視など)
といった感じに好きに設定してニヤニヤすることができます!
このように、データ抽出初心者の強い味方となるのがMS-Accessなのです!
(MacだとファイルメーカーProになると思います)
ダウンロードしたデータのインポート、
価格やランキングデータからデータを更新、
FBA発送手数料等含めたコスト計算など
今やAccessの使い勝手なしにはボクの利益は生まれません!
しかし、このようなデータ操作で儲かった気になっていては大ケガにつながります。
次回は、PA-APIの単純データを使って仕入れをしようとしたときに、ボクが直面した問題について紹介していきます。
スポンサーリンク
コメントを残す