アマゾンの商品URLからASINを抽出する方法

前回、ボクの初めて作った超単純なアマゾンツール、

ASIN→商品情報(JP/US)

の作成成功によって、これで価格差がわかる!道が開けた!と思ったボクでしたが、
※これはこれで今思うとそんな安易なはずもなく、だいぶ浅はかな考えですが

どんどん商品情報を取得していこうと思ったものの、作業を進めることができませんでした。

もう、ツールに投入するASINがありませんでした!

ボクがそれまでに集めた50や100のASINは、ツールのおかげで10分ほどで商品情報に変わってしまいました。そう、

「せっかくツール作っても、調査するASINが足りないんじゃ意味がない!」

というあたりまえのことに気づくのにそう時間はかかりませんでした。

稼ぐための種となる「大量のASINリスト」をどうやって作ったらよいのだろう・・・

今回はASINをどうやって集めるか(手動編)です。


純手動ASIN取得のやり方

「純手動」と大げさに銘打っていますが、いわゆるふつうのやり方になります。
とはいえ「手動で何をどうやるか」を実際にやってみて整理することが、「半自動」や「全自動」への大事なステップです。

  1. アマゾンで「並行輸入」で検索、またはイケてるセラーのストアページを表示
  2. 検索結果またはストアページの商品をクリック
  3. 商品ページが表示されたらURLの中からASINを探してコピー
  4. ASINリストへ貼り付け
  5. 次の商品へ
  6. そのページの商品が全て終わったら次のページへ

これをコツコツやっていくと、慣れない作業なこともあり、何だかポンコツな機械にでもなった気分に襲われます。

10件、20件、、何ページかやってみた頃に思います。

「これ、もうちょっと何とか楽にならんのかなー」

という心の奥底からの切実な叫びです。

できそうなところから工夫してみましょう。

商品URLからASINを抜き出す方法

STEP4の「商品ページが表示されたらURLの中からASINを探してコピー」

まずここの作業に、がんばれば簡略化できそうなにおいがしました。

結局のところ

https://www.amazon.co.jp/Cyborg-t-Mouse-Mac-2-ways/dp/B00965WK8K/

https://www.amazon.co.jp/%E3%82%BC%E3%83%B3%E3%83%8F%E3%82%A4%E3%82%B6%E3%83%BC-%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E5%9E%8B%E3%83%98%E3%83%83%E3%83%89%E3%83%95%E3%82%A9%E3%83%B3-HD-598-special/dp/B018M8CP4K/ref=sr_1_2?s=electronics&ie=UTF8&qid=1474680579&sr=1-2&keywords=%E4%B8%A6%E8%A1%8C%E8%BC%B8%E5%85%A5

といったアマゾンの短かったり長かったりするURLからASIN(B00965WK8KやB018M8CP4K)を抜き出せればいいわけです。

アマゾンの商品ページのURLを10個くらい並べて眺めていると、URLとASINの間に法則らしきものを見出すことができます。

<仮説1>ASINは「B」から始まる10桁である

おぉ!ということは

「Bから始まる10桁を抜き出せばいいのか!!!」

<検証1>実はASINは「B」以外から始まるものもある

0から始まるASINサンプル

撃沈しました・・・でも発想は悪くありません。実際問題しばらくボクはASIN=Bから始まると思い込んでいたし、ボクが見るかぎりASINの99.99%は「B」から始まっていますから、実はこれでも問題ないと思います。

ただ、「Bから始まる10桁」を抜き出そうとすると、商品名とかカテゴリーとかいろいろ入れ込んでくるアマゾンのURLからASINを一発で抜き出すのは困難なため、いずれにしてももう一工夫必要です。

<仮説2>ASINは「dp/」の後に続く10桁である

おぉ!ということは

「dp/の後の10桁を抜き出せばいいのかあぁ!!!」

<検証2>50件くらい検証した結果、dp/の後の10桁はすべてASINコードだった

※あれから1年、いまだにこれで問題が起きていないのでたぶんOKだと思います

過去のこちらの記事で

「ドメイン」+「/dp/」+「ASINコード」で商品ページのURLになる、と書いたのはこのことを表しています。

http://amaasin.com/%E3%80%8C%E8%BC%B8%E5%85%A5%E3%80%8D%E3%81%A7%E3%81%AF%E3%81%AA%E3%81%8F%E3%80%8C%E3%82%A2%E3%83%9E%E3%82%BE%E3%83%B3%E8%BC%B8%E5%85%A5%E3%80%8D%E3%81%AE%E8%82%9D%E3%81%AFasin%E3%81%AB%E3%81%82/

では、どうやってURLからASINを抜き出せばよいのでしょうか?

みなさんもよくご存じのExcelの関数を使ってやってみましょう。

urltoasin1

途中経過がわかりやすいようにA列のURLからD列の求めるASINまで途中にB列C列を入れて作ってみました。

A列:URL(先ほどの2例のURLを使っています)

B列:dp(「dp/」が何桁目に出てくるか)を算出する関数が入っています。具体的にはセル「B2」には

が入っています。

C列:URLの1桁目~B列で算出したdp/までの桁分の文字列が入っています。ASINが始まる手前までのURL文字列です。具体的にはセル「C2」には

が入っています。+3しているのは「dp/」の3文字分を含ませるためですね。

D列:A列のURLからC列のASIN手前までの文字列を消去(””で置き換え)して、ASIN始まりの文字列になったところで、文字列の左から10文字を抽出してASINとしています。具体的にはセル「D2」には

が入っています。

問題なく動作するようでしたらB~D列までは1列にまとめられるので、実際はB2列に

=IF(IFERROR(FIND("dp/",A2)-1,0)<>0,LEFT(SUBSTITUTE(A2,IF(IFERROR(FIND("dp/",A2)-1,0)>0,LEFT(A2,IFERROR(FIND("dp/",A2)-1,0)+3),0),""),10),"")

を入れるだけで、

A2列のURLからB2列のASINに一発変換してくれます!

urltoasin5

よっしゃ!これでURLをどんどんコピペしていけばASINリストができるぞ!!

と思ったその時、次の一手が浮かびました。


いやー、がんばって書いてみたものの、なんだかムダに細かすぎて誰も必要としていない情報だった気が少ししていますw

今思うと、ASINがたくさんほしいならいろいろ取得ツールがあるじゃないか!とも思います。
しかし!安易にツールに頼らずURL構造含めて考えていったことは、今の稼ぎにつながってきている・・・はずだと思っています!

今回は単なるExcelでの文字列操作にすぎませんが、次回は一気に数十倍の効率アップにつなげる一手を実現していきます!

今回はここまでです!ありがとうございます。

1 個のコメント

  • 初めまして。
    マーケットプレイスでホビー、ゲーム関係の商品を扱っている者です。
    ASINの簡単な抽出方法を探しておりましたので、助かりました。
    今後、ブログを購読させて頂きます。
    ありがとうございました。

  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です