アマゾンの検索結果からASINを取得する方法(Scraper版)

以前にもアマゾンでの検索結果やセラーのストアページからASINを半自動で取得する方法を紹介しました。

過去に紹介したのはLinkclumpを使う方法Google Developer Toolsを使用した方法でしたが、どちらも欠点があり、半自動というよりは半手動という感じでした。

ボクは半手動で1ヶ月過ごしつつ、全自動ASIN収集ツールを開発に移行したため、それ以上の半自動ツールでの効率化には到達しませんでした。

しかし、過去の手法をブログで紹介するにあたりプロセスをじっくり見てみると、

いくつかのツールを組み合わせることで、以前よりも効率化できそうなアイデアが浮かんできました!

今回は、実際にボクが使っていた方法ではありませんが、

「もし今も全自動ツールを使っていなかったら」使っていそうな

無料ツールの組み合わせによる半自動ASIN収集法(改良版)を紹介したいと思います。

組み合わせるのは下記3つのツールです。

  1. AutoPagerize
  2. HandsFread
  3. Scraper

それぞれ、このツールそのものじゃなくても、同様の目的を果たすことができれば大丈夫です。

では、個々に説明していきます。

AutoPagerize

ブラウザchromeの拡張機能です。わりと有名なので使い方もあちこちで紹介されていますね。

AutoPagerize

今回AutoPagerizeにお願いしたい役割は、

アマゾンの検索結果を表示したときに、「次のページ」をクリックしなくても、画面をある程度下までスクロールしたら次のページを表示する

ことです。

autopagerize1

ページングが成功すると、画像の「page:15」のようにどんどん下にページが足されていきます。

AutoPatchWorkというものもあって、最初はそちらを試していたのですが・・・

今回使用した(ボクのノートPC環境での)15ページスクロール実験では、15ページあるのに11ページで停止してしまったため、全ページ取ってくれたAutoPagerizeを紹介することにしました。

最後まで取ってくれるならAutoPatchWorkでもぜんぜんOKです!
※この辺りはメモリやネットワーク環境にも依存するようで、別のハイパワーPCだとAutoPatchWorkの方が多数のページを取ってくれましたね。

HandsFread

AutoPagerizeが無事に動くようになったら、それだけで

「ひたすらPageDownキーで下にスクロールさせていくだけで全ページを表示させることができる」

ようになります。

でも、50ページとかあったらそれはちょっと大変です。そこで、

自動でスクロールしてくれる「HandsFread」の出番です。

これはchromeの拡張機能というよりは、ブックマーク(バー)に登録することでいつでも呼び出せるchrome上で走らせるコマンド、といった感じです。

HandsFread

HandsFreadのページに飛んで、

handsfread1

上記画面のように自動スクロールの速度やスクロール量を設定して、How Now?の下のHandsFreadリンクをそのままブックマークバーにドラッグする等の方法で、ブックマークに追加してあげることで使えるようになります。

あとは、アマゾンの検索結果ページを表示した後に、

handsbread2

ブックマークに追加したHandsFreadをクリックするだけです。

すると、、、、

下までスクロールする→少したつと次のページが現れる→下までスクロールする→・・・

の繰り返しが始まり、

最後のページまで到達するはずです!

※メモリ等の環境によりますが、400ページ出てくる検索結果でテストしたら、ハイパワーPCでも96ページくらいで止まってしまうことがボクは多かったです
→最後まで取りたかったら次は97ページ目から再スタートさせます

handsbread3

唯一の欠点は・・・このHandsFread、スクロールを止めることができないことです。。押したら最後、最後のページの一番下に行くまで止まらないし、上にも戻れません。。

「トップへ戻る」をクリックしても、またすぐにスクロールが始まってしまいますw

スクロールが止まったら終わり、なんだけど何ページまで行ったか確認したいよなーと思っていたところ、回避法を紹介していたのはこちら。

ページの自動スクロールを可能にするHandsFreadの裏ワザ?「速度調節」と「スクロールを止める」方法

なるほど、マイナス設定のブックマークをもう一つ作っておくことで相殺するという発想ですね。。

画面がガクガクゆれたりもしますが、相殺したうえである程度自由に動かすことができます!

なお、もちろんHandsFreadじゃなくても同様の自動スクロール系のchrome拡張などあればそちらを使ってもOKです!

Scraper

ここまでのAutoPagerize→HandsFreadのコンビネーションで、

検索結果やセラーのストアページの

最終ページまでの内容が1ページの中に表示されていることになります。

これはかなーり、すごいことです!

というのも、ここまで来たら後は連結表示されているページ内のURLを一括取得できればあとは慣れた手順でASINを抜くだけです。

以前紹介したGoogle Developer Toolsを使ったURLの一括取得、、でもいいのですが、URLが長いと「…」で省略されてしまう問題がありました。

そこで、今回の真打、Scraperの出番となります。

Scraper

ScraperはAutoPagerizeと同様のchromeブラウザ用の拡張機能で、表示されているページの中の情報を取得することができます。

全ページ表示後、chromeの右上にあるScraperアイコンからScraper similar…というメニューを選ぶと、

scraper1

「フレームには対応してないよ!」というエラーメッセージが出るものの、すぐに

scraper2

初期設定のままで表示している連結ページ内のすべてのリンク情報を出力してくれています!
これ、うまく設定すればいきなりASIN含むリンクのみ・・・あるいは即ASIN出力できるようにもなりそうな可能性を感じます!

しかも、「Copy to Clipboard(コピー)」「Export to Google Docs(Googleドキュメントへ出力)」などかゆいところに手が届くボタンも右下に!

コピーして、Excelに貼り付けるとこんな感じになります。

scraper10

リンク文字列(A列)とURL(B列)が取れました!

ということは、、昔使ったURLtoASINの式を参照列を少し変えて、こんな風にB列を加工する式をC列に入れていけば・・・

scraper4

しっかりC列にASINが入ってきました!

ASINが入っていない行は非表示にして、

scraper5

別シートにコピペした後ExcelでASINの重複をなくせば、

scraper7 scraper9

ついにASINコードが抽出されました!

※ページに表示されている「すべてのURLに含まれるASIN」が対象となるため、Kindle製品や「最近見た商品」のASINが入り、353件から少し増えてしまいます。

しかも、このScraperの出力、よく見ると

scraper8

PA-APIやMWSでも取れない評価(例:5つ星のうち4.6)や評価の数(例:32)まで入ってるから、Excelでうまく前後のASINコードと組み合わせてあげることで、

評価や評価数を含めたデータベースを作ることもできそうです!

単純なツールを組み合わせることで、今までで一番使えそうな半自動ASIN取得ツールができたと思いませんか?

以前よりもスマートにできた分が、ボクの1年半の成長かもしれません。

そして、何も無しで進めるよりはだいぶ有効な方法だと思いますが、やはり全自動ツールがあると次元が違うくらい楽になります!

というわけで、次回は有料のASIN取得ツールなども含めた「全自動の世界」を紹介する予定です。

なお今回紹介したのはあくまでボクの環境で、現時点のバージョンによる上記組み合わせでうまくいっただけなので、「うまくいかないんだけど・・・」等のサポートはできない旨ご了承ください。。

それでは本日もありがとうございました!

ランキングに参加しています!どこかためになるところなどありましたら、ぜひクリックしてください!


輸入・輸出ビジネス ブログランキングへ

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です