アマゾンの検索結果からASINを抽出する方法(その2)

唐突ですが、今回は以前紹介したLinkclumpによる「アマゾンの検索結果からASINを抽出する方法」の続編になります。

というのも、Linkclumpを使う方法と並行して使っていた方法のメモが見つかったからです。

というわけで今回はGoogle Developer Toolsを使って表示されているWebページからURLをリストアップする方法の紹介です。

Google Developer Toolsとは

chromeで「ctrl」+「shift」+「i(アイ)」で右側に現れるコンソール画面です。

console1

詳細は未だにボクもわかっていませんが、左側のWebページの情報に対してさまざまなコマンドを実行することができるツール、だと認識しています。

※参考リンク:Web開発でよく使う、特に使えるChromeデベロッパー・ツールの機能

URLを抽出する手順

ctrl+shift+i でGoogle Developer Consoleを起動します。

console2

Elements/Console/Sourcesといったタブから「Console」を選択してConsoleパネルを開き、

カーソルが出ているコマンドラインに

をコピペして実行します。

すると、

console3

なんかURLらしきものがずらずら出てきました!

ただ、このデータの中にはノイズも多いため、ASINの前に「dp/」が含まれているデータだけに絞れるよう、上部のフィルタ項目に「dp/」を入れてフィルタリングします。

console4

だいぶ少なくなりましたね。

ここで終わってもいいのですが、1ページだけでなく連続したページのASINを一括取得できるため、

左のamazonサイトで検索結果を次のページに進めたあと、コンソールで「↑(上カーソルキー)」を押すと、直近のコマンドが出てくるのでそのまま「Enterキー」でコマンドを再度実行してみましょう。

console5

こうやって、

  1. Amazonページ進める
  2. 上カーソルキーでコマンドを再呼び出し
  3. 実行

を繰り返して各ページのURLをconsoleへ抽出させたものを貯めておいて、1日の作業の最後に、

console6

Consoleウィンドウで右クリックして「Save as…(別名で保存)」を選び保存します。
※Clear console等を選ぶと貯めてきた履歴が消えてしまうのでご注意ください!

保存したファイルをエディタ(ボクはサクラエディタを使っています)で開くと、

console7

こんな風に先ほどConsoleで実行したコマンドとその実行結果(フィルタ後)が保存されています。

これをそのまま全部の行を選択して、以前作成したURL→ASINエクセルのURL部にコピペします。

すると、

console8

URLにASINが含まれていればURLからASINを抽出してくれます!

あとはLinkclumpの場合と同様に、重複やASIN以外の行を除けば完成です。

Linkclumpを利用した方法と比較

なんだ!この方法なら毎ページドラッグしなきゃいけないLinkclumpなんて使う必要ないじゃないか!

と思うかもしれません。

でも、この方法には1つ欠点があります。

console9

商品名等によってURLが長い場合、画像のようにASIN部分が「…」で省略されてしまうのです!!

この「…」問題、解消できる方法がありそうな気もするのですが、ここを突き詰める前に次の方法に移ってしまったので解消できていません・・・解消法がわかる方、ぜひ教えてください!

「…」問題を致命的と取るか、割り切れるかで半自動ASIN取得の方法について、

Linkclump派Google Developer Console派に分かれるのではないでしょうか。

あいかわらず細かいTIPSの話をここまで読んでいただきありがとうございました!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です