トップページ > windows > ブラウザ > firefox > アドオン > XPATHER

「トップページ/windows/ブラウザ/firefox/アドオン/XPATHER」の編集履歴(バックアップ)一覧はこちら

トップページ/windows/ブラウザ/firefox/アドオン/XPATHER」(2011/03/08 (火) 14:04:52) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

最終更新日時&date() ■目次 #contents_line() ■本文 *XPTHERとは Firefoxのアドオンの一つ。 選択した文字列のXPATHを取得できる。 XPATHを入力すれば、文字列を取得することもできる。 そのため、ちょっとしたスクレイピングのような使い方もできる。 **ダウンロード [[XPather :: Add-ons for Firefox >https://addons.mozilla.org/ja/firefox/addon/1192]] *XTPHERの使い方:公式説明(英語) [[ XPather Documentation v1.1 >http://xpath.alephzarro.com/documentation]] *XPATHERの使い方:他の人による説明(日本語) 日本語で説明されているのは数が少ないが、このページは良質。 [[ マークアップエンジニアはXPathを使いこなそう - ブログ - aldente-studio >http://www.aldente-studio.net/blog/2010/09/xpath.html]] *XPATHERの使い方:我流 **XPATHの取得 0.XPATHERを有効にしておく。 1.XPATHを知りたい部分をドラッグ。 2.XPATHを知りたいxpatherを起動。右クリックで「XPTHERで表示」を選択。 **XPATHを用いて、データの一括取得 1基礎(スクレイピング基礎) 0.多量の繰り返し構造になっているWEBページから定型の情報を抜き出したい。 1.抜き取りたい部分のうち、ページ中盤にあるものをドラッグして選択。 2.「XPATH」欄に表示されたXPATHを変更。   XPATHの書き方詳細はこちら[[勉強用メモ - XPATH/XPATHの記述方法 >http://www42.atwiki.jp/tomokazu0525/pages/116.html]] 3.「評価」ボタンを押す。 4.「該当ノード」欄に表示されたものをShiftキーやCtrlキーを押しながら選択すると、   下部のテキストタブに表示される。 5.テキストタブからは普通にCtrl+Cなどでコピーできる。 **XPATHを用いて、データの一括取得 2応用 正規表現と置換を用いる #html2(){{{{{{ <TABLE align="right"> <TR> <TD> <iframe src="http://rcm-jp.amazon.co.jp/e/cm?lt1=_blank&bc1=000000&IS2=1&bg1=FFFFFF&fc1=000000&lc1=0000FF&t=tomokazu0525-22&o=9&p=8&l=as1&m=amazon&f=ifr&md=1X69VDGQCMF7Z30FM082&asins=4873113598" style="width:120px;height:240px;" scrolling="no" marginwidth="0" marginheight="0" frameborder="0"></iframe> </TD> </TR> </TABLE> }}}}}} テキストタブでの表示に反映される。 クリッピングタブでは変化なし。 以下具体例 ***結果の一つずつを改行つきでピックアップしたい。 #html2(){{{{{{ <div> 正規表現欄:/$/ <br> 置換欄:\\nn <br> </div> <BR clear="all"> }}}}}} ***結果がjavascriptの場合に、voidの()内だけを、改行付きで抜き出したい #html2(){{{{{{ <div> 正規表現欄:/javascript:void\('(.*)+'\)/ <br> 置換欄:$1\\nn </div> <BR clear="all"> }}}}}} ■正規表現の適用結果例 正規表現適用前の文字列:javascript:void('111111') 正規表現適用後の文字列:111111 ***新規追加用テンプレート #html2(){{{{{{ <div> 正規表現欄: <br> 置換欄: </div> <BR clear="all"> }}}}}} ■例 正規表現適用前の文字列: 正規表現適用後の文字列: *ページフッタ **このページの1階層下のページ #lsd() **このページに含まれるタグ &tags() **このページへのアクセス数 今日:&counter(today) 昨日:&counter(yesterday) これまで合計:&counter(total) 
最終更新日時&date() ■目次 #contents_line() ■本文 *XPTHERとは Firefoxのアドオンの一つ。 選択した文字列のXPATHを取得できる。 XPATHを入力すれば、文字列を取得することもできる。 そのため、ちょっとしたスクレイピングのような使い方もできる。 **ダウンロード [[XPather :: Add-ons for Firefox >https://addons.mozilla.org/ja/firefox/addon/1192]] *XTPHERの使い方:公式説明(英語) [[ XPather Documentation v1.1 >http://xpath.alephzarro.com/documentation]] *XPATHERの使い方:他の人による説明(日本語) 日本語で説明されているのは数が少ないが、このページは良質。 [[ マークアップエンジニアはXPathを使いこなそう - ブログ - aldente-studio >http://www.aldente-studio.net/blog/2010/09/xpath.html]] *XPATHERの使い方:我流 **XPATHの取得 0.XPATHERを有効にしておく。 1.XPATHを知りたい部分をドラッグ。 2.XPATHを知りたいxpatherを起動。右クリックで「XPTHERで表示」を選択。 **XPATHを用いて、データの一括取得 1基礎(スクレイピング基礎) 0.多量の繰り返し構造になっているWEBページから定型の情報を抜き出したい。 1.抜き取りたい部分のうち、ページ中盤にあるものをドラッグして選択。 2.「XPATH」欄に表示されたXPATHを変更。   XPATHの書き方詳細はこちら[[勉強用メモ - XPATH/XPATHの記述方法 >http://www42.atwiki.jp/tomokazu0525/pages/116.html]] 3.「評価」ボタンを押す。 4.「該当ノード」欄に表示されたものをShiftキーやCtrlキーを押しながら選択すると、   下部のテキストタブに表示される。 5.テキストタブからは普通にCtrl+Cなどでコピーできる。 **XPATHを用いて、データの一括取得 2応用 正規表現と置換を用いる #html2(){{{{{{ <TABLE align="right"> <TR> <TD> <iframe src="http://rcm-jp.amazon.co.jp/e/cm?lt1=_blank&bc1=000000&IS2=1&bg1=FFFFFF&fc1=000000&lc1=0000FF&t=tomokazu0525-22&o=9&p=8&l=as1&m=amazon&f=ifr&md=1X69VDGQCMF7Z30FM082&asins=4873113598" style="width:120px;height:240px;" scrolling="no" marginwidth="0" marginheight="0" frameborder="0"></iframe> </TD> </TR> </TABLE> }}}}}} テキストタブでの表示に反映される。 クリッピングタブでは変化なし。 以下具体例 ***結果の一つずつを改行つきでピックアップしたい。 #html2(){{{{{{ <div> 正規表現欄:/$/ <br> 置換欄:\\nn <br> </div> <BR clear="all"> }}}}}} ***結果がjavascriptの場合に、voidの()内だけを、改行付きで抜き出したい #html2(){{{{{{ <div> 正規表現欄:/javascript:void\('(.*)+'\)/ <br> 置換欄:$1\\nn </div> <BR clear="all"> }}}}}} ■正規表現の適用結果例 正規表現適用前の文字列:javascript:void('111111') 正規表現適用後の文字列:111111 ***新規追加用テンプレート #html2(){{{{{{ <div> 正規表現欄: <br> 置換欄: </div> <BR clear="all"> }}}}}} ■例 正規表現適用前の文字列: 正規表現適用後の文字列: #amazon2(728x90) &link_edit(text=ここを編集) *ページフッタ **このページの1階層上のページ &link_parent() **このページの1階層下のページ #lsd() **このページに含まれるタグ &tags() **このページへのアクセス数 今日:&counter(today) 昨日:&counter(yesterday) これまで合計:&counter(total)

表示オプション

横に並べて表示:
変化行の前後のみ表示: