「トップページ/windows/ブラウザ/firefox/アドオン/XPATHER」の編集履歴(バックアップ)一覧はこちら
追加された行は緑色になります。
削除された行は赤色になります。
最終更新日時&date()
■目次
#contents_line()
■本文
*XPTHERとは
Firefoxのアドオンの一つ。
選択した文字列のXPATHを取得できる。
XPATHを入力すれば、文字列を取得することもできる。
そのため、ちょっとしたスクレイピングのような使い方もできる。
**ダウンロード
[[XPather :: Add-ons for Firefox >https://addons.mozilla.org/ja/firefox/addon/1192]]
*XTPHERの使い方:公式説明(英語)
[[ XPather Documentation v1.1 >http://xpath.alephzarro.com/documentation]]
*XPATHERの使い方:他の人による説明(日本語)
日本語で説明されているのは数が少ないが、このページは良質。
[[ マークアップエンジニアはXPathを使いこなそう - ブログ - aldente-studio >http://www.aldente-studio.net/blog/2010/09/xpath.html]]
*XPATHERの使い方:我流
**XPATHの取得
0.XPATHERを有効にしておく。
1.XPATHを知りたい部分をドラッグ。
2.XPATHを知りたいxpatherを起動。右クリックで「XPTHERで表示」を選択。
**XPATHを用いて、データの一括取得 1基礎(スクレイピング基礎)
0.多量の繰り返し構造になっているWEBページから定型の情報を抜き出したい。
1.抜き取りたい部分のうち、ページ中盤にあるものをドラッグして選択。
2.「XPATH」欄に表示されたXPATHを変更。
XPATHの書き方詳細はこちら[[勉強用メモ - XPATH/XPATHの記述方法 >http://www42.atwiki.jp/tomokazu0525/pages/116.html]]
3.「評価」ボタンを押す。
4.「該当ノード」欄に表示されたものをShiftキーやCtrlキーを押しながら選択すると、
下部のテキストタブに表示される。
5.テキストタブからは普通にCtrl+Cなどでコピーできる。
**XPATHを用いて、データの一括取得 2応用 正規表現と置換を用いる
#html2(){{{{{{
<TABLE align="right">
<TR>
<TD>
<iframe src="http://rcm-jp.amazon.co.jp/e/cm?lt1=_blank&bc1=000000&IS2=1&bg1=FFFFFF&fc1=000000&lc1=0000FF&t=tomokazu0525-22&o=9&p=8&l=as1&m=amazon&f=ifr&md=1X69VDGQCMF7Z30FM082&asins=4873113598" style="width:120px;height:240px;" scrolling="no" marginwidth="0" marginheight="0" frameborder="0"></iframe>
</TD>
</TR>
</TABLE>
}}}}}}
テキストタブでの表示に反映される。
クリッピングタブでは変化なし。
以下具体例
***結果の一つずつを改行つきでピックアップしたい。
#html2(){{{{{{
<div>
正規表現欄:/$/
<br>
置換欄:\\nn
<br>
</div>
<BR clear="all">
}}}}}}
***結果がjavascriptの場合に、voidの()内だけを、改行付きで抜き出したい
#html2(){{{{{{
<div>
正規表現欄:/javascript:void\('(.*)+'\)/
<br>
置換欄:$1\\nn
</div>
<BR clear="all">
}}}}}}
■正規表現の適用結果例
正規表現適用前の文字列:javascript:void('111111')
正規表現適用後の文字列:111111
***新規追加用テンプレート
#html2(){{{{{{
<div>
正規表現欄:
<br>
置換欄:
</div>
<BR clear="all">
}}}}}}
■例
正規表現適用前の文字列:
正規表現適用後の文字列:
*ページフッタ
**このページの1階層下のページ
#lsd()
**このページに含まれるタグ
&tags()
**このページへのアクセス数
今日:&counter(today)
昨日:&counter(yesterday)
これまで合計:&counter(total)
最終更新日時&date()
■目次
#contents_line()
■本文
*XPTHERとは
Firefoxのアドオンの一つ。
選択した文字列のXPATHを取得できる。
XPATHを入力すれば、文字列を取得することもできる。
そのため、ちょっとしたスクレイピングのような使い方もできる。
**ダウンロード
[[XPather :: Add-ons for Firefox >https://addons.mozilla.org/ja/firefox/addon/1192]]
*XTPHERの使い方:公式説明(英語)
[[ XPather Documentation v1.1 >http://xpath.alephzarro.com/documentation]]
*XPATHERの使い方:他の人による説明(日本語)
日本語で説明されているのは数が少ないが、このページは良質。
[[ マークアップエンジニアはXPathを使いこなそう - ブログ - aldente-studio >http://www.aldente-studio.net/blog/2010/09/xpath.html]]
*XPATHERの使い方:我流
**XPATHの取得
0.XPATHERを有効にしておく。
1.XPATHを知りたい部分をドラッグ。
2.XPATHを知りたいxpatherを起動。右クリックで「XPTHERで表示」を選択。
**XPATHを用いて、データの一括取得 1基礎(スクレイピング基礎)
0.多量の繰り返し構造になっているWEBページから定型の情報を抜き出したい。
1.抜き取りたい部分のうち、ページ中盤にあるものをドラッグして選択。
2.「XPATH」欄に表示されたXPATHを変更。
XPATHの書き方詳細はこちら[[勉強用メモ - XPATH/XPATHの記述方法 >http://www42.atwiki.jp/tomokazu0525/pages/116.html]]
3.「評価」ボタンを押す。
4.「該当ノード」欄に表示されたものをShiftキーやCtrlキーを押しながら選択すると、
下部のテキストタブに表示される。
5.テキストタブからは普通にCtrl+Cなどでコピーできる。
**XPATHを用いて、データの一括取得 2応用 正規表現と置換を用いる
#html2(){{{{{{
<TABLE align="right">
<TR>
<TD>
<iframe src="http://rcm-jp.amazon.co.jp/e/cm?lt1=_blank&bc1=000000&IS2=1&bg1=FFFFFF&fc1=000000&lc1=0000FF&t=tomokazu0525-22&o=9&p=8&l=as1&m=amazon&f=ifr&md=1X69VDGQCMF7Z30FM082&asins=4873113598" style="width:120px;height:240px;" scrolling="no" marginwidth="0" marginheight="0" frameborder="0"></iframe>
</TD>
</TR>
</TABLE>
}}}}}}
テキストタブでの表示に反映される。
クリッピングタブでは変化なし。
以下具体例
***結果の一つずつを改行つきでピックアップしたい。
#html2(){{{{{{
<div>
正規表現欄:/$/
<br>
置換欄:\\nn
<br>
</div>
<BR clear="all">
}}}}}}
***結果がjavascriptの場合に、voidの()内だけを、改行付きで抜き出したい
#html2(){{{{{{
<div>
正規表現欄:/javascript:void\('(.*)+'\)/
<br>
置換欄:$1\\nn
</div>
<BR clear="all">
}}}}}}
■正規表現の適用結果例
正規表現適用前の文字列:javascript:void('111111')
正規表現適用後の文字列:111111
***新規追加用テンプレート
#html2(){{{{{{
<div>
正規表現欄:
<br>
置換欄:
</div>
<BR clear="all">
}}}}}}
■例
正規表現適用前の文字列:
正規表現適用後の文字列:
#amazon2(728x90)
&link_edit(text=ここを編集)
*ページフッタ
**このページの1階層上のページ
&link_parent()
**このページの1階層下のページ
#lsd()
**このページに含まれるタグ
&tags()
**このページへのアクセス数
今日:&counter(today)
昨日:&counter(yesterday)
これまで合計:&counter(total)