NHK語学講座ダウンロード @ ウィキ

概略

ダウンロードの概略

  • 基本的には、rtmpdump コマンドを使ってNHK語学講座のflv配信をダウンロードしています。現在公開されているものは flvstreamer に変わり、一部のツールはこれのサポートに変わっています
  • 各ツールはこれを便利に使えるようにしたものです

必要なコマンド


各語学講座の情報が書かれたxmlファイル

http://www.nhk.or.jp/gogaku/english/basic1/listdataflv.xml 基礎英語1
http://www.nhk.or.jp/gogaku/english/basic2/listdataflv.xml 基礎英語2
http://www.nhk.or.jp/gogaku/english/basic3/listdataflv.xml 基礎英語3
http://www.nhk.or.jp/gogaku/english/training/listdataflv.xml 英語5分間トレーニング
http://www.nhk.or.jp/gogaku/english/kaiwa/listdataflv.xml ラジオ英会話
http://www.nhk.or.jp/gogaku/english/business1/listdataflv.xml 入門ビジネス英語
http://www.nhk.or.jp/gogaku/english/business2/listdataflv.xml 実践ビジネス英語
http://www.nhk.or.jp/gogaku/chinese/kouza/listdataflv.xml まいにち中国語
http://www.nhk.or.jp/gogaku/french/kouza/listdataflv.xml まいにちフランス語
http://www.nhk.or.jp/gogaku/italian/kouza/listdataflv.xml まいにちイタリア語
http://www.nhk.or.jp/gogaku/hangeul/kouza/listdataflv.xml まいにちハングル講座
http://www.nhk.or.jp/gogaku/german/kouza/listdataflv.xml まいにちドイツ語
http://www.nhk.or.jp/gogaku/spanish/kouza/listdataflv.xml まいにちスペイン語


やっていることの概要

  • ある週の基礎英語1のxmlファイルの中身は次のようになっていました
<?xml version="1.0" encoding="UTF-8" ?>
<musicdata>
<music title="基礎英語1" hdate="4月6日放送分" kouza="基礎英語1" file="09-ek1-4252-076.flv" />
<music title="基礎英語1" hdate="4月7日放送分" kouza="基礎英語1" file="09-ek1-4252-077.flv" />
<music title="基礎英語1" hdate="4月8日放送分" kouza="基礎英語1" file="09-ek1-4252-078.flv" />
<music title="基礎英語1" hdate="4月9日放送分" kouza="基礎英語1" file="09-ek1-4252-079.flv" />
<music title="基礎英語1" hdate="4月10日放送分" kouza="基礎英語1" file="09-ek1-4252-080.flv" />
</musicdata>
  • これの4月6日放送分のfile="..."の名前に対応して
    • flvstreamer -r "rtmp://flv9.nhk.or.jp/flv9/_definst_/flv:gogaku/streaming/flv/09-ek1-4252-076" -o 09-ek1-4252-076.flv
    • これを例えば "test.bat" ファイルに書き込んでそれを実行します。

  • 出来た flv から mp3 を抜き出すには色々なツールが有りますが、自動でやっているのは次のようにしています
    • ffmpeg -vn -y -i 09-ek1-4252-076.flv -acodec copy output.mp3

  • 以上のような事を自動的にやっているのが各ツールです

2011年度からの修正点

  • NHKが毎週変わるランダム文字列を入れてきました。例えばその週の文字列が0109BSNQVLFRF1だとすると以下のように変わります

ストリーミング配信の毎週変わる特定の文字列の入手方法

  • Internet Explorerの場合
(1)毎週月曜日に前の週の放送データがストリーミング配信される。
(1')新しいデータが配信される時点で昔のデータはないかも
(2)Internet Explorerで(Vistaや7の場合管理者モードで起動する必要がある)講座のページを表示しストリーミングを再生してみる。たとえば
http://www.nhk.or.jp/gogaku/english/basic1/index.html
(3)[ツール(T)]-[インターネットオプション(O)]-[全般タブ]-[閲覧の履歴]-[設定(S)]-[インターネット一時ファイル]-[ファイルの表示(V)]
(4)最終アクセス日時や最終変更日時が今になっている"listdataflv.xml"を見つける。
(5)見つけたファイルを右クリックしてプロパティを表示させる。
(6)下記のようなインターネットアドレスがコピー可能な形で評されるので
http://www.nhk.or.jp/gogaku/english/business2/0109BSNQVLFRF1/listdataflv.xml
このうち listdataflv.xmlのひとつ前の/と二つ前の/の間の文字列(この例だと0109BSNQVLFRF1)が今週の特定の文字列。

  • Firefoxの場合の変更点
(2)Firefoxで講座のページを表示しストリーミングを再生してみる。
(3)アドレスバーに「about:cache」と打ち込む(2つの単語の間のコロンを忘れないこと)。
(3')[List Cache Entries」をクリックする。
あとは(4)から(6)まで上と同じ。



更新履歴

取得中です。