「過去ログ」の編集履歴(バックアップ)一覧はこちら
「過去ログ」(2009/04/26 (日) 22:17:01) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
- つくりましたよ~進捗報告とか -- さかまき (2009-04-10 17:50:49)
- 4/10 MTの議事録UPしましたよー -- もりちか (2009-04-10 17:56:01)
- ファイル名は、"CiNii.txt"です。 -- もりちか (2009-04-10 18:00:04)
- トップページのソースを取ってくるとこまでできました。 -- さかまき (2009-04-11 20:44:51)
- でけた。物置にサンプルあげときます。 -- さかまき (2009-04-11 21:35:44)
- 工学部Ver.あげます。コマンド2のほうはまだできてないです。 -- もりちかー (2009-04-13 18:02:36)
- 若干、順調♪がんばります!!w -- いかわ (2009-04-13 22:16:41)
- マキさんとおなじミスwパスは見なかったことにしてください。 -- moritika (2009-04-13 22:19:33)
- もりちーの工学部verどこにある?? -- いかわ (2009-04-13 22:22:48)
- 挫折orz... -- いかわ (2009-04-14 03:31:17)
- 井川お疲れ・・・。 -- さかまき (2009-04-14 10:32:26)
- とりあえず学部共通のほうはできました。データベースがでかすぎてアップできない・・・明日見せます。 -- さかまき (2009-04-14 15:09:38)
- データベースのカラム一覧を上げときました~ -- さかまき (2009-04-14 22:37:33)
- まきさんに質問なんだけど、UTmateの?以降のパラメータについてなんだけど…それってURLに入れる時順番入れ替えると表示されないとかあるの? -- いかわ (2009-04-15 19:48:40)
- 例えば、nendoとdepthとかのパラメータの順番変えたらおかしくならない? -- いかわ (2009-04-15 19:49:34)
- すまぬ。気づくのが遅かったよ。POSTデータの順番は関係ないと思うけどなあ。パラメータが足らないとおかしなことになるかもだけど。 -- さかまき (2009-04-15 21:40:03)
- ちなみに今はどの段階?シラバスへのリンクのリストはとってこれてる? -- さかまき (2009-04-15 21:40:51)
- https://ut-gakumu.adm.u-tokyo.ac.jp/websys/campus?view=view.syllabus_en.refer.search.input&func=function.syllabus_en.refer.itemsearch&from_view=1&s_no=0&nendo=2009&disp_cnt=2000 -- さかまき (2009-04-15 21:53:17)
- 今確認したところ、↑のアドレスで工学部シラバス一覧がとってこれる模様(ログインした状態で) -- さかまき (2009-04-15 21:54:00)
- そんで、↑のアドレス一覧の個々の要素がフレームページへのリンクになってるから、もう一回各フレームページへのリンクをHTML解析して読み取る。 -- さかまき (2009-04-15 21:57:25)
- その後、各シラバスが取得できたら、根性でそのシラバスにある規則を探し出して(たぶんここが一番大変)、どうにかきれいな形でDBにぶちこめるようにする。こんな感じだろうか。 -- さかまき (2009-04-15 21:58:41)
- CSVファイルを生成する(中身は各シラバスの「フレーム」部分のアドレスのポストデータ)とこまではできてるはずだよー。(前俺がアップしたやつ)今フレーム要素のアトリビュートが取ってこれないです。。ポストデータが同じとこ(viewとかfuncとか)は手書きで、フレームの上半分にアクセスしようと思ったんだけど、駄目だった。 -- もりちか (2009-04-15 23:08:47)
- 上のフレームにアクセスしようとすると、正しく情報が取れませんと出るんだ…なんかURLのパラメータを順番変えるとアクセスできたりできなかったりするんだよ。 -- いかわ (2009-04-16 02:27:08)
- ブラウザからフレームにアクセスすると表示できるんだけど、Pythonから取ってこようとすると正しく情報を得られませんでしたって出るんだよなー -- いかわ (2009-04-16 02:50:07)
- もりちーのをもとにして工学部バージョン作ってみたよ(GetSyllabusEn2.py)。シラバスはとってこれるけど文字化けがひどい。utf-8で保存されている模様・・・もうちょい手を加える必要があるかも。 -- さかまき (2009-04-16 13:07:40)
- 文字化けならあとはなんとかなりそうだね。あとで見せてー -- いかわ (2009-04-16 14:51:13)
- つくりましたよ~進捗報告とか -- さかまき (2009-04-10 17:50:49)
- 4/10 MTの議事録UPしましたよー -- もりちか (2009-04-10 17:56:01)
- ファイル名は、"CiNii.txt"です。 -- もりちか (2009-04-10 18:00:04)
- トップページのソースを取ってくるとこまでできました。 -- さかまき (2009-04-11 20:44:51)
- でけた。物置にサンプルあげときます。 -- さかまき (2009-04-11 21:35:44)
- 工学部Ver.あげます。コマンド2のほうはまだできてないです。 -- もりちかー (2009-04-13 18:02:36)
- 若干、順調♪がんばります!!w -- いかわ (2009-04-13 22:16:41)
- マキさんとおなじミスwパスは見なかったことにしてください。 -- moritika (2009-04-13 22:19:33)
- もりちーの工学部verどこにある?? -- いかわ (2009-04-13 22:22:48)
- 挫折orz... -- いかわ (2009-04-14 03:31:17)
- 井川お疲れ・・・。 -- さかまき (2009-04-14 10:32:26)
- とりあえず学部共通のほうはできました。データベースがでかすぎてアップできない・・・明日見せます。 -- さかまき (2009-04-14 15:09:38)
- データベースのカラム一覧を上げときました~ -- さかまき (2009-04-14 22:37:33)
- まきさんに質問なんだけど、UTmateの?以降のパラメータについてなんだけど…それってURLに入れる時順番入れ替えると表示されないとかあるの? -- いかわ (2009-04-15 19:48:40)
- 例えば、nendoとdepthとかのパラメータの順番変えたらおかしくならない? -- いかわ (2009-04-15 19:49:34)
- すまぬ。気づくのが遅かったよ。POSTデータの順番は関係ないと思うけどなあ。パラメータが足らないとおかしなことになるかもだけど。 -- さかまき (2009-04-15 21:40:03)
- ちなみに今はどの段階?シラバスへのリンクのリストはとってこれてる? -- さかまき (2009-04-15 21:40:51)
- https://ut-gakumu.adm.u-tokyo.ac.jp/websys/campus?view=view.syllabus_en.refer.search.input&func=function.syllabus_en.refer.itemsearch&from_view=1&s_no=0&nendo=2009&disp_cnt=2000 -- さかまき (2009-04-15 21:53:17)
- 今確認したところ、↑のアドレスで工学部シラバス一覧がとってこれる模様(ログインした状態で) -- さかまき (2009-04-15 21:54:00)
- そんで、↑のアドレス一覧の個々の要素がフレームページへのリンクになってるから、もう一回各フレームページへのリンクをHTML解析して読み取る。 -- さかまき (2009-04-15 21:57:25)
- その後、各シラバスが取得できたら、根性でそのシラバスにある規則を探し出して(たぶんここが一番大変)、どうにかきれいな形でDBにぶちこめるようにする。こんな感じだろうか。 -- さかまき (2009-04-15 21:58:41)
- CSVファイルを生成する(中身は各シラバスの「フレーム」部分のアドレスのポストデータ)とこまではできてるはずだよー。(前俺がアップしたやつ)今フレーム要素のアトリビュートが取ってこれないです。。ポストデータが同じとこ(viewとかfuncとか)は手書きで、フレームの上半分にアクセスしようと思ったんだけど、駄目だった。 -- もりちか (2009-04-15 23:08:47)
- 上のフレームにアクセスしようとすると、正しく情報が取れませんと出るんだ…なんかURLのパラメータを順番変えるとアクセスできたりできなかったりするんだよ。 -- いかわ (2009-04-16 02:27:08)
- ブラウザからフレームにアクセスすると表示できるんだけど、Pythonから取ってこようとすると正しく情報を得られませんでしたって出るんだよなー -- いかわ (2009-04-16 02:50:07)
- もりちーのをもとにして工学部バージョン作ってみたよ(GetSyllabusEn2.py)。シラバスはとってこれるけど文字化けがひどい。utf-8で保存されている模様・・・もうちょい手を加える必要があるかも。 -- さかまき (2009-04-16 13:07:40)
- 文字化けならあとはなんとかなりそうだね。あとで見せてー -- いかわ (2009-04-16 14:51:13)
- niiのサーバってsqlite使えるの?SQL文書くとエラーでます。 -- いかわ (2009-04-18 06:28:23)
- sqlite3で作ったsqliteはバージョンが対応していないようです。sqlite_openはsqlite2で作成されたdbのみらしい… -- いかわ (2009-04-18 09:47:30)
- 書こうと思ったら同じタイミングだったw ロゴとか仕事早い! -- さかまき (2009-04-18 09:54:12)
- ちなみに解決さく見つかるかな?pupsqliteでcsv出力したら意味ない気がするんだよね。 -- いかわ (2009-04-19 01:54:21)
- ちょっとググったらsqlite3_openとかって出てきたけど・・・あといっそphpを使わないとかw -- さかまき (2009-04-19 15:54:18)
- 工学部版シラバスDB明日にはできると思いまーす。 BeautifulSoupってホント便利やわー -- もりちか (2009-04-19 22:49:26)
- 工学部シラバスの「理解すべき事項」と全額DBのカラム対応について、決めかねてます、ちなみに。 -- もりちか (2009-04-19 22:51:17)
- 強引にくっつけるならoverviewとがいいかなって気がするけど・・・微妙なとこ。箇条書きが多そうだし。 -- さかまき (2009-04-19 23:48:08)
- 「キーワード」:今のところclassname,keywordはすべての単語をキーワードに、overview,scheduleは重要単語をキーワードにするという感じにしようと思ってます。どうでしょう? -- さかまき (2009-04-20 17:37:25)
- overviewからそれっぽい単語をとってくるモジュールはできました(精度は要検討)。 -- さかまき (2009-04-20 17:38:39)
- 工学部のやつもらいます!! -- いかわ (2009-04-21 03:41:21)
- DBを変更したときに同期させるのが大変そうだから、変更を加えたときには早めに連絡してね!してね!ってことで、今keywordテーブルを加えているので、同じ名前は使わないでくれると助かります。 -- さかまき (2009-04-21 12:02:38)
- 結局、sqlite使えないからcsvにして使ってます。 -- 井川 (2009-04-21 15:55:05)
- 今日、集まる日だったよね・・・夏風邪ひいてしまったよ。ごめんよ。。 -- いかわ (2009-04-21 15:55:43)
- 今更だけど、丹さんに頼んでSQlite3を使えるようにphpを拡張してもらったw使う人はdbを置くディレクトリのパーミッションに気をつけて。 -- いかわ (2009-04-22 11:01:06)
- 開講学科の検索部分で、科目の所属がいまいちわかりません。大学院っぽい授業はどこに入れればいいのかな? -- いかわ (2009-04-22 13:39:01)
- 本家はあほみたいに細かい分類になってたよね・・・あれは避けたい。大きいくくりで括って、階層構造にするのがいいと思う~ -- さかまき (2009-04-22 22:28:21)
- ほぼできたーでも唯一、曜日の判定の部分で")"、"]"の正規表現でつまづいています…というか、明日のpythonの発表全然準備してない。 -- いかわ。 (2009-04-23 00:10:18)
- 今使ってみたけど重くて動かないー。pyゼミがんばれ~。 -- さかまき (2009-04-23 00:15:29)
- 重い??w一応動くんだけどなー今、フリーワード検索で複数ワードをスペースで区切った時の検索はまだ対応してないや。 -- いかわ (2009-04-23 00:38:01)
- 俺のPCからだと検索結果が上手く表示されないよー。。pyゼミどころじゃないよねー実際。 -- もりちか (2009-04-23 13:03:18)
- CiNiiへの検索プログラムをアップしました。まだ改良の余地ありですが、途中報告までに。 -- もりちか (2009-04-24 16:30:40)
- 検索画面の右に書籍を表示しようと思ったんだけど -- いかわ (2009-04-25 02:41:06)
- amazonを表示するのに今までAWSが提供しているモジュール使ってて、pearディレクトリにインストールしなきゃいけないからまた丹さんに頼まないといけないかも… -- いかわ (2009-04-25 02:41:57)
- xslを使って出そうかなと思います -- いかわ (2009-04-25 03:30:13)
- DBキーワード抽出処理はとりあえず終了。教科書と参考書に移ります。 -- さかまき (2009-04-26 10:21:48)