Excel VBA質問箱 IV

当質問箱は、有志のボランティア精神のおかげで成り立っています。
問題が解決したら、必ずお礼をしましょうね。
本サイトの基本方針をまとめました。こちら をご一読ください。

投稿種別の選択が必要です。ご注意ください。
迷惑投稿防止のため、URLの入力を制限しています。ご了承ください。


3 / 13339 ツリー ←次へ | 前へ→

【81068】HTMLソースの取得について Satsuki 19/8/5(月) 23:54 質問[未読]
【81069】Re:HTMLソースの取得について γ 19/8/7(水) 21:03 発言[未読]
【81070】Re:HTMLソースの取得について Satsuki 19/8/8(木) 8:32 お礼[未読]

【81068】HTMLソースの取得について
質問  Satsuki  - 19/8/5(月) 23:54 -

引用なし
パスワード
   Satsukiと申します。
いつもいろいろ教えて頂き、ありがとうございます。

今回、ローカルに保存したHTMLファイルからソースを取得し、分析するという作業を行っています。
いろいろ調べて、responseTextで取得したテキストファイルをHTMLdocumentオブジェクトにいれる方法やcreateDocumentFromUrlでオブジェクトを作成する方法などを試しました。
そのdocumentオブジェクトのテーブルの数をカウントするコードを書いて実行したところ、実際のURLを開いてソースの中を見た場合と、個数が異なっていました。
<table id〜・・・となっているテーブルがモジュール側ではカウントされていません。javascriptの中にあるわけでもないようです。
調べていくうちに、このtable idは各ページに共通する部分のためではないかと考えるようになりました。
実際、responseTextで取得したテキストそのものでは、table idの記載がありますが、documentオブジェクトに入れてしまうとspanになってしまっています。
この場合テキストファイルで処理するしかないのでしょうか?
どなたかご教示のほど、よろしくお願い致します。

【81069】Re:HTMLソースの取得について
発言  γ  - 19/8/7(水) 21:03 -

引用なし
パスワード
   コメントがつきませんね。
>responseTextで取得したテキストそのものでは、table idの記載がありますが
とあります。
テキストを分析した結果の<table の数が正しいんですか?
でしたら、なぜ
>テキストファイルで処理するしかないのでしょうか?
という質問になるのでしょうか。
どういう観点で手法の選択をしようとしているのでしょうか。

正直に申し上げると、
urlの提示がないので、
他人の夢の話を聞かされているようです。
ああ、そうですか、という感想しかありません。
こちらで確認する術もないですしねえ。
urlの提示は無理なんでしょうか。

【81070】Re:HTMLソースの取得について
お礼  Satsuki  - 19/8/8(木) 8:32 -

引用なし
パスワード
   γ さん
コメントありがとうございます。

>コメントがつきませんね。
VBAでHTMLを扱うというのはあまり一般的ではないからと思っていましたが、
質問の仕方も言葉足らずだったようで、申し訳ありません。

>>responseTextで取得したテキストそのものでは、table idの記載がありますが
>とあります。
>テキストを分析した結果の<table の数が正しいんですか?
HTMLのソースを取得するいくつかの方法の中で、URLを表示してからresponseTextを受け取るとtableの数は正しいです。

>でしたら、なぜ
>>テキストファイルで処理するしかないのでしょうか?
>という質問になるのでしょうか。
>どういう観点で手法の選択をしようとしているのでしょうか。
URLを表示してからソースを取得すると時間がかかります。
大量のページを処理するため、ページを開かずにobjectとしてソースを取得する方法に切り替えたのです。それによってHTMLの解析もしやすくなりました。

>urlの提示は無理なんでしょうか。
申し訳ありません。業務上の問題で提示は難しいです。
ただ、HTMLに詳しい人に聞いたところ、取得できないtableは、
すべてのページに表示される共通の部分のため、
動的にそのページに組み入れられているのので、
ページを表示しないとソースにでてこないのではないかとのことでした。

コメントのつかない中、お気遣いいただきありがとうございました。

3 / 13339 ツリー ←次へ | 前へ→
ページ:  ┃  記事番号:
2610219
(SS)C-BOARD v3.8 is Free