通知

すべてクリア

[解決済] Web からデータを取り出す

最新の投稿

RSS

はる

(@はる)

ゲスト

結合: 22年前

投稿: 34

Topic starter 2003年12月21日 4:49 PM

Officeの機能にあるWeb からデータを取り出す事を
C#で実現したいのですが教えてください
ちなみにOfficeの操作をマクロに記録したものが以下になります

With ActiveSheet.QueryTables.Add(Connection:= _
URL; http://quote.yahoo.co.jp/q?s=1234&d=v1, Destination:=Range(A1))
.Name = q?s=9943&d=v1
.FieldNames = True
.RowNumbers = False
.FillAdjacentFormulas = False
.PreserveFormatting = True
.RefreshOnFileOpen = False
.BackgroundQuery = True
.RefreshStyle = xlInsertDeleteCells
.SavePassword = False
.SaveData = True
.AdjustColumnWidth = True
.RefreshPeriod = 0
.WebSelectionType = xlSpecifiedTables
.WebFormatting = xlWebFormattingNone
.WebTables = 11
.WebPreFormattedTextToColumns = True
.WebConsecutiveDelimitersAsOne = True
.WebSingleBlockTextImport = False
.WebDisableDateRecognition = False
.WebDisableRedirections = False
.Refresh BackgroundQuery:=False
End With
End Sub

引用未解決

トピックタグ

.NET C#

渋木宏明(ひどり)

(@渋木宏明(ひどり))

ゲスト

結合: 23年前

投稿: 196

2003年12月21日 6:33 PM

>Officeの機能にあるWeb からデータを取り出す事を
>C#で実現したいのですが教えてください

どんな形式のデータを、どのような状態で取り出したいのでしょう？

ごく単純に、与えられた URL から byte 配列や Stream としてデータを取得するだけな
ら、WebClient クラスでできます。

返信引用

はる

(@はる)

ゲスト

結合: 22年前

投稿: 34

Topic starter 2003年12月22日 12:06 AM

>ごく単純に、与えられた URL から byte 配列や Stream としてデータを取得するだけ
な
>ら、WebClient クラスでできます

ありがとうございます
早速サンプルを探し

byte[] myDatabuffer = myWebClient.DownloadData (uriSuffix);
string download = Encoding.ASCII.GetString(myDatabuffer);

などを使って、htmlソースやデータを得ることは成功しましたが
罫線に囲まれたデータの摘出がうまくいきません
なにかそれに役立ちそうなコマンドがあれば教えてください

返信引用

渋木宏明(ひどり)

(@渋木宏明(ひどり))

ゲスト

結合: 23年前

投稿: 196

2003年12月22日 4:16 PM

＞罫線に囲まれたデータの摘出がうまくいきません

「罫線に囲まれたデータ」とは、具体的にどんな形式なのでしょう？

返信引用

はる

(@はる)

ゲスト

結合: 22年前

投稿: 34

Topic starter 2003年12月24日 2:30 AM

>「罫線に囲まれたデータ」とは、具体的にどんな形式なのでしょう？

例えば下記のURLにあるような株価データです
http://quote.yahoo.co.jp/q?s=4689&d=v1

コード市場名称取引値前日比出来高関連情報
4689 東証1部ヤフー(株) 12/22 1,320,000 +10,000 +0.76% 3,021

こんな感じに摘出したいのですが・・
（カンマは邪魔ですが）

返信引用

suzuka

(@suzuka)

ゲスト

結合: 23年前

投稿: 46

2003年12月24日 4:30 PM

エンコードに ASCII を指定しているのが最初の問題点。
日本語ページなのに ASCII を指定していることが
おかしいことに気付いてください。

で、Yahoo! は通常 EUC コードなんで
「EUC-JP」を指定してやりましょう。

返信引用

渋木宏明(ひどり)

(@渋木宏明(ひどり))

ゲスト

結合: 23年前

投稿: 196

2003年12月24日 6:22 PM

まさか

>例えば下記のURLにあるような株価データです
> http://quote.yahoo.co.jp/q?s=4689&d=v1

のページにある「HTML 文書」から

>コード市場名称取引値前日比出来高関連情報
>4689 東証1部ヤフー(株) 12/22 1,320,000 +10,000 +0.76% 3,021

という「データ」を抽出したいんですか？

そら大変だ。

１個や２個の命令くらいでそんなこと出来たらプログラミングなんて作業はいらないっ
すねーｗ

考え付くところでは

・真面目に HTMLDOM を解析して目的のデータを抽出する
・対象のページの特性を探して文字列抽出する

なんて感じです。

返信引用

はる

(@はる)

ゲスト

結合: 22年前

投稿: 34

Topic starter 2003年12月25日 1:05 AM

＞１個や２個の命令くらいでそんなこと出来たらプログラミングなんて作業はいらない
っすねーｗ

耳が痛い・・・
やっぱりVBAで我慢するかな；

＞「EUC-JP」を指定してやりましょう。

ユニコードやUTF7, UTF8 を指定できますが
Encoding.EUC-JP.GetString(myDatabuffer);
とするとコンパイルエラーになります？

返信引用

渋木宏明(ひどり)

(@渋木宏明(ひどり))

ゲスト

結合: 23年前

投稿: 196

2003年12月25日 2:58 AM

＞やっぱりVBAで我慢するかな；

運用で困らないならそれも手です。

言語自体の設計思想が違うので、C# に VBA のような簡潔さを求めるの無意味です。

逆に、キメ細かな処理の記述や、精密なエラーハンドリングなどを VBA に求めても無駄
です。

データソースとなる Web ページの構造にかなり仮定を持ち込んでも、C# では、最初の
投稿に書かれた VBA より短いコードで記述するのは難しいです。

返信引用

suzuka

(@suzuka)

ゲスト

結合: 23年前

投稿: 46

2003年12月25日 3:02 PM

＞とするとコンパイルエラーになります？

なるでしょうねぇ。
そこで Encoding クラスの仕様について
調べるべきことに気付いてください。

それでも分からなければ
もう一度きいてください。

返信引用

はる

(@はる)

ゲスト

結合: 22年前

投稿: 34

Topic starter 2003年12月26日 1:07 AM

>そこで Encoding クラスの仕様について
>調べるべきことに気付いてください。

>それでも分からなければ
>もう一度きいてください。

期待を裏切るようで悪いですがさっぱりわかりません
自慢ではないですがサンプルソースも無くヘルプの仕様だけ読んで
理解できるレベルではありません
ＭＳの格調高い解説は私とは相性が悪いようです(^^)

返信引用

suzuka

(@suzuka)

ゲスト

結合: 23年前

投稿: 46

2003年12月26日 10:33 AM

相性が悪いで片づけてしまうのですか？

わたしも MS のドキュメントは慣れるまで苦労しましたが
今では普通に意味が分かるようになりました。
はじめから楽に読んでいた訳ではありません。

わたしは好意の回答者ではなく、
質問者が自力で階段を上るのを見てるのが好きなだけですから
本人にやる気がないと判断した場合は見捨てます。
そうなったときは他の人にあたってください。

本題。Encoding クラスで「概要」をみると
しっかりこんなのが書いてあるんですが。
＞GetEncoding メソッドは、他のエンコーディングを取得するために、
＞コードページまたは名前パラメータと共に使用します。

返信引用

はる

(@はる)

ゲスト

結合: 22年前

投稿: 34

Topic starter 2003年12月27日 2:55 AM

＞＞GetEncoding メソッドは、他のエンコーディングを取得するために、
＞＞コードページまたは名前パラメータと共に使用します。
やっとわかりました

＞質問者が自力で階段を上るのを見てるのが好きなだけですから
という事なので答えは伏せておきましょう(^^)
データの摘出はＨＴＭＬの文法の解読が必要ということで
ひとまずここで解決とさせていただきます
ありがとうございました

返信引用

渋木宏明(ひどり)

(@渋木宏明(ひどり))

ゲスト

結合: 23年前

投稿: 196

2003年12月27日 1:38 PM

>という事なので答えは伏せておきましょう(^^)

そういうのもどうかなぁ。

>データの摘出はＨＴＭＬの文法の解読が必要ということで
>ひとまずここで解決とさせていただきます

手が無いわけではないですが、Excel VBA のような短いコードで実現するのは無理で
す。

サーバサイドでの実行を考えていなければ、ブラウザコントロールを使うことで多少手
間を軽減させることができます。

返信引用