1read 100read
2012年09月プログラム115: <XML総合 part="3"/> (756)
TOP カテ一覧 スレ一覧 2ch元 削除依頼 ▼
【GUI】wxWidgets(旧wxWindows) その5【サイザー】 (496)
Excel VBA 質問スレ Part26 (717)
なぜポインタで引っかかる人が多いのか (796)
自然言語処理スレッド その3 (617)
C++11が動的言語よりも開発効率が良くなってる… (222)
Cygwin + MinGW + GCC 相談室 Part 6 (945)
<XML総合 part="3"/>
1 :2008/10/07 〜 最終レス :2012/10/20 XMLなんでもスレ。 前スレ: 【XML】xmlns, XSLT, RelaxNG, JAXP, etc.【総合】 http://pc11.2ch.net/test/read.cgi/tech/1133280488/ 前々スレ: 【必須?】XML技術【使ってる?】 http://pc8.2ch.net/test/read.cgi/tech/1090253584/
2 : 1乙
3 : スレタイに<>使えたのか
4 : なにこのスレタイ 好き
5 : <スレッド name="XML総合" part="3" /> の方が一般的じゃね?
6 : スレタイに入れるのは明らかに無駄だろw
7 : </XML総合>
8 : >>1000 でそれやったら美しいだろうな スレタイ空要素だけど
9 : 空要素w
10 : エレメントとノードってどう違うの?
11 : ノードは、ツリーとみなした場合の用語
12 : エレメントはxmlの用語。ノードはDOMの用語。 ruby厨でアンチxml厨はこういう基本も分かってないで批判するよな。 DOMの操作が複雑だとか用語が沢山あって分かりづらいとか、じゃあSAXでもStAXでも使えとry
13 : どっとねっとうとかだと両方あるんだけど
14 : >>10-13 ノードはXML文書の構成要素のこと。 ノードには、ドキュメント・テキスト・エレメント・アオリビュート・コメントなどの種類がある。
15 : ×アオリビュート ○アトリビュート
16 : XSDで、アトリビュートによってエレメントの内容を変えるってことできる? たとえば <person type="child"> <name>hogehoge</name> <age>20</age> </person> <person type="adult"> <name>hogehoge</name> <age>20</age> <income>300000</income> </person> みたいな。 personってのを変えないと無理?
17 : どうだろう。おれの拙い知識だと、出来ない気がするなあ。 <adult>と<child>が<person>を拡張する形式にするとか…
18 : >>17 ありがと
19 : 0x00 含む任意の文字列を XML に保存したい場合、どうすればいいんでしょうか? 他のコントロールコードは数値文字参照でいけたんですけど、これだけどうにも パーサーが受け付けてくれません。 http://www.w3.org/International/questions/qa-controls 確かに iilegal とされていますが、じゃぁどうすればいいのかがわかりませんでした。
20 : base64
21 : Binary XML
22 : そもそもそんなもん含めるのは想定されてない
23 : 時々出る質問だけど、PIでいいと思うよ。
24 : PIって使い道がよくわからん
25 : Cのpragmaみたいなもんだよ
26 : PIを直訳してみろ。そのまんまだ。
27 : >>20-23 ありがとうございます。 PI でいけそうな感じです。
28 : >>26 「R房」? こうですか?
29 : XMLやRDFあたりを勉強する必要が出てきたのですが,何かよい書はないですか?
30 : >>29 http://pc11.2ch.net/test/read.cgi/tech/1223368809/
31 : XMLを「勉強する」ってのがどういうことかっていうのは難題というか禅問答な気がする
32 : >>31 自分でXMLパーサ書けるようになることを目指すというのはどうだろう?
33 : ascii文字しか使ってないxmlを読むにはexpatでも無駄になっちゃうよね… LC_CTYPE=Cのgrep並の効率を持ったパーザは自作するしか無いのかな?
34 : XMLって一過性の流行でしょ?もう終わったんじゃないの?
35 : マークアップ言語としてのXMLは滅びないでしょ。 少なくとも今現在は代替テクノロジがないし。
36 : XMLというか、SOAPとかWS-*系のは何とかならないのかなぁと思う。 あと、フレームワークの設定で使われてる系とか。 必要性はわかるんだが、どうしても冗長過ぎるという感覚が拭えない。
37 : Protocol Bufferとか
38 : 通信系のXML(に限らないかもしれないけど)ってのは要するに、 「プロトコルは自分自身の則るコンテクストを相手に対して説明可能である必要がある」 って発想に基づいているかなぁ、と最近思うようになったんだけど、これは正しい? だとすると、Protocol BufferはXMLの代替にならないだろうな、という気はする。 伝統的なプロトコルは、回線の両端でコンテクストが一致していることを前提にしているけど、 XMLは、ネットワーク上に多様なコンテクストに則ったプロトコルが氾濫する状況に 対して有効に働く方式であると言える気がするんだけど、どうだろう。 とはいえ、冗長なことには違いないわけで、もう一つくらいブレークスルーはないのかという 期待というか懸念は依然としてある。
39 : <Keywords> <Keyword>あ</Keyword> <Keyword>い</Keyword> <Keyword>う</Keyword> </Keywords> みたいなXMLがあって、それをXSLで perlで書くと --- my @Keyword = qw( あ い う ); my $out = join(',', @Keyword); print $out, "\n"; ## 出力:あ,い,う --- と同じことがしたんだけど、Javascriptを使わないで出来ますか? 詳しい人方法をplz
40 : >>39 xsl:for-each と xsl:value-of で検索。
41 : XMLマスターのスレってある? いろんな板見たけど見つからなかったんだけど
42 : 探して見つからなかったならないと思うよ。
43 : 立てたら?
44 : >>42 なんかお前イライラする
45 : そうですね!
46 : yes we can.
47 : 楽天APIで出力されるXMLをPHP5で解析しようとしてるんだが、 $xml = new SimpleXMLElement($xmlstr); echo $xml->Body->itemRanking->Item[0]->title; こんな感じでデータ取り出せないのかな。 どうしてもうまくいかない。
48 : 出力されるXMLを見ないとなんとも言えん
49 : 基本的な質問 タグ内にテキスト(PCDATA)とタグを混在させるのはありらしいですが、 なんか気持ち悪いのです <title>テキスト1<keyword>テキスト2</keyword>テキスト3</title> ↑こういう書き方は普通にありなんでしょうか?
50 : 普通にあり。 title要素が、テキストノード、keyword要素、テキストノード、をchild nodes
51 : >>50 ありがとうございます テキスト1とテキスト2とテキスト3は意味的には1つの繋がった文章なのですが (要するにプログラム解釈としてkeyword要素を強調解釈させたい(文字装飾とかリンクのため) テキストの中にタグを入れるというと文章が分断されてしまう感じがしたもので 普通にありならば堂々と使っていきたいと思います
52 : HTMLとか見たことないのかい?
53 : XMLみたいな文法厳しいものの前にHTML理解してこいって感じだな(汗
54 : そもそもXMLはテキストをマークアップするための言語なわけだが…
55 : 51だけど HTML見たことないわけねーだろ DTDでいう<!ELEMENT tag1 (#PCDATA | tag2)*>って 気持ち悪くないのか? なんかXMLって扱いにくいね こういうとお前が馬鹿な(ryとか来そうだが
56 : PCDATAが気持ち悪いっていうことがもう爆笑なんだがwww お前終わってるだろ
57 : #PCDATAとtag2の混合が気持ち悪いって言ってんだろ ちなみに爆笑するお前も気持ち悪い
58 : もっと罵って欲しい
59 : 気持ち悪いとか爆笑とか、感性や感情を吐露されても 具体的なXMLとの関係はさっぱりわからん。 なぜ気持ち悪いのか、なぜ爆笑するのか、そこを掘り下げろよ。
60 : <dig>そこ掘れワンワン</dig>
61 : 参考になるかどうか分からないけど、かつてTed NelsonはHTMLでは 次のような記法が出来ないから嫌いだと言ったとか何とか。 HTML is <U>precisely <B>what</U> we were trying to PREVENT.</B> 最近のブラウザでは上記例も無理矢理表示するかも知れないけど、 HTML規格に合わせるなら未だに次の記法でないとダメだと思う。 HTML is <U>precisely <B>what</B></U><B> we were trying to PREVENT.</B> つまり、彼のクレームは「何故フォントスタイル指定は入れ子構造を 強制されるのか」と言うこと。 赤ボールペンと蛍光マーカーを使って文書に線を入れる作業をする 例を考えると、赤線や蛍光マークは入れ子など考えずに好きな場所 に入れて好きなようにオーバーラップ出来るよね。 (上の例で言えばpreciselyからwhatまでピーッと赤アンダーラインを 引いて、whatからPREVENTまで蛍光マーカーでなぞる) これと比べればHTMLやXMLの「要素の入れ子構造」はいささかか 不自然さを文書作成者に強制している、といえなくもない。 もちろんTed NelsonがHTMLに対して述べたクレームはこれだけじゃ ないし、彼の主張が全てと言うわけでもないけど、HTMLやXMLには 文書を表現する上では不自然さも持っている、完璧ではないという 意見も存在すると言うことで。 XMLを用いて修飾された文書からDOMを作ると確かに元の文書が ブツ切りのTextNodeとして出てくるので、個人的には>>51 のいう 「気持ち悪い」感覚は何となく理解できます。
62 : プログラマとそうでない人、両方の視点が必要というわけか 非プログラマからは文書を表現しにくいと言われ かといってプログラマからはJSONで十分じゃんと言われ ・・・でもそんなXMLが大好きです(AA略
63 : そういわれてみて気づいたが、俺は HTML は文章の一部をマークアップするためのもの、 XML はデータをツリー構造で表現するためのもの、 として捉えていたようだ。 文章の一部をマークアップするということが本来的に マークアップがきれいな入れ子構造を持つことを要請するわけじゃないよね。 そう考えるとたしかに言葉通りの「マークアップランゲージ」の仕様としては「要素の入れ子構造」は無理な部分もあるのかも。 そもそもなぜ「要素の入れ子構造」は要請されたのかね?
64 : 入れ子だとXMLパーサを作りやすいからだろう。 実装の手間とインタフェースの使いやすさのバランスを取った結果が こういう仕様になったんだと思う。
65 : なるほど、やはりプログラムでの処理からの要請か…。ありがとう。 たしかにプログラムで処理するためのマークアップだもんね。
66 : >>64 >入れ子だとXMLパーサを作りやすいからだろう。 つ SAX しかし今度はパーサを使うプログラマが苦労するという罠。
67 : > つ SAX ああその通り。失礼しました。 入れ子ならDOMパーサを作りやすい、なら問題ないかな。 > しかし今度はパーサを使うプログラマが苦労するという罠。 要素のオーバーラップしたXMLをSAXパーサに食わせて プログラマ側が構造化するとか、考えただけでクラクラする。
68 : 人間が直接パーサを作るなんてひどい拷問だ 自動生成させようよ 機械的に扱わせやすいための入れ子構造なんだし 処理そのものだけでなく処理をさせるものの生成にも構造が簡易なのが効いてくる
69 : 盛り上がってきたな
70 : SGMLパーサーの実装が不可能に近かったのでxmlを作りましたとさって経緯もあるからなぁ
71 : XSLTで、<xsl:template match="processing-instruction('xml')"> というテンプレートを見かけたんだけど、これってマッチすることあるの?
72 : >>71 PITargetは[Xx][Mm][Ll]という値をとり得ないから、 何らかのPIにマッチすることは決してない。
73 : XMLって何て読むんですか?
74 : シャマル
75 : 命題1:XMLはデータをツリー構造で表現するデータ形式である 命題2:XMLはあらゆるデータ構造の表現に用いられている 命題3:世の中に存在するデータ構造はツリー構造のみではない というわけで質問なんだけど、 1. XMLのデータ表現にツリー構造が採用されたのはなぜ? 2. XMLと相性の良い、あるいは悪いデータ構造って例えばどういうの?
76 : その命題の真偽は?
77 : まず、命題1は偽だな
78 : 安易に全称を使わないで欲しい
79 : 命題1と命題2のどちらかが偽だな 1. XMLのデータ表現にツリー構造が採用されたのはなぜ? 括弧の入れ子構造は自然にツリーになるから (() ((()) ()))) 2. XMLと相性の良い、あるいは悪いデータ構造って例えばどういうの? 相性が悪いのはグラフ(任意の矢印でつなげた構造) ------- +→| | | | +--|--+ +-----+ みたいな自分自身を指す構造とか。
80 : >>79 なるほど。 あと、それを見てふと思ったんだけど、ラムダ式ってXMLで表現できるんだろうか
81 : S式と1対1に対応できるから可能
82 : 何も悩まず <lambda arg="x"><lambda arg="y"> <add><value expr="x"/><value expr="y"/></add> </lambda></lambda> でいいじゃん。
83 : 大抵のデータ構造は二項関係の集合にバらして表現できるから 大概のデータはその気になればXMLで「書ける」はずです。 ただ本当にバラバラ事件になるので、機械可読だけど人間様は 読みたくないXML文書になることは請け合いです。 「相性」にも広い意味がありますが元のデータ構造をバらさない ままXMLの構造に対応づけることが出来るか、という意味では やはり相性の良いデータは「木」に見立てることが出来るもの に限られると思います。 ちなみに先日の下線とアンダーラインの例も次のように書けば 入れ子もオーバーラップも気にせずにXMLで表現できます。 <decoratedText> <text>HTML is precisely what we were trying to PREVENT.</text> <underline start="9" end="22"/> <bold start="19" end="48"/> ... </decoratedText> 確かTed NelsonのHyperTextにおけるHyperLinkの定義もこんな アプローチ(参照元と参照先の開始点と終了点)だったと記憶して います。ただ、手書きでは絶対に書きたくないな、これ。
84 : XSLTがチューリング完全だからそれで変換すればなんでもありじゃね?
85 : XSLTは "Sun, 28 ほにゃらら +0900(JST)" みたいな日付の書き方とかを始めとした 色んなデータ表現形式をサポートしてくれないとちょっと使いにくい。 JavaScriptでStringを引数としたString戻り値の関数を定義できる機能とかないのかね。
86 : 暇つぶしに論文漁ったらこんなのが。 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.108.9959&rep=rep1&type=pdf http://www.tei-c.org/release/doc/tei-p5-doc/en/html/NH.html Overlap(上記の下線と太線の例の様なケース)をどのようにSGMLや XMLで表現するか、「技」の事例が揃ってます。 いや、苦労しているなぁ、皆さん(笑)。 個人的には次のようなアプローチが一番面白かった。 HTML is <U_start/>precisely <B_start/>what<U_end/> we were trying to PREVENT.<B_end/>
87 : もはや要素の概念が・・・
88 : >>86 rtfとかこんなんだよね。
89 : 昔のワープロデータの保存形式は、こんなのが多かった気がする。 HTML is <U length="14"/>precisely <B length="25"/>what we were trying to PREVENT.
90 : >>88 RTFはHTMLと一緒だよ。
91 : >>38 でぼそぼそと書いたことの続きなんだけど、 XMLが冗長に感じる一番の理由って名前空間宣言と終了タグなのかな、 と>>89 とかを見て思った。 いや、XMLの趣旨から言って必須なのは分かってるんだけど、 XMLのバイナリ化みたいな話って、この辺をやってバイト数減らしたりしてるのかな。
92 : あと、>>79 について、完全に歴史の話だと思うけど、 > 括弧の入れ子構造は自然にツリーになるから というのは、XML仕様の作成者の意図は、「括弧の入れ子構造」を使った データフォーマットを作ることが先にあって、ツリーになったのは結果論という認識でいい?
93 : INIファイルをXMLファイルに変換する方法を教えてください
94 : >>93 ファイルの頭に <ini><![CDATA[ ファイルの尻に ]]></ini> とかく。
95 : 鬼才現る
96 : >>94 できなかったです+_+
97 : 【サンタクロース、トナカイの酒気帯び運用で逮捕。有罪判決に、マジ逆切れ&大暴れw(動画有り)】(ZDNet) http://builder.japan.zdnet.com/story_media/20384793/081204_sun-james-gosling_03_400x300.jpg http://builder.japan.zdnet.com/story_media/20384793/081204_sun-james-gosling_01_400x300.jpg http://builder.japan.zdnet.com/story_media/20384793/081204_sun-james-gosling_02_400x300.jpg
98 : hoge要素に対するhoe要素、hogehoge要素に対するhoehoe要素が 別のXML文書(hoe.xml)内にあるものとして、 そこへそれぞれにリンクを設定する必要がある時、 <root> <hoge xml:base="hoe.xml#xpointer(hoe[1])"> <hogehoge xlink:href="#xpointer(hoe[1]/hoehoe[1])" /> </hoge> </root> "hoe[1]"を2回書くの嫌なんですが、こう書かなきゃだめ? xml:baseはXPath部分は含んでくれない?
99 : 画像処理の実験データを記録するのに、勉強がてらxmlを使うことにしたのですが 例えば、目標位置を記録する場合の要素Targetがあったとして 例@ <Target num="0" x="315" y="292"> 例A <Target> <Num>0</Num> <X>315</X> <Y>292</Y> </Target> この二通りを考えたとき、どちらの書き方が『正しい』と言えるのでしょうか。 自分はどちらでもいいのではと思っており、例@を採用していたのですが、報告会で先輩から 「そういう属性だけの要素が存在してもいいの?」や「そういうのを書くとき、一般的な決まりごととか無いの?」などの 質問を受けました。考えたことも無かったので調べてはみたのですが これといった答えが見つからず、質問に参った次第です。 好みの問題なのでしょうか。それとも、何か決まりごとのようなものがあるのでしょうか。 参考になるwebサイトなどでも構いません。知っている方がおりましたら、どうかご教授ください。
100read 1read 1read 100read TOP カテ一覧 スレ一覧 2ch元 削除依頼 ▲
WindowsDDK各種についてのスレ (739)
Google App Engine for java (266)
Perlについての質問箱 56箱目 (707)
VB.NET質問スレ(Part39) (362)
JavaScriptは消滅すべきだったよな (447)
★★Java質問・相談スレッド157★★ (759)
--log9.info------------------
【UOエミュ】In Por Ylem 2【IPY】 (302)
魔法航路 【旧Florensia】 part1 (934)
【サービス】アッピー2 Appie part40【終了?】 (951)
次世代アクションMMORPG「黒い砂漠(仮)」 (231)
【outspark】Fiesta Online (488)
【無料UO】AKAKABETH Part13【元国内最大・斜陽】 (583)
キノスワールド 〜騎士納骨〜 (748)
Magic the Gathering - tactics やろうぜ! PART1 (840)
ディプスファンタジア puk10 (772)
Haven & Hearth QL13 (588)
PSOBBの思い出を語りつくすスレ (515)
スカッとゴルフパンヤ クラブ関連スレ38 (369)
FNO BOTオンライン -聖境伝説- Part88 (891)
【LH】ルーセントハート 孤独な奴が集まるスレ2 (609)
Wurm Online part9 (266)
小規模MMO板@雑談相談質問スレ8+自治 (247)
--log55.com------------------
NINTENDO・ニンテンドウ64総合 23
真・セガサターン総合スレ
【元祖】PS版テイルズオブデスティニー【至高の】
【PS】ラグナキュール総合6
トワイライトシンドローム 探索編・究明編 prat.6
オアシスロード
PS版 ディアブロ<DIABLO> Part4
【N:64】テュロック「時空戦士」