1read 100read
2011年10月1期UNIX構造化テキスト TOP カテ一覧 スレ一覧 削除依頼
・ 次のスレ
【MRTG/rrdtool】 グラフィカルモニター化 Part3
SpamAssassin
みんなでorz コマンド作ろうぜ!
Internet Mail System 総合スレ 3


構造化テキスト


1 :05/08/24 〜 最終レス :11/12/13
構造化テキスト文書のフォーマットを調べたら山ほど出てきました。
正直一個一個比較調査は辛いので、これをこういう風に使っていて非常に良い等の情報がありましたら教えてください(ぺこり
Smart ASCII 系
--------------
setextについて
  http://www.age.ne.jp/x/sf/SETEXT/
reStructuredText
  http://docutils.sourceforge.net/rst.html
dW : XML : XMLの論考 reStructuredText
  http://www-6.ibm.com/jp/developerworks/xml/030411/j_x-matters24.html
plain2
  http://shika.aist-nara.ac.jp/products/plain2/plain2-j.html
RFC2233-JP
  http://rfc-jp.nic.ad.jp/rfc-jp/RFC2223-JP.txt
Daring Fireball: Markdown
  http://daringfireball.net/projects/markdown/

2 :
Grutatxt
  http://www.triptico.com/software/grutatxt.html
EtText: Documentation: Contents
  http://ettext.taint.org/doc/
  
Stx2any
  http://www.sange.fi/~atehwa/cgi-bin/piki.cgi/stx2any
Almost Free Text
  http://www.maplefish.com/todd/aft.html
AsciiDoc
  http://www.methods.co.nz/asciidoc/
Almost Plain Text
  http://www.xmlmind.com/aptconvert.html
atx, the true structured text format
  http://www.aaronsw.com/2002/atx/

3 :
SGML/XML 系
--------------
DocBook
  http://www.docbook.org/
SmartDoc
  http://www.asahi-net.or.jp/~dp8t-asm/java/tools/SmartDoc/index_ja.html
Simple Outline XML: SOX
  http://www.langdale.com.au/SOX/
明示マークアップ系
--------------
Scratch -- A Simple Text Formatting Processor
  http://scratchml.sourceforge.net/
Textism Tools Textile
  http://www.textism.com/tools/textile/

4 :
TeXはここに入れるの?

5 :
>教えてください(ぺこり

6 :
>>4
TeX(というかLaTeX?)は明示マークアップ系だと思いますが、
専用スレが存在しているので引き合いに出す程度が無難かなーと思います。
pdf 化の過程で LaTeX に一回落とす処理系は割と多そうなので、ほっといても関連しますので。

7 :
とりあえず単発だろ
参照サイトとかを提示すればいいってもんじゃないんだぞ
削除依頼だしてこいな

8 :
他力本願ならそれなりに踊ってみせろやといいたい
unix のゆの字もはいってねーしな

9 :
>>7
人が真面目に立てているのに取り合えずで片付けるのは失礼じゃないですか?
単発系のスレでこれだけのリンクをはって単発質問として発言した場合のことを少しでも想像して発言してますか?
脳髄反射な削除発言は自治じゃなくて自治厨だと思います。
>>8
踊れるなら初めから自分で(ry
で、板違いだというならどの板に立てればいいのでしょうか。
ソフトでもあるし、UNIX 由来のTeX, roff と一緒に語られることもあるし、Wiki や Blog の記法としてWeb系の板で語られることもあるし。
最終的にUNIX板にしたのはGoogleで各ツール名で検索したら Unix/Linux の2板が多かったからです。
何らかの妥当な根拠を持って他の板に誘導してください。

10 :
あれだ、ピロユキにたのんで「構造化板」作ってもらえば、ばっちり。

11 :
>>9
そういうのにいちいち反応してたらきりないですよ。
で。
Linux板にDocBookスレがあるけど、いまいち伸びてない。
他にメジャーは構造化テキストとなると TeX くらい?
HTMLは「構造」なのか、と言われると微妙だし。
という現状で、総合スレを普通に伸ばそうと思ったら、
1 の方向付けが鍵なのは確か。
専用スレのないフォーマット全般を扱うつもりなのか、
各フォーマットの比較みたいなことをやるのか。

12 :
Wiki記法とか、PODやらRDも立派な構造化テキストだろう。
個人的には、smart ascii 系がdiffしたり、cvsしたりするのに便利なので好き。
まぁ、unix板でいいんじゃないの。diffだのcvsだのgrepだのできて
喜ぶ連中がunix板以外にたくさんいるとは思えないし。

13 :
ここまでの半分は自演だな

14 :
そういうつまんねーこと言うなよ

15 :
Linux板に立てた方がまともに進行するかもな。残念な話だが。

16 :
テキストマークアップすんの、まんどくさ

17 :
>>6
了解
>>15
あっち見てないのでここの方が嬉しい

18 :
>>11
> 専用スレのないフォーマット全般を扱うつもりなのか、
> 各フォーマットの比較みたいなことをやるのか。
正直どっちもやりたい(^^;
そんなに盛り上がらないだろうから話題を制限してもね。。。
>>12
WORD 等の文書は素材として使おうとするとすげーめんどくさいです。
sed とか awk とか perl とかでプログラマブルに加工できるのはすんげー魅力的です。
>>16
同意です。
明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
人にはやさしくありません。。。

19 :
>>18
> 明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
> 人にはやさしくありません。。。
確かに。
そこでWikiのような簡易記法が出てくるんだろうね。

20 :
Texi はここには入らんの?

21 :
Wiki のような smart ascii 系も、明示的なマークアップでしょ
読み手としては HTML/XML 系より読みやすいけど、書き手としては至極面倒。
なにより覚えにくい
入りやすさという意味では、HTMLみたいに特殊記号使う方がいいだろうね
マークアップしてるかしてないかが明確

22 :
>>20
Texinfoなら一応構造化テキストに入ると思うけど。
ネタが無いスレなのでいいんじゃない?

23 :
>>21
wikiはたしかに方言が多く統一感も無くて混乱するし、HTTPの制限からUIがダメダメで
書きにくいと感じていたけど、howmとかを使い込んで考えがかわったよ。
ていうか、マークアップしてるかしてないか明確なものがhtml/xml/texで、
その点に注目して明示的マークアップ系とsmart ascii系を分類したのじゃないのか。
smart asciiが明示的マークアップと一緒と思うのはどういう点で同一と感じるのさ?

24 :
>>23
変換後にどうマークアップされるかを思い浮かべると同じだと感じる。

25 :
>>24
変換するなら変換後のフォーマットの話であって、それは変換前の
フォーマットとは関係ないだろ?

26 :
>>24
一般的にはそうだね。>>23の前半でwikiの話をしていたので、>>24ではそれが
念頭にあった。wikiはHTMLにしかしないから。そう断っておくべきでした。

27 :
構文でマークアップするかタグでマークアップするかでしょ。
そんなに違いはないように感じる。

28 :
Smart Ascii系と明示マークアップ系だと、書く量と文書の表現力がだいぶ違わないか?
構文にオプションや属性を指定する節なんかを定義する事はできるだろうが、
Smart Ascii系でそういうのってあんまり使われてないよねぇ?

29 :
=head1 POD
perlのB<POD>はどうよ。
=head2 書き易さ
Wikiと同じくらい。覚え易さもWikiと同じくらい。
=head2 汎用性
man、html、texinfo、TeXなんかに変換するのは楽だけど
YAMLのような汎用性は無い。
=cut

30 :
YAML最高!!

31 :
テキストファイルとしてメモ帳クラスのアプリでも編集することを前提とした
構造化テキストのフォーマットとしては、Wikiスタイルが今のとこベスト?

32 :
あー、構造化テキストとは言わないな・・・
すまん忘れてくれ

33 :
smartdoc 派なオレがきましたよっと。
ttp://www.xmlsmartdoc.org/
メリット
. xml なので、多い日も安心
. 数式を書くのが楽(TeX互換)
. 日本語OK
. tex, html, plain text変換
デメリット
. xmlなので、そのままでは読みにくいかも
. xmlなので、タグ書き面倒(HTMLと大差ないレベル)
. 便利に使い込もうと思うと、java, make(or ant) などの知識必須
. 凝ったPDFを出力しようと思ったら、それなりにTeXの知識がいる
TeXに慣れてるひと(書き貯めたスタイルファイルを無駄にしたくないとか、
数式はTeXじゃなきゃ書けないとか)が将来の文書ハンドリングの利便性に
不安を感じたときにオススメ

34 :
SmartDoc は一時期使ってみたけど、いまいちだった
・閉じタグ必須で入力がHTMLの倍は面倒
・表現力が低い。パラグラフと箇条書きだけの文書なら使えるかもしれない
・一個の記述が複数のHTML記述に対応するとかの便利さもない
・図のサポートがいまいち。
やっぱり、はじめからLaTeXで書いた方が綺麗だし何より早いと思う
ま−でも、こういう自分言語って作る方は楽しいんだろうね

35 :
同じくsmartdoc派な俺も来ましたよ。
いままで書く所無かったんだよ。
俺の感想はだいたい>>33-34と似たようなものだな。
 ・レイアウトを凝る必要が無い。
 ・テキストが多い。
というのに向いてそう。

36 :
思うに、タグ型のフォーマットは、それなりのオーサリングツールに
支援して貰うのが前提な希ガス。

37 :
smartdoc 程度ならエディタ補完とxmlタグ閉じプラグインで十分な希モス

38 :
つmgp

39 :
オッサンリングツール

40 :
Docutils
ttp://docutils.sourceforge.net/
Purpose
The purpose of the Docutils project is to create a set of tools for
processing plaintext documentation into useful formats, such as
HTML, XML, and LaTeX. Support for the following sources has been implemented:
だそうな。
lighttpdのページを見てて発見した。
reStructuredText の機能を含むが、wiki markupやらRFC822な
メールファイルにも対応してるそうだ。
Pythonなのが俺的に微妙だけど、ちょっくら試してみる。

41 :
>>33
俺は最初からSmarDocファイルで文書のレイアウトをするのはあきらめてるから。
細かいレイアウトをしたい時は生成されたLaTeXファイルを直接編集してdiffをとっとく。
sdoc文書を編集した時も、たいていはpatchで何とかなる。
...という一連の作業をMakefileで自動化しているので、なかなか快適で離れられない。
まぁデメリットに関しては >>33 の言う通りかと思う。とくにインライン数式が面倒すぎ。
ともかく、sdocにあまり文書のレイアウト情報は入れない方が精神的にも楽。

42 :
ttp://www.pault.com/pault/pxml/xmlalternatives.html
まだ既出でない SmartASCII がごろごろしているのね(^^;

43 :
保守

44 :
表現力は低くても、テキストファイルとして自然に読み下せる記法が欲しいな。
Wiki のフォーマットだと、「変換前のファイル」という風味が強すぎるんで。

45 :
じゃあ、plain2が最強

46 :
Markdown が良さそうだけどね。
後はRDとか。
・・・どっちもテーブルサポートがない奴だな(w

47 :
じゃあ、plain2が最強

48 :
>>47
わかりやすい解説サイトを教えれ

49 :
解説すら要らねーだろ

50 :
保守

51 :
結局メジャーどころのマークアップ言語が一通り挙がったところで終わったな。このスレ。
こんなの情報整理スレでやってりゃ良かったんだよ。

52 :
>>51
後出しじゃんけん。

53 :
結局 >>7 ってことだな。

54 :
昔akr先生が「構造化文書の記法」なる文書を書いていたのだが、いつのまにか
なくなってしまったので参照先はWayback Machine。
http://web.archive.org/web/20041011165213/http://cvs.m17n.org/~akr/markup

55 :
ttp://www.pault.com/pault/pxml/xmlalternatives.html
ますます、増えてないか。。。
マークアップのデファクトは DocBook な気がするけど、Smart ASCII のデファクトは決まらないのかなあ。。。

56 :
 

57 :
 

58 :
OASIS Darwin Information Typing Architecture (DITA) ってどう?

59 :
新しいのつくったぜ
ttp://www.fiercewinds.net/siki/cgi/?Node=SikiFormat

60 :
>>59
正直微妙(w
あまりにも記号的すぎて自然な感が弱い。

61 :
コメントサンクス
>自然な感が弱い。
自然な感じだと、reStructuredText使うのが素直でしょうね……アレには敵わん。
ただ、あれだと後戻りが多くてパースするのが大変な気がするけど……どうなのかね?

62 :
保守

63 :
asciidoc が cygwin に入りますた.

64 :
保守

65 :
軽量ワープロとしてWYSIWYGで編集できるWindows用のツールなんてありませんか?

66 :
ttp://en.wikipedia.org/wiki/Lightweight_markup_language
Lightweight Markup Language という名称は定着するのかな

67 :
こんなスレあったのね…
お手軽メモ書きに使って
打ち合わせ資料とかでそれっぽく変換できる
日本語をそれなりに扱える
いまのところ python 関連ということもあって
reStructuredText (docutils)使おうと思ってるんですけど
最近イケてるのって何かあるんですかね?
reST のさらに wrapper で kagipdf なるものも発見
(↑とりあえず日本語文書を扱うための wrapper みたいなもん?)

68 :
>>65
ワードパッド

69 :
>>68
構造化テキストで!><
欲を言うならWinとLinuxでファイルを相互更新できたらいいな

70 :
http://pc11.2ch.net/test/read.cgi/mac/1188048483/

71 :
そのスレ、内容はともかくグロ画像貼ってあんのはヒドイ
これだからマクド使いは、、、
で、現状最有力は結局XMLなの?
早くデファクトスタンダードが決まって欲しい

72 :
今更ながら Smart ASCII 系に「xetext」も。
setext-j を微拡張した感じ。とん挫した残骸みたいだけど
ttp://www.piedey.co.jp/xetext/
(ページの一番下です)

73 :
火病か

74 :
reStructuredText で用語集を作ろうと思ったんだけど、
自動的に<dt>にアンカーをつける方法ってないのかな。
↓こんな風に書けば望み通りの出力が得られるんだけど、
定義名とアンカーで2回exampleを書くのがいやだ…
example_ は例です。
.. _example:
example
  説明

75 :
2回書かなかったらどうやって照合するの?

76 :
これだけでリンクが張られてくれるとベスト。
example_ は例です。
example
  説明

77 :
reStructuredTextは、出力弄るのがちょっと面倒だよな。
xmlで出して変換しろって言うけど、そっちもやっぱり面倒で。

78 :
wiki フォーマットで書いて、ツールで見やすい形式のテキストに
変換するのが良いんじゃないかと思えて来た。何と言っても wiki
フォーマットは書く為のフォーマットであるというのがグッド。
XML みたいに入力量が増えたりしないし、そのくせ適度に構造化
されているし、インデントが適当でも後で幾らでも整形出来るし、
HTML に変換するのも容易いし、勿論 wiki にもアップ出来る。
特殊なエディタのサポートを必要としないと言うのも良いね。
後は wiki->txt のツールをちょちょっとでっち上げれば完了。
問題があるとすれば、どの wiki フォーマットを使うかかな。

79 :
お好きなのドゾー
1. reStructuredText
2. plain2
3. 自分で作る
おいらは自作したけどね。RubyでもreStructuredText使えればなぁ。

80 :
ruby でもっていうか
docutils をsystem()みたく呼べばいいだけってことではないの?

81 :
さすがにめんどかった。
それに文脈自由文法にも興味あったんで、勉強がてら俺構造化テキストを設計してみました。
まあ、RDがあまりにもアレ過ぎるっつうのもあったんだけどね。
- 見出しの中で最大見出しが一番目立たない記法ってのはおかしいだろ。
- 整形ずみ文書を字下げで表現するのはいかがなものか。エディタの支援必須になっちゃうよね。
- ((●●●))というのが多過ぎ。「見た目の装飾」と「リンク」ぐらいは分けた方が良かったと思う。
とか。

82 :
そういえば昔まとめた解説を発掘したんだけど、文法についてコメント頂けますか?
・ここをこうすればLL(1)になるんじゃね?
・これだとこういう組合せで破綻するよ
とか教えて貰えると助かります。
ttp://fiercewinds.net/siki/pub/Siki/SikiFormat/

83 :
>>82
> 記述や修正に手間のかかることが多いです
俺も RST の問題はここだと思う。
Wiki 書法よりも読み易さを重視した結果だろうけど。

84 :
RST って ReST (reStructuredText) のこと?

85 :
いや、RST は reStructuredText の事だよ
RST --> http://docutils.sourceforge.net/rst.html (reStructuredText)
REST --> http://ja.wikipedia.org/wiki/REST (Representational State Transfer)

86 :
>>85
拡張子は3文字信仰が多いから rst だけど、普通 reStructuredText を RST とは言わない.
ReST、reSTなどで大文字小文字で判別する.

87 :
>>86
そんな事どうでも良くない?
もしかして何でも決めつけたがりの人?
普通っていうほど普及してるもんでもないし、拡張子の話は誰もしていないし、
公式の URL は rst.html だし、ついでに言えばディレクトリも rst になっているし、
reStructuredText の仕様書中の例題も RST という略号を使用しているし、
Wikipedia でも一番最初に RST と書いてある。だから普通なのはむしろ RST
なんだと思うけど、君が ReST や reST と書いても俺は何の文句も言わないよ。
だって、こんな些細な事、普通はどうでも良いからね。
http://docutils.sourceforge.net/docs/ref/rst/restructuredtext.html
> |RST|_ is a little annoying to type over and over, especially
> when writing about |RST| itself, and spelling out the
> bicapitalized word |RST| every time isn't really necessary for
> |RST| source readability.
>
> .. |RST| replace:: reStructuredText
> .. _RST: http://docutils.sourceforge.net/rst.html
http://ja.wikipedia.org/wiki/ReStructuredText
> reStructuredText は RST、reST、ReST と略されることもある。
それよりももっと意味のある話をしようぜ。

88 :
どうせ2chなんだから、疑似問題が発生しない程度に判りゃ良いよ。
もともと日本語って読み手・聞き手が文脈から意味を補足するのを前提にしている言語だし。
#述語中心の構成とか
そんなことよりも>82の評価 or もっと優れた構造テキストとの比較ヨロ

89 :
>87=85 が 「4文字で書くな」と決めつけたのが
発端なのに真っ赤になって書くから…
というのはさておき
------
所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので
その辺りはあまり拘っても仕方ない気がする
ReST ってガンガン書いて自分なりのルールが決まればいいんだろうけど
第何番目のレベルはどの記号だったっけ? とかがビミョ〜に面倒
(第 n.m.k 節 って書き方を auto-numbering 出来ればちょっと楽かもしれない)
あとリストの入れ子について、インデントレベルを気にして書くのも
チョイ面倒だったかな(やり方を勘違いしているのかもしれないが)

90 :
>>89
>「4文字で書くな」と決めつけたのが発端
(・∀・)ニヤニヤ

91 :
>>85 を見れば明らかに決め付けたがりの人がどっちかは明らかだよな
yes といえばいいだけのところでわざわざ RST じゃなきゃと言わんがばかりに主張してるんだから

92 :
ついでに Google の結果
reStructuredText rest の検索結果 約 98,300 件中 1 - 10 件目 (0.22 秒)
reStructuredText rst の検索結果 約 74,400 件中 1 - 10 件目 (0.27 秒)
reST が当たり前だというほどではないけど、rst の方が少数派なのは確かっぽい

93 :
おまいら省略形禁止。reStructuredTextて書け。
>所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので
reStructuredTextは目立っていると思うよ。
#とか$とかの字面の黒い文字使ってさらに強調する手もあるけど、あれで十分じゃない?
ただ、指摘の通りアシストツールがないと結局書けなくなるよな。
参考書片手でもいいけど、そうなるとお手軽さが無くなるし……
そういや全然別の話だけど、reStructuredTextて文脈自由文法に納まっていたっけ?

94 :
>>91-92
> 明らかに決め付けたがりの人がどっちかは明らか
そんなに真っ赤になって書かなくても良いよ
もう諦めたら?

95 :
>>92
ついでに rest は使用頻度の高い一般名詞でもある
Google の検索結果を鵜呑みにせず、そういう所にも気を使おう

96 :
過疎ってるなー
reStructuredTextのラッパ(?)でsphinxというのが出てきたそうな。
http://sphinx.pocoo.org/
python2.6のドキュメント↓もsphinxを使ってるんだと。
http://docs.python.org/dev/
reStructuredTextからのpdf生成がもっと簡単に(latexに頼らずに)
できるようになったら、自分で文書書くときはwordと決別できそう
なんだけど…

97 :
> pdf生成がもっと簡単に
それは同意
微妙に面倒なんだよねぇ。日本語っていうのもあるけど。
http://hooktail.org/computer/index.php?kagiPDF
http://sourceforge.jp/projects/kagipdf/
というラッパもあるんだけどこれで解決するのかしら?

98 :
reStructuredTextよりもasciidocの方が良い気がしてきたぞ…
最初から数式が使えるし、次のバージョンでは
要求仕様/設計結果対照表みたいな左右に並べるテーブルを
簡単に記述できるようになるみたいだし。
どっちもpythonで書かれているし、いっそのこと統合して欲しいもんじゃ。

99 :
asciidocってreStructuredTextなんだと思ってた・・・

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 削除依頼
・ 次のスレ
【MRTG/rrdtool】 グラフィカルモニター化 Part3
SpamAssassin
みんなでorz コマンド作ろうぜ!
Internet Mail System 総合スレ 3