1read 100read
2011年11月1期27: 【ChainLP】自炊データ変換ソフト【PDFDiet】1冊目 (694) TOP カテ一覧 スレ一覧 2ch元 削除依頼

【ChainLP】自炊データ変換ソフト【PDFDiet】1冊目


1 :11/01/10 〜 最終レス :11/11/14
自炊したデータやテキストを変換し、電子書籍リーダで読みやすくデータを最適化するソフトのスレです。
・ChainLP
自炊データ変換界の大御所
http://no722.cocolog-nifty.com/blog/chainlp/
・PDFDiet
シンプルな余白削除、フォーマット変換なら。SonyReader との相性抜群?
http://smart-pda.net/software/PDFDiet/
■過去ログ
ChainLP
http://hato.2ch.net/test/read.cgi/ebooks/1286243094/

2 :
ChainLP スレが落ちてしまいましたので、立てておきました。
ChainLP 以外のソフトもいろいろありますので、自炊関連データ変換ソフトという事で情報交換しましょう。

3 :
以下テンプレ。他のものはたのんます。
ChainLP
http://hato.2ch.net/test/read.cgi/ebooks/1286243094/71
71 名前: [―{}@{}@{}-] 名無しさん@お腹いっぱい。[sage] 投稿日:2010/10/27(水) 08:03:19 ID:ygM6QOjH
>>70
小説ならmetiltran
マンガならchainlp
だいたいこんな分け方だろーね。
ChainLP
http://hato.2ch.net/test/read.cgi/ebooks/1286243094/5
5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2010/10/06(水) 09:01:34 ID:iLhA+D2B
ChainLPでフォント埋め込みPDFを作る方法
・PrimoPDFなどをインストールしておく。
・青空文庫ファイルを読み込む。
・ファイルメニューでテキスト印刷する。このとき、プリンタとしてPrimoPDFを選択する。
・PrimoPDFのダイアログが表示されるので名前をつけて保存。
テキスト印刷しかしない場合は、
編集メニューの、青空テキストのPDF方式で、
PDF仮想プリンタを選択しておくと、出力ボタンでテキスト印刷になる。
【ソニー】Sony Reader■06冊目【リーダー】
http://hato.2ch.net/test/read.cgi/ebooks/1293808117/30
30 名前:名無しさん@お腹いっぱい。[] 投稿日:2011/01/01(土) 22:11:35 ID:kJjYvLCt
>>29
小説の類は、PDFDietを使うと良いよ。jpegやpngも読みこんでくれる。
それで白黒(グレースケール)、太字1、ガンマ1.0、シャープ1で変換すれば
chainLPを使って電子書籍化するよりもずっと綺麗になる。
(個人的には漫画もPDFDietの方が綺麗だと思う)
残念ながら、PDFDietでは、画像サイズを変換した結果をjpegで残すことしか
できない。電子書籍作成ボタンで作ろうとするとうまくいかない。
(うまくいく方法があったら教えてほしい)
そこでグレースケールに変えたら、面倒でもchainLPを使って、PDFやLRFに変換する。
このとき、chainLPで余計な変形を加えたくないので、縦横比チェックのみを入れて、
他のページ補正、本文ボールド化、ガンマ補正(自動レベルも)、シャープネスのチェックは
外して出力する。
そうすると驚くほど綺麗な画像をReaderで観ることが出来る。
一度試してみて。分からないことがあればまたレスください。

4 :
>>1-3


5 :
関連スレ
【自炊】電子書籍ビューア 7【出来合い】
http://hibari.2ch.net/test/read.cgi/mobile/1276272563/
自炊技術総合2 @電子書籍板
http://hato.2ch.net/test/read.cgi/ebooks/1294476547/
【コミック】自炊技術総合スレッド36冊目【書籍】
http://kamome.2ch.net/test/read.cgi/download/1283990833/
【初めての】スキャン職人養成スレ 15【自炊】
http://kamome.2ch.net/test/read.cgi/download/1283990648/

6 :
>>1
もうってよし

7 :
>>6
どうした気に障ったか?

8 :
ChainLP v0.39-6から、挿絵の直前のページで
本文ボールド化が効かないことがある

9 :
そういえば、ChainLP の Kindle3 解像度 560x734 とかの数値ってどうやって分かったんだろう?
600x800 の画像を、作者が一つ一つピクセルを減らしてって最適値を見つけたのか。

10 :
>>9
SonyReaderの解像度もどうやって

11 :
>>9
スクリーンキャプチャという便利な機能がKindleにはある

12 :
>>11
おー。なるほど。
と思ってやってみた。
600x800 の真っ黒画像(JPG) を用意して、これを1ページだけの PDF と MOBI を作成。
Kindle3 で開いてスクリーンショットをとって、GIF の真っ黒部分を範囲選択してサイズを測ってみた。
PDF : 551x735
MOBI : 513x685
という結果に。
なんだか PDF のサイズが違うんだが、どこか間違えたかな?
一般的に言われてるのが 560x734 かと思うんだが。

13 :
tes

14 :
ChainLPって透明テキストを維持したままPDF変換できる?

15 :
>>14
むりぽ

16 :
>>14
iTextSharp.dll を使ったPDF直接出力てのがそれじゃない?

17 :
>>16
それは青空文庫をフォント埋め込みPDFで出力するためのもの。

18 :
やっぱりむりぽですか(´;ω;`)
なんとか作者殿には頑張って欲しい所ですねぇ

19 :
>>18
そんなんできるかっちゅうねん

20 :
kindleの最大表示領域の検証をしているページがあるんだけど、
kindle2は520x622、kindle3は520x693が推奨と書いてるんだけど、実際のところどうなんだろう。
http://www.kotono8.com/2010/11/06kindlepdf.html

21 :
検証してるところにもケチ付けたいならお前も検証すればいいんじゃよ

22 :
>>20
http://d.hatena.ne.jp/maky_Ba/20100507/1273242088
↑のやり方で、自分で試してみ

23 :
新しい PDFDiet すごいな。
余白圧縮を使うと、今まで手動でやってた余白削除が必要ないし、文書内の余白も縮めてくれる。
ChainLP で作ってたデータ PDFDiet で作り直すか悩むな。

24 :
そう?
なんか違いが体感できない。

25 :
pdfdiet使おうとしたんだが何故か読み込めない画像がある
chainlpなら普通にできるんだが・・・

26 :
直して欲しいならもっと詳しく情報提供したほうがいいよ。

27 :
PDFDietで近代デジタルライブラリーからダウンロードしたファイルを読み込もうとすると、
「このファイルはPDF直接読み取りに対応していません。
一度画像に変換してから読み込んでください。」
とエラーが出る。
で画像変換すると、たくさんの斜線が流れているだけの画像ファイルが生成されて、これもダメ。
なんででしょう?

28 :
よさげなソフトだが何故か縦1600だとエラー出ちゃうな

29 :
>>27
それは近代デジタルライブラリの内部形式が JPEG2000 なんだろうな。
近代デジタルライブラリの内部形式は JPEG2000 と CCITT G4 の二つの形式になってるみたいで、G4 のものなら読み込めるね。

30 :
ChainLPで、青空文庫を「PDF直接出力」にした場合、
ルーラが出力されないようなのですが、
これはこういうものなんでしょうか?

31 :
昔マイルーラってクスリあったよね。舐めると苦い奴。

32 :
Sony Readerスレから誘導されてきました。
ChainLP の PDF直接出力したファイルをReader350で読む時のお勧めフォントを教えてください。
今はMS明朝なんですがちょっと細くてReaderだと薄く感じる。
もう少し濃く感じるように太目のフォントを探しています。
(本文ボールド化では効果がないようです。)

33 :
>>32
こっちで答えるけど
青キン明朝とかDFパブリで良いんじゃない
デフォのフォントり読んでる感が増すよ

34 :
それから同じフォントでもPDF直接出力より仮想プリンタの方が少し太くなる気がする

35 :
>>32
即答ありがとう。
青キン明朝で幸せになれました。
まさに灯台下暗し

36 :
ところでChainLPの仮想プリンタの方が直接出力よりファイルが軽くなるのは何で?

37 :
あー自己解決。
フォント埋め込みするとファイルが重くなるんだな。
iTextSharpだとフォントが埋め込まれる。
仮想プリンタ(使ってるのはクセロ)で、埋め込み指定をしなければ軽くなる
ホームズの赤毛連盟105ページでで
直だと704KB
仮想プリンタで360KB
仮想プリンタでも青キン明朝を埋め込むと660KB
ファイルサイズが軽いのは魅力だけどMS明朝だとうすいんだよな〜
もう少しいじくってみるか

38 :
質問させて下さい。
アドビでキチンとトリミングして、いざChainLPに入力すると思いっきり右や左に余白が出るものが多発してしまいます。
規則性があるならまだしも、ちゃんと真ん中に収まっているものもあるので頭が痛いです。
上下は正しく削られています。
手順はS1500で取り込み→アドビアクロバット9で回転→トリミング→縮小→最適化→ChainLPです。
ChainLPの設定でどうにかなるのではと考えていますが、何をいじればよいのかさっぱりわかりません。
どうぞ宜しくお願いします。

39 :
>>38
トリミングをわざわざ2度手間にしてる理由がよくわからないけど、偏心補正入れとけばいいんじゃない?

40 :
>>38
左右の余白除去されたパーセンテージに基づいて、左右どちらかに寄せるのが偏心補正。
小説などでページが数行で終わっているものが、かっちりセンタリングされてしまって
違和感が生じるのを防ぐ働きをする。漫画の場合はノド方向に寄せる働きがある。
センタリングしたいなら、詳細設定で偏心補正を切る。

41 :
ChainLPでヘッダーに目次を表示できる?

42 :
できない

43 :
>>40
とりあえず偏心補正を切ったら全て真ん中に表示されてずいぶん見やすくなりました。
どうもありがとうです。
>>39
え?トリミングの2度手間ってどういう事なのでしょうか。
もしかしてもっとラクな方法、またはやり方を間違えているのでしょうか。
>>41
すみません。
勉強不足でよくわからないです。
目次設定ってトコでしょうか。

44 :
>>42
さんきゅ
>>43
すっちの話だ

45 :
>>27も言ってる近デジのJPEG2000形式のデータについて
よくわからんので教えてください
ページに表示される画像をそのまま右クリ保存→JPEG変換してみたんだけど
PDFdietに読み込ませようとしても
Incorrect number of channels for this conversion code
場所 OpenCvSharp.CvInvoke.<.cctor>b_0(CvStatus status, String
(以下うんたらかんたら)
というメッセージが出てしまう。
これってちゃんと変換できてないってこと?
ちなみにJPEG2000と判断したのは>>27と症状が同じだから

46 :
そうか、Pdfdietは画像認識ライブラリとしてOpenCVを使用しているのか。
確かOpenCVはJPEG2000をサポートしていなかったと思う。

47 :
>>46
>>確かOpenCVはJPEG2000をサポートしていなかったと思う。
そうみたいです。
で、変換ソフト通してJPEGにしたけどダメだった
トリミングソフトに突っ込んでみたら読み込める形のJPEGで
吐き出してくれたので、そっちでやることにした
知識ないから試行錯誤だわ

48 :
そういう試行錯誤はブログとかにまとめておくと喜ばれるかもね。

49 :
>>48
素人の日記にしちゃってごめんね

50 :
>>49
バージョンアップされたね。FAQ にも追加されてる。
ttp://smart-pda.net/software/PDFDiet/faq/#ac0c259c

51 :
>>50
ありがたい!早速試してみた!
…が、自分のは結局バージョンアップでもPDF直接扱えなくて
JPEGのPDFにしたら白黒反転、それを画像化してもやっぱり反転、
反転設定かけたらぼやけて判読不能で、とことんうまくいかない感じ
(反転ってそういうもの?)
JPEG2000のPDFをPRTGRAPHで直接画像化して
PDFdietに持っていったら反転しなかったので先に進めそうです
これにて名無しに戻ります

52 :
>>51
昨日バージョンアップされたのは、ダウンロード URL が間違ってたみたいよ。
落ちてきたのは前のバージョン。
今は新しいバージョンがダウンロードできるよ。

53 :
SONY Reader用に変換したのですが、どうしても文字が小さくて読みづらいです。
ハードカバーをScanSnapで取り込んで、余白自動削除でやりました。
ぎりぎりまで余白をなくしてReaderの画面目一杯に表示するにはどうしたら
いいでしょうか?

54 :
設定で文字大きくすればいいじゃない

55 :
虫メガネつかえばいいよ

56 :
どのソフト使ったかも書かずにこの子ったら。

57 :
>>53
リーダーの余白削除なんて効果薄。
元からやらないと。
アクロバットでギリギリまでトリミング。
自炊メインなら、もう文字の大きさ云々は諦めるしかないよ。
小さいのは350だからってオチでない事を祈る。
自炊活字、特に漫画は650じゃないと厳しいよ。
というか、漫画だと650でも小さいくらい。

58 :
ChainLPに要望です。
青空文庫のヘッダのタグに「全ページ数」を指定できるようにできないでしょうか。
「14/54」みたいな表示がしたいです。

59 :
>>53
1.ScanSnap S1500 「ファイン」で文庫本をスキャン
2.付属のAdobe Acrobatでjpeg書き出し
3.MeTilTran 「584×754、拡大率100%」で文字の再配置、再配置時ノンブルは非表示
4.ChainLPでirfまたはePub化
これで350使用時でも文庫本の文字の大きさは、オリジナル文庫本とほぼ同等か
ちょっと大きいくらい。余白はなくなるし、良いことずくめ。
MeTilTranでの読み込みの時はノンブル処理でエラー起こすことがあるので
グループ融合文字割合を初期値1.25から1.00にしたりする。

60 :
>53
ありがとうございました!!
完璧です。
すごく読みやすくなりました。

61 :
>>41です
ChainLPの中の人さらっと対応してくれたんですね。
感謝

62 :
早速ためしてみたけど、
PDFで出力後のファイルには目次のあったページしかヘッダー表示がされてないですね。
プレビューではちゃんと表示できてるのに・・・

63 :
chainlpはghost scriptをインストールする段階でエラー、
失敗。PDFdietはパラメータが違うとかいって読み込み
からつまづく。
もうACROBATを買った方がいいのかな。
いくつもソフト使い分けるのに疲れてきた。ぐったり…

64 :
ChainLPはGhostScriptなぞ使わんぞ?

65 :
ごめんなさい、逆か。色々なソフトを入れたからわけわからなくなった。
とりあえず一つエッセイの余白を消してキンドルで読めるようになった。pdfdietあは結局よくわからなかったなあ。
基本のchainlpで解決しました…お騒がせしました。
でもpdfからjpgにするには、相変わらずpdf dietが使えないわ

66 :
>>65
ScanSnap からの自炊PDFを画像にしてるけど、PDFDiet で問題は起きてないな。
どんな PDF を変換してるの?

67 :
自炊っていうか他炊?業者にやってもらったやつ。
PDFdietでは「直接読み取りに対応してないから画像に
変換して」と言われてしまう。
巷のフリーソフトでは対応していないバージョン
らしいのでいずれにしても一旦primoPDFでバージョンダウンして保存しなおしている。なかなか面倒w

68 :
jpgでzipになってるマンガは結局どーすればいいんだ?

69 :
どーすればって?何がしたいの?

70 :
Kindleなら無圧縮ZIP読めるだろ
他のリーダーは知らぬ

71 :
Kindleの無圧縮ZIPはあまり使い物にならないなあ。
しょっちゅう画像が欠けるし、ページサイズ大きいと開けないし、
ページジャンプ効かないし。オマケみたいなもんだ。
リサイズ性能はPDFと違って綺麗だけど。

72 :
ChainLPの中の人修正ありがとう。
今日をもってFoxit J-Readerを卒業します。
さらっと対応した上にしおりまで追加とは恐れ入りました

73 :
ChainLPでUTF-8のテキストファイルを変換すると、
タイトル先頭がズレるんだけど、これBOMが残ってるのかな?

74 :
オレ、文庫本とか横向きにスキャンして向きを修正で直してるんだけど
その修正の結果反映されないんだよな
奇数ページか偶数ページの向きを変更で、直す必要ある

75 :
カラーページとモノクロページを結合してると、そうなることが多いね。
解決策はiTextSharp.dllを入れて「iTextSharpで直接開く」に設定するか。
Acrobatで開いてから、別名で保存してみるといいよ。

76 :
何のソフトの話か書いて欲しいぜ。

77 :
>>75
ありがと、試してみる

78 :
ChainLPでテキスト中の改行だけの行は削除されるようになったんですか?

79 :
PDFの画質の劣化などは
具体的に数値で見るにはなんの値を見ればいいの?

80 :
>>78
「<>削除」が有効になってると空改行が無視されてしまうらしいね。

81 :
画質の劣化を数値で見る意味ある?
読むためのPDF化なのだから見て納得出来れば良いのでは?

82 :
>>80
あ、「<>削除」と「<img>使用」の位置が入れ替わってますね。
やってみます、ありがとうございました。

83 :
> 縦線はそのままだと気になるが、chainLPで簡単に消去できる。
【本】スキャンサービスについて語ろう
http://hibari.2ch.net/test/read.cgi/esite/1279337957/667
上記スレにこうあるのですが、chainLPでScanSnapなどの縦線を消す方法って
どうするんでしょうか?ご存じでしたらご教示ください。

84 :
そもそも縦線てなんだ?

85 :
>>84
紙を送るドキュメントスキャナ特有のノイズのことです。
http://blog.bibinko.com/archives/images-201011/scansnapnoise.jpg
センサーに小さいゴミが付着することで発生します。

86 :
>>85
霊が映ってる。

87 :
リサイズするから目立たなくなるとか、
ドロップしてないチャンネル使うとか、
その程度じゃないか?

88 :
縦線除去なら、たとえばこんなソフトもある。
http://rot-bmp.brothersoft.jp/
あんまり使いやすくないけど。

89 :
ChainLPで挿絵として認識された画像を、
強制的に本文に指定することは可能?
逆は出来るんだが。

90 :
カラーチェックしないようにすればいいんじゃない?

91 :
>>90
いや、自動カラーチェックは使ってない。
詳細設定で
【挿絵と判断されたページを「挿絵」として処理する】をチェックしてる。
判定精度が高いんで重宝してるが、たまに誤判定が出る。
で、挿絵として誤判定されたページを本文として設定したいんだが、
方法が分からないんだよ。

92 :
ないんじゃね?実行時の自動判定だろうから。

93 :
>>92
ファイル出力前のプレビューだと判定済み画像が出るんで、
そこで何とか設定出来れば、と思うんだが。

94 :
直接出力で目次が反映されるようになって便利になったね
出来れば改ページの後に目次を作ってくれると良いんだけど

95 :
>>91
左のリストから誤判定されたページの「絵」のチェックボックスを外す

96 :
BlastPNGって減色入れるとフルオート処理無理なの?
Yukariが起きて来るんだが

97 :
指定先間違ってた

98 :
ChainLP0.39b9で、ルビのサイズやら余白やらと絡んで
本文が目次扱いされることがあるんだが、
ここで詳しく書いていいもんか。

99 :
>>98
ここで聞かんでどこで聞く。
詳細設定-青空テキスト設定1-レイアウト処理の
目次変換のとこをいじってあげればいけそうな気もするが・・・
ちなみに俺は”見出しのみ”にしておいて
見出し[#”見出し”は見出し]
を使ってやってる。(テキストに元々見出しが付けられていることは少ないような…)
これにしてから誤認識はなくなったな

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼