2012年09月ビジネスsoft31: OCRを使ってますか? (925) TOP カテ一覧 スレ一覧 2ch元 削除依頼
個人用EXCEL活用法 (588)
軽い表計算ソフト (238)
ロータス123 (534)
Outlook総合相談所 Part11 (469)
Word(ワード)総合相談所 Part21 (532)
Word(ワード)総合相談所 Part21 (532)

OCRを使ってますか?


1 :2006/03/04 〜 最終レス :2012/10/24
小売業の事務やってますが、値引照合のマスター作成で重宝してます。
取引先が全部CSVでリストをくれれば、それほど必要はないのですが。
ソフト毎の認識率や珍読取を語ってくだされば。

2 :
【ADF】スキャナで連続取り込み008.jpg【OCR】 http://pc8.2ch.net/test/read.cgi/printer/1134740588/l50

3 :
OCR一般スレはすぐ落ちるのねorz

4 :
新聞や雑誌の記事を保存しておきたいときにOCRかけます。
スキャン画像も一応PDFで置いておくのですが、
気に入った記事は全部テキストとHTMLにしています。
使ってるソフトはe.Typist v9.0。
PDFを扱えるところが気に入ってます。
識字率はちょっと不満があるけれど、一括置換とかうまく使えば
まあまあいい感じに使えますね。
レイアウトの再現などの機能は私には必要ありません。
富士通のScanSnapで本をまるごと取り込んで
PDFをページごとに分割して、ぼちぼちと好きな本をテキストにして
ためていくのが私の趣味です。
namazuで全文検索かけられるようにして、ひとりで喜んでいます。

5 :
htmlだとレイアウトが崩れてしまうので
私は透明PDFで管理してます

6 :
安いのってやっぱ使い物にならん?
値段がピンきりで幅広いな。

7 :
体験版つかってみれ
ソースによって相性がかなりあるから
自分でやってみないと意味ない

8 :
数年前にいくつか買ってみたんだけど、
松下のは「国」を「玉」と認識する
AISoftのは認識率がいまいちな感じ
使ってみた感じでは e.Typist が一番認識率良かったよ

9 :
読んでここは細かい字の認識が確か全滅な感じだった
体験版とかあると思うから試してみた方がいいと思う

10 :
AiSoftはエクセルのプリントアウト、滲み、罫線くっつきなしみたいな条件のいい素材でも
碌に認識してくれなかったよ。
カンマを「ー」と誤認識してばかりなのは参った。
手打ちのほうが余程早いさ。

11 :
文字のサイズによる影響もかなりある。
メーカーがテストに使ったでかい文字サイズなら認識率がいいのかもしれない。
でも、実際、書籍や新聞の文字サイズはそれよりもかなり小さい。
公表認識率はあまり信用しない方がいいと思う。

12 :
学習させていくと
けっこうまともになるよ

13 :
>>12
e.Typistだと一つの置換リストに100個まで登録できる。
これがあれば、変な認識のクセをかなりカバーできるよ。
置換リストは複数作成できるので、新聞や雑誌など
対象ごとにリストを作れば、かなり変換精度が上がる。
e.Typistはバージョンアップごとに置換リストの登録数が
増えてくれたのが良いところだけど、どうせなら
登録数を無制限にしてほしかった。
あと、e.Typistはバージョンアップの後に
今まで普通に変換できた文字が誤変換されてたり
使い勝手のクセが微妙に変わったりする。
今のバージョンのクセが自分の体に覚えさせて
もう二度とバージョンアップしないつもり。
文字認識の基本性能には特に不満がないけれど、
細かい使い勝手はある程度妥協するしかないかな。

14 :
smartOCR使ってる人はいますか?

15 :
>>14
smartOCRLiteなら使ってる
タダだから...w

16 :
>>14
エディタを横書きにしてるとバグるのがなければいいのに

17 :
>>16
あと糞重い
それでも他ソフトよりは軽いから使うけど・・・

18 :
プロつかってるけど精度よくすると時間が3倍くらい時間かかるのもつらい
だからといって低くすると使い物にならんしどうしろと

19 :
PDFをOCRしたいとおもってフリーのソフト探してみたが
TWAINまたは画像入力ばっかりだった
仮想プリンタみたいな仮想TWAINってどっかに無い?

20 :
こんな過疎スレにもアフォはくるんだな

21 :
>>18
マルチディスプレイだと表示がバグるのはなおってる?
なおってるなら買おうかなとおもってるんだけど・・・

22 :
>>21
なおってない
バグ報告汁

23 :
SmartOCR 1.0 Lite Edition 更新履歴
2006 年 3 月 17 日 Version 1.0.7
認識結果をクリップボードにコピーする際に落ちる場合があったので、修正しました。
エディタウインドウでのコピー及びペーストで、改行の処理に不備があったので、修正しました。
エディタの再現モードで、1 行しかないセルの次のセルの先頭文字の表示がおかしかったので修正しました。
文字種指定で「カスタム」を指定した際、指定が間違っていたので修正しました。
「画像編集領域指定」時に、指定領域内の右クリックメニューに「この領域を背景色で塗りつぶす」、「現在のカーソル位置の画像の色を背景色に設定」、「背景色を指定」を追加しました。
ファイルブラウザの保存種別選択メニューに「結果保存設定」を追加しました。
ファイルブラウザのリストの右クリックメニューに「リストから削除する」追加しました。
複数文字選択時の候補メニューに「検索」を追加しました。
エディタの検索と置換で、ダイアログを開くたびに検索文字列を取得しなおすよう変更しました。
「検索と置換」ダイアログの、検索文字列の入力欄に履歴を追加しました。
エディタで Shift + カーソルキーで選択を行った際に、候補メニューが更新されていなかったので、更新するよう修正しました。
エディタで F2 キー入力で、候補メニューを表示する機能を追加しました。
「DragDrop 登録に〜」で落ちる問題で、起動時の初期化失敗で終了するようにしました。

24 :
>>23
エディタを横書きにしてると左右キーで移動がおかしくなるバグは直った?

25 :
>>24
yes

26 :
白己貴任 自己責任
          フー!  

27 :
>>25
今試したらなおってないぞ

28 :
>>24
うちも発生してたからだいぶ前にフォームで報告しといたけど
いまだになおってないんだよな・・・
10万だしたのは失敗だったんだろうか・・・

29 :
質問したときはすぐに返事きたよ

30 :
smartももう割れが出回ってるんだな・・・・
買ったばかりだからショックTT

31 :
>>20
わびさびのわからんアフォが来たようですw

32 :
smartのエンジン部分だけつかって
好きなテキストエディタで編集できたら最高なんだがな

33 :
>>30
妬みは醜い

34 :
>>30
これからも似たようなことは起きるだろうから
ワレザーに落ちるのも手

35 :
smart以外でフリーのOCRはありますか?

36 :
まともに使えるのはないとおもう

37 :
自分でタイピングしたほうが早いし正確だからな・・・
作る意欲がわかない・・・
>好きなテキストエディタで編集できたら最高なんだがな
画像ビューワとエディタで十分

38 :
smartも最初はフリーだけを宣伝につかって
結局はぼったくりだったよなw
やることが汚すぎw

39 :
>>32
SmartOCR Library

40 :
高すぎるわ

41 :
Rにいくのを2,3回ひかえれば十分買えるだろ

42 :
普通の人には高くて手が出せないよ

43 :
値段みてきたら
俺のしおくり一ヶ月分だったよ・・・
これは、ぼったくりすぎだろ

44 :
10万のOCRソフト...

45 :
いいのは100万、200万する分野だから
smartは安い方だよ
その分しょぼいけどさ・・・

46 :
プロ版が試用したい
認識率次第では買うからさ

47 :
デフォルトの認識率よりも
学習させた結果の方がいいぞ

48 :
ベクターにOCR校正のソフトでてるけど

49 :
>>48
なんてソフト?

50 :
ググれ

51 :
ExcelのOCR校正のしか出てこなかったが

52 :
 ジャストシステムには文章校正支援ソフト「Just Right!」
がある(9800円)んだが認識率が悪くともフォローできるの
かが、わからん??
でも、補正でなおるのならもうそういう時代じゃなかろうか

53 :
>>52
校正ソフトは組み込むべきだと思うよ
OCRソフトはひらがなの「り」とカタカナの「リ」なんて区別してくれないし、
見出しの数字なんか、全角半角ごっちゃだし、
手作業で直さないといけない部分が多すぎる。
翻訳ソフトと同じで、そのままでは使い物にはならないことが多い。
まだまだ改良の余地がある

54 :
そう思うよ。>>53

55 :
ocrスレほしかったんだよ。
やっぱ使ってる人も少ないのかね。
Smartocr Lite使ってみてるけど漢字は悪くないかも。
ひらがながたまにめちゃくちゃだけど。
あと読みココ11と違って一字づつかこってる枠が
まあまあ合ってる。読みココはずれまくったりして困った。
操作はしやすいと思う。
この2つしか知らんけどね。

56 :
ほす。

57 :
パナソニ●クの「読取革命」駄目ですたorz。
DQN識字率でつ。

58 :
「やさしくpdf OCR」というのを使っている。そんなに悪くない。
英語モードで使うと、ピリオドとコンマは認識しにくいけれど。
あとOCRはみんなそうだが、なまじ難しい字は結構しっかり認識
するくせに、単純なところでミスって脱力。人間とはちがう
からしょうがないとはいえ……

59 :

ただしいまSmartOCR Lite を使ってみたら、明らかに負けてる。
ショック。

60 :
>>58
そうなんだよなー。しょうがないんだろうけど
「か」「ま」、とかの間違いが多い気がス。
あとたまに「。」がほんとに出ない。αとかが候補に出たり。

61 :
age

62 :
ほっ

63 :
スマートはプロ版じゃないと
使い物にならない
精度も速度も悪すぎ

64 :
>>63
そんなに違うのか?
フリーの方けっこういいと思ったけど
それよりいいなら使ってみたい。

65 :
smart

66 :
smartはエディタを横書きにしてるとカーソル移動がおかしくなったりするバグは直した?

67 :
値段分の価値はないよ
個人が手を出せる範囲だと
他に選択肢がないから使ってるが、、、

68 :
smart→本格読取→読めココ
英文を扱うことが多いから、読んでココで落ち着いた。

69 :
本格読取はTiffファイルの読み込み可能ですか?
スキャナで読み取ったデータがTiffファイルで保存してあり、
それをOCRで文字認識させPDFにしたいと思っています。

70 :
透明テキスト付きPDFなるものの存在を知りませんでした。
スレ汚し失礼しました。

71 :
>>66
それは直ってたけどあいかわらず
点滅してるカーソルがどこいったかわからんくなる(´・ω・`)

72 :
英文はいまだにオムニが一番?

73 :
文体による

74 :
なんですとー!
http://www.smartread.biz/

75 :
スマートリーディング業務終了のお知らせ
スマートリーディングでは、このたび、資金繰り悪化等の理由により、業務継続が困難な状況となりました。
つきましては、SmartOCR Lite Edition の配布及び、SmartOCR Professional Edition 及び SmartOCR Library SDK の販売を終了し、
残務整理がつき次第、スマートリーディングは解散させていただきます。

2006 年 4 月 25 日
 スマートリーディング
享年0歳。合掌・・・。

76 :
享年は数え年で、「歳」もつけないのが望ましい。

77 :
ttp://www.forest.impress.co.jp/article/2006/04/25/smartreading.html

78 :

享 平 洗
年 成 練
壱 拾 読
   八 解
   年 信
   四 士
   月
   弐
   拾
   伍
   日
    
   没

79 :
ttp://www.vector.co.jp/soft/winnt/writing/se383682.html
まだダウソできる。

80 :
うわ、マジだ。あーあ。
もっと安くしとけば売れたかも…ダメか。

81 :
>>79
GJ :D

82 :
>>79
消えた

83 :
出遅れた・・
SmartOCRLite107.zipください!!お願い!!!

84 :
http://pc7.2ch.net/test/read.cgi/software/1141635878/
こっちでまっててください

85 :
画像処理 その6
http://pc8.2ch.net/test/read.cgi/tech/1140510670/810
ってホント?

86 :
どおりで読んでココと似てると思った

87 :
>>83
何故107?
前バージョンのほうがよくね?

88 :
37 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2006/04/27(木) 18:12:13 ID:1L9jLPzL0
うpうp(´・ω・`)
38 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2006/04/27(木) 23:02:49 ID:0DQdhPY20
http://upupupup.ddo.jp/uploader/2/index.cgi?mode=dl&file=1839
pass: 37のid

89 :


90 :
>>87
んじゃ、106も頂戴!

91 :
>>88
7z
っていう拡張子のファイルはどうやってあけるのでつか?

92 :
7zipでググれ
高圧縮アーカイバで、Win板で大人気。

93 :
>>92
ありがとうございました

94 :
こうやって甘やかされた人は
これからも迷惑かけるんだろうね

95 :
このヤリトリを見た人もな!

96 :
OCRソフトは、「読み取り革命」と「読んdeココ」が売れてるようですね。
現在の最新verは
読み取り革命→10
読んdeココ→12
認識率98%と書いてありましたが。
新聞程度は98%くらいは読み取ってくれるのでしょうか?
また、最近のスキャナにはじめから同封されている、
「読んdeココパーソナル」や「ファイル革命」などは認識率はどの程度でしょうか?

97 :
よんでここは、電気屋に行けばサンプルCDが置いてあるよ
読取革命は、微妙に変わってるけど本格読取が参考になる

98 :
バンドル版はだいたい使い物にならないって聞いたけど。
それだったらSmartOCRのがまし。

99 :
読んでココも読取革命も体験版ありますから、試してみては?

100 :
>>98
ググったら
スマートリーディング業務終了のお知らせ
スマートリーディングでは、このたび、資金繰り悪化等の理由により、業務継続が困難な状況となりました。
つきましては、SmartOCR Lite Edition の配布及び、SmartOCR Professional Edition 及び SmartOCR Library SDK の販売を終了し、残務整理がつき次第、スマートリーディングは解散させていただきます。

とでてきました(汗

101 :
どこの社員が持ち逃げして作ったの?
裏事情きぼんぬ

102 :
つUI比較

103 :
京都生まれ、京都育ちの晶ちゃんがズバリ。一言いっちゃいます ...作業効率を追求した直感的な
修正機能「スマートリーディング」により誤ったレイアウト や誤認識の修正の手間が格段に減りまし
た。 ... トラックバックする(会員専用) [ヘルプ]. Commented by 名無しさん at 2006-04-18 21:49
x. e.Typistのパクリですよ ...
zubaring.exblog.jp/3230398/ - 26k - キャッシュ - 関連ページ

104 :
>100
ググったのは褒めてやるが、過去ログを読むこともおぼえよう。
>75

105 :
SmartOCR Lite Edition 等を許可無く再配布しないよう、お願いいたします。
2006 年 5 月 10 日
スマートリーディング

(C) 2006 スマートリーディング

106 :
パクったのがばれちゃうからね。

107 :
せめて今分かってるバグだけでも直せよ・・・
責任ぐらいとってくれ
ソース貰っても直せねーよ

108 :
パクったのがばれるから直せません

109 :
パクりって言ってる奴はなんだんだ?
なんか恨みでもあるんかい?

110 :
商用製品をパクる
   ↓
無料で配布する
   ↓
ばれたから逃げる

法的にも倫理的にも問題

111 :
販売もしてたから金取ってるよね
パクられたのってどのソフト?

112 :
UIは本格読取に毛が生えた程度。
読んでココに似てるって言ってる奴もいる。

113 :
なるほど。サンクス

114 :
本格読取と同じところで落ちる

115 :
まるっきり一緒w

116 :
パクリがばれるので再配布止めてくださいと素直にお願いすりゃいいのに……

117 :
犯罪者の戯れ言
125 名前:56[sage] 投稿日:2006/05/11(木) 04:26:35 ID:jLp0dWRE0
とりあえずファイルへのリンクを削除しました。
オンラインヘルプのほうは、著作物として保護が
強く要請される(であろう)画像ファイルは使って
いないこと、また、既存ユーザーが利用するため
に必要な範囲の内容に限って掲載していることから、
そのまま存続させていただけるよう、お目こぼしを
お願いします。
では、名無しに戻ります。ノシ

118 :
と、商用製品をパクった犯罪者が言ってますが何か?

119 :
>>117
画像だろうがテキストだろうがソースコードだろうが,著作物だし,
保護されるべきですよね。

120 :
犯罪者を殺しても犯罪にならないのと一緒

121 :
誰かSmartOCRの会社登記とか
社員の名前を晒してくれないか?

122 :
ヒント:一人芝居

123 :
一人H

124 :
おそかった。買うか。でもほしい。なにを買うかな。うpして。よんでここ買おうかな

125 :
本格読取でも買えばいいジャマイカ

47 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/04/29(土) 20:27:48 ID:f+6LR83n0
>>38
再うpお願いします。
48 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2006/04/29(土) 20:39:58 ID:MhA2Xxg/0
Axfc UpLoader Basic N13_2563に
pass=47のID

126 :
読んでも読み取りも糞だろ
宣伝か?

127 :
eTypistも十分クソだから。
コストパフォーマンス的に、本格読取はまあ納得。

128 :
OCRは無料ので十分

129 :
OCRは妹で十分

130 :
OCRが妹で十分

131 :
age

132 :
クソクソ言ってる奴は「何が良いか」を言ってないよね。
社民党?

133 :
SmartOCRがクソな理由は
・認識精度
・安定性
・倫理観の欠如(パクリ)
の3つに尽きる。

134 :
ただ市販品よりましだから
このまま使い続けるよ

135 :
市販品よりましって言ってる奴は、市販品も使ったことない奴

136 :
>>134
辞書を鍛えていけば使えるようになる
それはSmartも一緒だけど・・・

137 :
>>135
市販品つってもピンきりだろ。
ちょっと古いがそれでも性能がいいソフトがあるかも知れんが
そこらで数千円で売ってるようなのは10年前にはまるで使い物にならなかった。
だからといってまた数千円を出して、似たようなソフトの後継版を購入して
役に立つか立たないかから賭けてみるというほどのお人よしもいないはず。
OCRって宣伝文句ではなにをいっても、
結局、読み取り精度が使い物にならないレベルであれば全く意味無いから
今もってるのがそこそこの性能ならば、
それと妥協して付き合っていくしかないと思う。
よほど金が余ってる個人でその金を捨てるように
OCRソフトを買い換えられるならいいけどな。
法人とか貧乏とかだととてもじゃないけど無理。

138 :
OCRにしても、辞書代>>>>>エンジン代。
FEPもOfficeもみんなそう。

139 :
当たり前の話だな

140 :
>>137
買わなくても体験版をDLして使ってみればいい。読み取り性能は製品版と同一だ。
過去に一度懲りて以来市販品を食わず嫌いしてるようだが
この2,3年でかすれ文字認識やルビ処理などは相当向上している。
それから辞書を鍛えずに認識精度に文句言ってる奴は単なる怠慢。
出荷状態ではどんな原稿でもそこそこの精度を出す程度の中庸レベルに設定されてる。
OCRは読ませる原稿の状態や記述内容の分野・傾向が人によって千差万別なのだから、
本気でOCRを活用したければ認識辞書を鍛えるのは必修過程だ。

141 :
お前の発言はかなり苦しいものがあるな。
最後の2行は要するにSmartOCRも使い込めばよくなる可能性が
あることにもなるんじゃないか?
加えて、体験版は実製品時の性能をフルに生かせないってことになる。
だって、体験期間で十分に学習が詰めるまで使えるのか?
ヘビーなユーザだったらそうなるのかもしれんが、
無料でいいって香具師はそれだけ使用頻度が低いからそう言ってる訳だし。

142 :
体験版を試せば製品版のレベルくらい分かるだろ
そのための体験版だし・・・
つまらないことにつっかかるのいくない

143 :
>>141
ハァ?>>140のどこにSmartOCRはさにあらずと書いてありますか?
>>136が既に書いてるとおり、鍛えれば精度が上がるのは同じだ。
それから体験版のことは、市販品は数千円出して購入して役に立つか否か
賭けないとならない、などと実情に乖離したことを>>137が書いてるから
そんなことはないと指摘するためにその存在を紹介しただけだ。
いずれもSmartOCRを否定してるわけでもないし、そのつもりもない。
話を勝手に曲解する奴に「お前の発言はかなり苦しい」などと言われる筋合いはない。

144 :
痛い子発見

つかパクリソフトによく熱くなれるな

145 :
暑くなるのにパクリかどうか関係ないな

146 :
パクリソフトなんだから、フリーもへったくれもないってことだろ。

147 :
特許とってないコードはパクリにならんだろw

148 :
はいはい作者乙作者乙。
特許をとらなきゃ著作権侵害なんかにならないよなwww

149 :
特許侵害と著作権侵害は別物だぞ

150 :
皮肉と事実もわからん厨房は学校に行きなさい

151 :
事実、ソフトウェアはUIや動作を見よう見まねしてコーディングした
程度じゃ著作権侵害は適用されんぞ。
それこそソースコードを見てそのまんまとかで無ければな。
でなければ、現存しているソフトウェア業界の90%以上は著作権侵害ってことになる。
皮肉るにも突っ込みどころ満載の皮肉はやめようなw
まあ、特許を取れば似ているってだけで訴訟の対象にすることは可能だがな。

152 :
>>150
はいはい
君が正しいですよ

153 :
>>151
何で某OCRソフトと同じバグがあるのか、説明してもらいたいもんだな。
それともパクリ作者にとってはそれが必死の弁解か?

154 :
UIが似てる時点で盗作ですw

155 :
つかPro版はウン十万で、パクリ疑惑が出た瞬間に公開停止・・・
これほど胡散臭いやり方もないだろ。自分でパクリを認めたようなもんだ。
元社員or関係者の持ち出しと見て正解だろうな。

156 :
“バグまで似せる”のが厨房クオリティ

157 :
>>155
2ちゃんの影響力を過信しすぎw

158 :
じゃあ何であのタイミングに勝手に配布するななんて言ったんだろうな

159 :
胡散臭い点 (追加)
・あの対応からして何人かで開発したとも思えない
・明らかに売る気のない値段
・あれだけの辞書を作るには、一人や二人でできるもんでもない
・認識ミスする箇所はある市販OCRソフトと一緒
開発に使ったソフトも割れもんかもな。

160 :
オマージュですよ、盗作ではありません、2つを並べてみていただければ分かります

161 :
バイトが常駐してます

162 :
時給いくらだろ?
2000円くらいならやってもいいな

163 :
オマーンですよ

164 :
2000じゃやりたくないw
毎日2ちゃんだぞ
つらすぎるw

165 :
1000円でもやりたい
---ニート

166 :
>>165
働く意志があるのでニートとは言えない

167 :
意志はあっても無職ならニートだろw
2ちゃんは毎日2時間が限度だな〜
それ以上はヤダ

168 :
>>167
意志があれば無職でいいんじゃね

169 :
>>168
その意思が口だけなやつもいるからなあ。
本当に働く意思があるのなら、バイトでも何でもするはずだし、
今仕事無いからって仕事選ばなければ大抵の仕事は手に入るはず。
少なくとも、30歳未満は意思があるが仕事が無いって言い訳は通用しない。

170 :
30才以上でも同じだろ
3kの仕事ならいくらでも余ってるんだしさ・・・

171 :
インスパイヤされて開発され、新たなオリジナリティを加えて商品化したものです

172 :
>>169
今はそうでもないぞ
採る方も結構選り好みする
足りないからといっても誰でも採る訳じゃない
・・・てなんだこのスレの流れはw

173 :
>>172
はいはい言い訳言い訳。
仕事は選ばなければ絶対ある。
俺の近所のガソリンスタンドなんていっつも人手不足だったし。
えり好みするのは人が余っている職場。
そういうとこしか面接行かないから採用が無い。
足りない場合はどんなのでも取る。
それでも、採用されないのは本人にやる気が無いから。
あまりに不潔だったりとか、面接で遅刻とか。

174 :
そういうぽまえらは会社から2chやってんの?
それとも夜勤?

175 :
仕事が暇過ぎて仕事中に2ちゃん。
2ちゃんしてなくてもずっとネットサーフィン。
会社には毎日来てるけど1日30分ぐらいしか働いて無い。
親会社が傾いてるから営業しても駄目だし。
会社潰れそう。
現実逃避中。
多分超負け組み。
失業したら農家でもやりたいな。

176 :
>>175
ばっかおまえ、農家きちいぞ

177 :
>>176
自然に触れながら厳しい肉体労働をこなす。
健全で良いじゃないか。
ただ妻子がいやがりそうなのが微妙。

178 :
>>173
おいおい、取る側にも選ばせてくれよ…
足りないからってどんなのでも欲しい訳ないだろ。
確かに、
>あまりに不潔だったりとか、面接で遅刻とか。
なんてのははなから論外だが。

179 :
>>178
なんで選んじゃいけないなんて論法に持ってこようとするんだ?
自分がニートなのを自分じゃなく他者のせいにして現実逃避してるだけじゃない?
取る側だって選んでるよ。でも、人手足りない状況じゃあ選んでられないってのも事実。
端から見て怪しいのは流石に取らないけど、人手不足になると本当に
ぱっと見頼りなさそうでも、ある程度の礼儀で面接に臨めば即採用になる。
俺がバイトしてたスタンドがそうだったからな。
人が足りない場合はとりあえず、採用してみて、あまりに使えない場合以外は
大抵そのまま雇ってくれる。

180 :
>>177
毎朝早起きでハンパネーよ
天候に左右されちゃうし、機械化されてきてはいるが
その機械買う金もバカにならない上に
手作業だっていろいろあろだろうし。
腰痛くなりそう

181 :
>>180
俺の親も農家だからちょっとその気持ちわかるな。
夏場は昼間が糞暑くて仕事にならないからっていつも早朝に出て、昼間は家で休んでる。
収穫期は毎日12時近くまで収穫物の区分け作業。
マジで、農閑期は自由だけど、忙しい時期は鬼のように忙しい。
これが農家の現実。

182 :
農機高杉どうにかしる

183 :
>>180
今、俺毎朝5時起きしてる。
3時起きぐらいまでなら寝る時間を調整すりゃいける筈。
農業を舐めてるわけじゃないよ。
自然と触れ合って汗水流す仕事がやりたいんだよ。
農機が高いなのか。。
ほら農村とかで若い人募集してたりするとこあんじゃん。
あーゆーのって結構支援受けられるんじゃないの?
どうしても駄目なら屠殺人でもいいや。
食の根幹に関わることがやりたい。

まぁ会社が潰れたらの話だけどな。

184 :
>>178
高望みして無職なら
条件を低くして選ぶべきじゃない?
無職で何の問題もないなら別だけど・・・
今の時代
文盲、メクラ、手や足がなくても
出来る仕事はあるんだし・・・

185 :
盗みをしなければ生きられないって意見もあるけど
単に盗みが楽な仕事だから選んでるだけなんだよね

186 :
流石に、障害で仕事無い香具師は仕方ない部分もある。
学校行ってて特定曜日しか働けないとか、夜だけしかダメとか
夜でも、徹夜するような仕事だと学業に差し支えるとかで
仕事無いってのも仕方ない。
でも、五体満足のNEETで仕事無いとか言ってるのはタダの甘え。
てか、ここは何のスレだ?w

187 :
土木とかコンビニとか清掃とか
時間も自由に決めれる仕事くらいいくらでもあるな

188 :
どなたかSmartOCRうpまたは落とせるところお願いします

189 :
>>188
マルチじゃなければ教えたのに・・・

190 :
おフランスあたりのうpろーだをくまなく探してみれば見つかると思うよ。
まあ、いつ削除されるかは分からんが。

191 :
R

192 :
>>191
てめえが死んでろよゴミ屑

193 :
団栗の背比べ
五十歩百歩

194 :
>>191
というか、何故著作権幇助の罪に問われるようなこと
ボランティアでしなければならんのだ?
Rとか言う前にとりあえず、著作権法について勉強しろ。

195 :
190のように中途半端に教えるのは
自慢したいだけだろw

196 :
そして、教えてもらえないからと>>195のような発言に至る
と言うか、過去ログも読まない厨房だから誰も教えないし、
>>190のような中途半端な解答しか得られない。

197 :
アフォな質問者にはアフォな回答がお似合い

198 :
Smart以外にフリーのソフトはありますか?

199 :
>>198
FengOCR
中華製のすばらしく使えないOCRソフト
いくら試用版でもここまで使えないと製品版使いたがる香具師はいないだろw

200 :
OCRなんてパテントが山のようにありそう。
そうだとしたら研究してこなかった企業がソフト作るのはなかなか難しそう。

201 :
音声認識や合成音声と同じで
作るのに金ばっかりかかって
たいして売れないから・・・

202 :
>>201
まあ、現存のOCRソフトの大半も自社のスキャナ製品の
OCR機能の副産物として出すくらいだからな。
CDやDVDのライティングソフトと一緒で大抵がスキャナに
付属としてバンドルされるから誰も買わない。
高い精度のOCRの開発はどうしても金と時間がものを言うから
少人数で小さい会社や日曜プログラマがちょちょいと作れるものでも
無いから、フリーや安くて高性能なものも出回りにくい。

203 :
まあ、今後フリーのOCRソフトを出すので一番期待できるのはSunかな。
SunのStarSuite陣営は次期バージョンでOCR機能の追加を謳っていたし。
当然、そのフリー版とも言えるOpenOfficeにも機能は実装されるはず。

204 :
普通はバンドルされてるからこそ売れると思うんだが・・・

205 :
他のスレでも書きましたが、平凡社世界大百科事典をOCRにかけています。
1冊500〜600ページx32冊をe.typistでtxtデータ化していますが、何だかんだで
スタートしてから1年くらい経過しました。
今現在、32冊中の28冊分のOCRが終了しました。今月中には完了するでしょうが
さすがに疲れました。
識字率については正確さはあきらめて、吐き出されたテキストをperlで修正しています。
とりあえずタイトルさえ正確に出来ていれば本来の百科事典的な使い方が出来るので
本文検索とか多くは望まないようにしています。

206 :
マルチいくない
違うなら他スレのリンクをかけ

207 :
操作に慣れてOCRに学習させていくと
8時間で文庫で2〜3冊くらいは出来るようになる
PCを使ったことがない新入社員でも半年くらいでできるしね

208 :
>>207
今時、PC使ったことない新入社員なんてどこにいるのかと・・・
まあ、職種にもよるのかな。

209 :
>>205
作業まことにご苦労さんでした。
しかし平凡社世界大百科事典なら、書物は古本屋で処分して
あらためてCD版を買った方がよかったのでは。
こちらは何より誤植が殆ど無いし、検索機能も充実している。
かなり昔から売られていて結構有名だったんだが。
https://ls.hbi.ne.jp/netshop/

210 :
全部の版が出てるわけじゃないからな
必要な人は自分でするか業者に頼んでる

211 :
>>206さん
スンマセン。以前書いたのはこのスレです(↓の215が私です)
【PDA】電子辞書として使おう
http://pc8.2ch.net/test/read.cgi/mobile/1102240007/
1ヶ月以上動きが無いので、上記のスレでの情報取得は無理かと思い、こちらで書き込みました。
>>209さん
上記スレにも書きましたが、デジタル版の平凡社大百科事典は所有しています。
70年代の版なので、昔の日本の状況が載ってて面白いです。
良い意味で(悪い意味でも)表現の規制が無いので…
>>210さんの仰るとおり。
タイピストでの作業は、一生懸命やって100pあたり45分くらい掛かります(一冊あたり4〜5時間)
しんどいので、アルバイトでも頼もうかと思いましたが、自分がこの仕事に単価をつけると2000/h
くらいの自給になり、さすがに30万円以上も出せないな、と思い自分でシコシコやってます。

212 :
業者だと400文字で10〜30円くらい

213 :
大量にある書籍をテキスト化したいのですが、一日2時間程度の作業時間でコツコツ行っていくのに効率の良い方法はありませんか?
書籍のテキスト化は初めてなのと、一度に作業ができないので悩んでいます。
ScannerはEpsonのGT-7400UでOCRは読んで!!ココV12、Acrobat7.0です。
思いついたのは、
1.取り敢えずJPEG画像でPDF化しておく→時間があるときにOCRで修正しながら透明テキストPDFにする
2.Rのままで取り敢えず透明テキストPDFを作成しておく→時間があるときにOCRで修正
何か良い方法はないでしょうか?

214 :
>>213
とりあえずブックスキャナを買ったら?
ピンきりだけど

215 :
GIMPとかで使用してるOCRソフトにあわせてスキャン画像のゴミとか取ってからじゃないと
ご認識しまくって使い物になんな

216 :
age

217 :
ふと浸かってみて思ったのだが、アスキーアート作成の強力な武器になりそう。

218 :
ならねーよw

219 :
>211.213
http://www.vector.co.jp/soft/win95/business/se364506.html
だね
お試し版で今のところ十分
追加の辞書ってなにかと思うけど

220 :
宣伝乙
それとも自演かな?

221 :
http://www.vector.co.jp/soft/win95/util/se092874.html
でもOK

222 :
学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品
学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品
学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品

223 :
( ´,_ゝ`)プッ

224 :
やっと見付けた
SmartOCRの実力、見せてもらおうか!
http://www.filecache.de/52330047

225 :
1.07は糞

226 :
わざとだろw
224はアンチw

227 :
>>225-226
ほんとクソだった
_| ̄|○
また探索に出掛けてきます

228 :
Smartは期待して使ったけど
全然ダメだった覚えがある
未学習と比べればいいんだけどさ・・・

229 :
無料だから信者がつきやすいだけ
パクリ疑惑もあってアンチもついたし
知名度は抜群

230 :
SmartOCRのことで、教えてくれ。
どうして1.0.6の需要があるの?
最新版の1.0.7にはない機能があるとか。
教えて君で申し訳ない。

231 :
[OCR] 画像→テキスト化総合
http://pc7.2ch.net/test/read.cgi/software/1141635878/365

232 :
>>230
1.0.7が最高ですw
機能も豊富ですし
安定性も一番www
お友達にすすめるなら是非1.0.7をお願いしますw

233 :
個人的には104が一番バランスがいい
機能、安定性、軽さなどで
どれを重視するかによってベストは変わる

234 :
1.07は糞でFA

235 :
でもプロじゃないと精度悪すぎなのがね・・・

236 :
それは当たり前
フリー版の精度高かったらプロ版売れないしw
今はプロ版買えなくなったけどさ・・
フリー版を使ってる人は操作性などで選んでるんじゃなかろうか
フリー版は学習させてもあんまりよくならないし・・・

237 :
プロ版もnyで落とせばいいだけ
フリー版よりも安定しててお勧め

238 :
洒落にはきてるのかな?

239 :
>>237
通報しておきました

240 :
訴える会社がないんだから捕まらないっていうのは甘い?w

241 :
こちらでいいのか分かりませんが。。
ぜひ教えてください。
妹が妊娠初期で、勤め先でOCRスキャナを使っているそうです。
OCRスキャナは一般に母体への影響はなにかあるんでしょうか。
読ませるときに光をあてますよね。
あの光がレントゲンのようにすごく危ないものであったりとか。
東芝の製品で品番等問い合わせをしたら
「申し訳ありませんが、販売店にご相談ください」と言われたそうで。。。

242 :
>240
会社が無くなっても、権利者はいるだろ。
特殊な人が債権として取得している可能性があるので、会社存続時より却って危ないかもねw

243 :
>241
スキャナ(コピー機)の光源は発光ダイオードや冷陰極管(=蛍光灯)です。
光を直接浴びるならシミ・ソバカスの原因になるかもしれませんが、
通常の使い方ならブラウン管テレビの前にいるより被害は少ないでしょう。
つか、そんなネタをどこから吹き込まれたんだか・・・
そのうち妹さんが労組の利権争いに巻き込まれ、ストレスから霊感商法に引っかかって壺を買い
いつの間にかソウルで集団結婚式を挙げているに666北朝鮮ヲン賭ける。

244 :
>243さまありがとございました。
使っているスキャナっが旧型っぽいらしく、心配になったみたいです。
よく考えれば、レントゲンは体の中をと撮影するもので、OCRのように紙の表面を読むだけなら、コピー機と同じですね。
姉妹で無知だったもので。。
すみませんでした。

245 :
SmartOCRのヘルプページのサイトは、http://three.fsphost.com/freeocr/から
http://ocr.rossa.cc/
に移転しました。

246 :
SmartOCR Lite 1.0.6 ってどこか流れてないかな?

247 :
そんな糞バージョンイラネ

248 :
>>246
お前は1つ前の投稿も読めないのかと(ry

249 :
246はネタだろ

250 :
どなたか優しい方、SmartOCRをうぷしてくださいな。

251 :
>>250
もういいってw

252 :
>>251
本当にないのです。245のサイトもリンクが外されています。

253 :
>>252
このスレ最初から読めよ

254 :
>>253
読みました。リンクが切れていました。
できれば下のうぷろだにお願いします。
ttp://www.4shared.com/dir/1006463/575b200b/public.html

255 :
254はIP抜かれるから注意

256 :
>>254
文学版にあったよ
あとググっても見つかりますよ

257 :
>>254
なんで欲しいの?

258 :
>>255
IP抜かれるのですか?
>>256
文学板は初めての板なので適当なスレを見てみたのですが、
どこにあるのかわかりませんでした。
>>257
図書館で借りた本を携帯で読むためです。
手に入れることができました。ありがとうございました。

259 :
なんでスパイウェアを使うんだろう・・・

260 :
IP抜かれることも知らなかったようだし
無知なだけだろ

261 :
和文の中に英文が混ざったものをOCRする場合、何が
一番良いですか。
e.typistを使ったら全然ダメでした。
特に英文の斜体を全く認識してくれない。
何かやり方が間違っているのだろうか・・・

262 :
>>261
omniかsmart

263 :
>>261
俺はetypistでやってるよ
photoshopで修正かけてからやればそこそこ使える

264 :
文句言ってる奴は
100%の認識じゃないのが不満か
ソースが汚いんだろうな

265 :
>261
読み取りdpiを上げる&混合認識の設定しても駄目なら、面倒でも範囲指定。

266 :
261ですが、皆さん、ありがとうございます。
e.typistで普通に範囲指定したら、イタリックの部分を
和文としてめちゃくちゃな認識をしてしまうのです。
範囲指定をすれば、勝手な範囲を作ってしまって、
文章がつづきませんでした・・・
(1つの段落なのに、文の途中で範囲を分けて数行にわたって
 縦に2つも3つも枠を作るので、使い物にならない状態)
そこで今は読取革命のお試し版を使ってみたのですが、
こちらは範囲指定すれば、イタリックでも何とか
普通に認識してくれます。
ただ、和文中の間違いが多いけど・・・
とりあえずコレでやってみます。
(原稿は奇麗でノイズもほとんどありません。)

267 :
範囲指定が間違うことなんてないはずだけどな

268 :
読取革命はいいよ。松下関連会社社員の俺が保証する。
どのスキャナにもバンドルされてないのに、いまだに2強相手に
バージョンアップをし続けている独立不羈のレコグニション・テクノロジーだよ

269 :
お約束なので。
>>268
社員乙

270 :
基本的なことが分かってないようだからいっとくけど
ノイズが目に見えなくてもOCRにとってはノイズとなることもあるよ
だから修正しないとだめ
してないから範囲指定が間違うことになる。
修正するのが面倒ならソフト毎に原稿の得意不得意があるから
使い分けるといい

271 :
Smart最高ってことだな

272 :
手書き文字アンド罫線に適したOCRソフトとなると
なにになりますか?
表に手書きで記入したものをデータ化したいのもので。

273 :
>>272
ttp://biz.mediadrive.jp/products/package/winreader/index.html

274 :
宣伝貝?

275 :
そうでもないか

276 :
エプソンのスキャナーGT9400UF やや美品
オートシーダー付き 付属品もある。
300枚ぐらい、PDFに変換したぐらい。
もちろん、きちんと動く。
 藤沢まで取りに来れるなら、ぶつぶつ交換しないか?
当方バラの苗希望(品種問わず)
また、夜の10時すぎに来ますので、レスあればこたえます。


277 :
ネタだよな?
その機種は過去最悪の出来

278 :
薔薇って苗で育てるの?

279 :
え???
今の子はそんなことも知らないの?

280 :
校庭の土以外触ったことがない子ばかりだよ

281 :
「種ではなく」 って意味じゃないの?
>278
薔薇のように観賞用に改良された品種は種が出来にくい物がある。
また、発芽後しばらくは虚弱で世話が大変だったり
花の色が親と同じになるか判らない等の理由で挿し木などで増やすことが多い。
もちろん品種改良を意図する場合は別。

282 :
苗木と勘違いかもな

283 :
>>281
>花の色が親と同じになるか判らない等の理由で挿し木などで増やすことが多い。
バラって木なの?

284 :
木じゃなくても挿し木っていうよ。辞書引いてみな。

285 :
いじわるだなw

286 :
そういえば、朝鮮朝顔に茄子を接ぎ木して
実った茄子を食べて中毒した人がいたな。

287 :
紙原稿をOCR→PDFにする場合、どのOCRソフトが一番向いているでしょうか。
又、紙原稿→OCR→wordの場合はどうでしょうか。
どなたか詳しい方、教えてください。

288 :
つ Adobe Acrobat Standard
・定価で買っても一年で割れば一日100円。俺でも買える良心的価格。
・ADFに付属のAcrobat Standardを使うなら、更にお得。
・仮想プリンタで何でもかんでもPDF化できる素敵環境。
・案外使えるOCR機能をなんと標準搭載。
・Readerには無い「テーブルとしてコピー」機能を使えば、なんと表形式のOCRデータを
 Excelに直接コピペ可能。まさにビジネスマン垂涎の機能をこれもまた標準搭載。
電子帳票としてのPDF優位に疑う余地はない。今なら最新版のVer8が出たばかりだ。
さあポチッと押してこい!そしてレポよろ(・∀・)

289 :
人柱ワラタ
まぁ、MS-Officeと同じで本家入れたPCが一台はあった方が便利。

290 :
<<価格に躊躇してる、私の背中を思い切り押して!>>
・・・・という、>>287の内なる声に答えてみました(・∀・)
なにせVer.8には、そのものズバリ「Word文書として保存」機能が付いてるからね。
今頃は背中をさすりつつ、クレジットナンバーを打ち込んでいるに違いないよ。

291 :
iCS ics
囚果 因果
原囚 原因
なつたがり なつながり
達動 運動
言危弁 詭弁
ベルグソソ ベルグソソ
力_ が、
lism lism
soCial social
ラソド ランド
惰報 情報

292 :
>>291
十分々々。そんだけ認識出来てりゃ文意は伝わるよ

293 :
> ベルグソソ ベルグソソ
えーっと……

294 :
>>288
ありがとうございました。
Acrobatはver6を持っているのですが、OCRしても校正が
できなかったような気がします。(実は余り使っていない)
校正が大事なので、結局、読んでココと読取革命で試したのですが、
画像の修正は読んでココが便利、WORDに変換した場合は、
読取革命のほうがレイアウトを奇麗に保ちました。
結局一旦WORDに変換して校正し、PDFにすることにしました。

295 :
ここの名無しってなんで選挙なんだ?
ビジネスsoftと関係ないジャン

296 :
>>294
   http://pc7.2ch.net/test/read.cgi/software/1106824572/528
   > >>526
   > つか http://www.planetpdf.com/ で調べたら色々載ってたよ。
   > 透明テキスト(Hidden Text) はTouch Up で追加された文字列でアルファブレンディング
   > されてるだけだから、編集もTouch up Textで可能。
   > 不可視属性については「Touch up Textツール→透明テキスト全選択→右クリック→プロパティ
   > →テキストタブ→塗りつぶし」で好きな色(赤色など)を選べば解除できる。
   > で、この状態なら修正もしやすいんで、なおし終えたら、また「プロパティ→カラーなし」にすれば
   > 透明テキストになる。
   > ちなみに透明テキストを新規に作成する場合は「Touch up Textツール→任意の位置で右クリック→
   > 新規テキスト」でフォントと横書き/縦書きを選ぶ。あとは「右クリック→プロパティ」で「カラーなし」にすれば
   > 透明テキストを好きな場所に挿入することが出来る。
この方法でもダメ?

297 :
>295
郵政選挙の時(だったかな?)に変更して、そのまま放置されているだけ。

298 :
>>297
いや、俺の記憶では2000年夏の参院選からこの名無しだ

299 :
>>297-298
適当なこと言うなよ・・・
>>298
ググれば分かる

300 :
>>299
適当じゃないって。
ttp://ruku.jfast1.net/noname2ch/
を参照。でも参院選じゃなくて衆院選だったみたい。ここは記憶違いか。

301 :
>>300
結局、適当じゃんw

302 :
>>300
それを適当と言うのでは?

303 :
>>301
2000年の選挙って言うとこまでははっきり覚えてたんだよ。
明石かどっかの花火大会で将棋倒しになる大事故があって
吉野屋コピペが乱立して、2ちゃんの鯖が停止しかけてみんなで
したらばへ大移動しようとか言ってた頃だよ。

304 :
>>300
そのサイトはあくまでも参考であって
情報源にならんよ

305 :
つうかOCRの話せいよ。

306 :
>>305
君から話題ふればいいじゃん

307 :
読んでココのヘタレアクチ、嫌でしょうがない。

308 :
そうでもないか。

309 :
え、読んde!!ココ ってアクチ付いたの?いつから?

310 :
昔からついてるだろ

311 :
アクチがついてないソフトを探すのが大変になってきたな

312 :
アクチに文句言ってる奴は割れなんだろ

313 :
読んでココで読ませてワードに出力すると必ずテキストボックスだらけに
されて役立たん!!と思ったがなんでそんな仕様になってるの?

314 :
レイアウトを保持する設定になってるんじゃね?

315 :
313はマルチ

316 :
           -‐-      ,、
       __〃      ヽ lv !
       ヽ\ .ノノノ)ヘ))〉ヽ'   / ̄ ̄ ̄ ̄ ̄
     _!(0.)! (┃┃〈リ /   < はいっ!
   /\ Vレリ、" lフ/ ./ \   \_____
  /  ./l ̄ ̄ ̄ ̄ ̄ ̄ ̄|ヽ
  \/l  |―――――――! ヽ
      l  | ○ み か ん  |
      l  l―――――――|
.      \l_______|

317 :
間われ 問われ
湖る 遡る
憐欄 憐憫
迫求 追求
恋意 恣意
演縄 演繹
拘東 拘束
なげればならない なければならない
避げ 避け
官分 自分
後喬 後裔
明蜥 明晰
社全 社会
おげる おける
うげ入れ うけ入れ
立怯 立法
盲由 自由
制隈 制限
だげ だけ
わげ わけ
をうげ をうけ
範曙 範疇
明噺 明晰
間わ 問わ
ウーン

318 :
手打ちの方が楽なんだよね
数こなす必要があるのなら、シコシコ学習させていくしかないかと。

319 :
問顧問題
官由自由
潮笑嘲笑
欺購欺瞞
おけぱおけば
+分十分
精纈精緻
研鐙研鑽
ょってよって
吝薔吝嗇
勘酌斟酌
ウーン ウーン

320 :
対時対峙
役鵠役割
問顕問題
有由自由
紬細
説朗説明
演緯演繹
勘弁してください ウーン
なまじ読むから困る

321 :
最近OCR認識率が悪い!

├ 1.PCを買い換える

│    [まちがい]     
│      確実な方法ではありますが、お金がかかるのが難点です。
│      それよりも別の手段を探してみませんか?
│      ちょっとしたフリーウェアでなんとかなるかも?
│              ↑
│          ココがポイント!

└ 2.RegSeekerを使う
      [せいかい]
Regseeker
ttp://www.hoverdesk.net/freeware.htm
RegSeeker1.3Beta日本語ファイル
ttp://downloads.at.infoseek.co.jp/


322 :
>>321
こんなとこにまで。。。

323 :
ただ、LightではPDF出力の場合、文字の平均の大きさで原稿サイズを調整してしまう。
106はデフォ?、107は選択できるようになっているがLightでは選択できない。
これさえなきゃ・・・・

324 :
ところで一番速いスキャナーってなんですか
エプソンの8700は600dpiでA4 50秒これは痛い
いまはもっと速いのが出てると思うのですが(5万円以下)

325 :
フォルダに放り込んだら常時監視のサーバが動き出して
勝手にOCRかけてくれるシステムって無いかな〜

326 :
いくつかある
ググレカス

327 :
http://itpro.nikkeibp.co.jp/article/USNEWS/20060906/247265/

328 :
>>324
いまさらだが、
スレ違いハード板へ

329 :
読取革命 と 読んでココ どっちが使い勝手がいいですか?

330 :
WinReaderPROの 中古版

331 :
>>329
使い勝手は人によるから
体験版を試せ

332 :
329はどれを使っても同じ

333 :
Windows Genuine Advantage Notificationsをインストールして、
OCRに影響が出た人っていませんか?
WinReader Hand S V2.0の認識が正常にできなくなったんですが・・・

334 :
なんでもかんでもWGANのせいにするのは、割れ厨の悪いクセだ……

335 :
割れは一切使っていません。
自動更新をインストールして急にOCRが使えなくなりました。
SP2抜いてもWGANがアンインストールできなくて困ってるんです。

336 :
スレ違い

337 :
いきなりSP2を抜くとは、また豪快ですなぁ。
SP2を入れたら使えなくなったとでも?

338 :
半角カナ主体の表(請求書の商品名が半角カナ)を
上手に読みとれて出力できるOCRはないですかね?
単語登録も半角文字が使えるOCR。
とりあえず体験版を3つほど試してみたのですが、
e-typist:半角カナ非対応ぽい
読取革命、読んde!!ココ:認識率が悪い
読んde!!ココなんか、
「プ」が「70」になったりしたけど、半角では単語登録できないみたいですし。
富士通の「表OCR/文書OCR for Excel&Word V5.0」http://software.fujitsu.com/jp/ocr/socr/
はどうかな? と思ったのですが体験版がウェブサイトにないから試せないですし。

339 :
追記
e-typistは半角カナ出力は出来ませんが
半角カナ文字を読みとって全角文字として出力するのは
読取革命、読んde!!ココより上手でした。

340 :
「表OCR/文書OCR for Excel&Word V5.0」を買って試してみました。
ちゃんと半角カナ出力が出来ました。
全角文字の認識率はe-typistの方が上でした。
ですので、半角カナを使う人はこのソフト、
使わない人はe-typistがオススメのようです。

341 :
なんで無料のを使わないんだろう・・・

342 :
ないから

343 :
半角はsmartOCRがいいかも

344 :
いい加減にsmartocr信仰を止めろ
あれのエンジンはe.typistと同じだ
ある社員がe.typistのソースと辞書データをごっそり持って辞めて
作ったのがsmartocrだ

345 :
それ信じてるんだw

346 :
真相知らないんだw

347 :
64ビット対応のOCRソフトを教えてください。

348 :
etypist

349 :
何で嘘付くの?

350 :
ごめん

351 :
公式発表がないだけで
たいていのソフトは動くけどな

352 :
>>347
smart

353 :
つぶれた

354 :
増殖した http://ocr.rossa.cc/

355 :
Ver12 age

356 :
ここ見て「やさしいpdf」体験版使ってみた。文字情報持ったpdfでも英字/日本語の誤認山ほど。
文字情報持たないpdfはほとんどゴミでした。これじゃ正規版買う気にはならないなあ・・・
最近カキコ少ないみたいですが、どれがいいのかな。

357 :
文字情報の有無とOCRの精度はあんまり関係ないと思うが……

358 :
原稿の状態と相性はあるし
一概にこれならご認識少ないとは言えないんだよな

359 :
>>357 文字情報持ってるpdfでもその情報使うわけじゃなくて画像から認識するみたいですね。
生SCANしただけのpdfは、字が小さい・ノイズが多い、で認識壊滅状態になったようです。

360 :
ぼくも生が好きです。

361 :
>>359
OCRのOって、なんの略だか知ってましたか?

362 :
Omanko の略です。

363 :
>>359
・・・バカなの?

364 :
>>361 OPTICALでいいの? 私が知ってたOCRは、専用のコーディングシートに文字を
手書きして読ませる機械でした。今回、pdfからかなり大きな表をエクセルに貼る必要ができて、
調べてみてOCR的な機能を持つソフトがあるのを知った次第です。
誤字脱字はあっても、全部手で入力するよりは早くできました。

365 :
>>364
こういうのは、自分のブログとかに書くといいよ。

366 :
現在の所、Docuworksがいい
縦書き認識にも対応
既存のjpgファイルの読み込み認識に効果あり。
「やさしくPDFへ文字入力」で読み込めない画像も読み込め認識も可

367 :
>>356
「やさしいpdf」って何? 「やさしくpdfへ〜」の事?
たった7文字の製品名すら正しく書けないおつむの奴に、
けなされるOCRソフトが不憫でならないw

368 :
けなしてはいないじゃん
過剰反応いくない

369 :
昔のOCRソフトで役に立たないのを捨てた。文字情報を抽出する奴だったが、文字情報として
pdfが持っているものしか抽出しないみたいで、試しに生SCANしただけのpdf食わせたら、
*ページ番号だけ*抽出したtxtファイルができた(w

370 :
>>369
そうだよな
認識率のよくないやつは、結局手で打ち込むから
ウィンドウ並べて打ち込んだほうが速いくらいだw

371 :
>>369
どこのメーカーの製品だ
それはOCRとは言わないだろう常識的に考えて

372 :
フリーソフトだったからしょうがないです。それにくらべるとやさしくOCRなんか、誤認はあっても
ずいぶんましだとおもいました。「英文だけ」が選択できるといいんですけど、別のsoftで
そういうのもありますか?

373 :
「ソースネクスト 本格読取2Deluxe」を購入しようとおもってます。
スキャナーで取り込んだ画像にテキストの挿入をしたいのですが
可能でしょうか?サイトやパッケージを見てもいまひとつわかりません。

374 :
textbridge使っています

375 :
>>372
英文だけならSofti Free OCRってフリーのものがある
日本語版は無いがね

376 :
弥生顧客を使っているのですが、
連動可能なOCRはありませんか?
紙印刷された名簿、名刺、ハガキを
スキャナで読み込んで入力を省力化したいのですが……

377 :
質問です。
仕事で使いたいんですが、スキャナはあります。
TIFF、PDFに出来ます。
そこで、表をOCRしてExcelに出したいんですが、
良いのありましたら、お知恵をお貸しください。

378 :
>>377
ほかのソフトのことは知りませんが、e.Typist ver.12(Windows)でExcelへ転送できます。
私は英文、和文共に文章ものしかやったことがないので、表ものの精度はわかりかねます。
やってみてあげなよ、と後頭で声がするんだけど、ごめん、私には取りあえず必要がないんで。

379 :
イータイピスト
バージョンアップしたら一枚の画像を読み取るときに
左隅のほうを二度も三度も読み取ってテキストがダブる。俺だけか。

380 :
>>379
傾きを修正したときに影のようなものができる、それとは違うの?

381 :
イータイピスト
バージョンアップしたら一枚の画像を読み取るときに
左隅のほうを二度も三度も読み取ってテキストがダブる。俺だけか。
だと
イータイピスト
バージョンアップしたら一枚の画像を読み取るときに
左隅のほうを二度も三度も読み取ってテキストがダブる。俺だけか。
二度も三度も読み取ってテキストがダブる。俺だけか。
取ってテキストがダブる。俺だけか。
ってなるこれは困るアップする前は普通だったのに

382 :
だからあ、傾き修正をしたものかどうか、きいてんのぉ!
傾き修正したものなら、いちどファイルを捨てれば影はできないです。
もしくは、Photoshopなどで先に修正しておくとか。

でも〜、9から12にした私としては、やらなきゃ良かったw

383 :
ばかじゃない。傾き修正していようがしてまいが、二度認識している
ということを書いてる。

384 :
認識と解析ではなくて、2度認識なのね? それは起きないけど。

385 :
デジカメで撮って、さっとテキスト化したい。
いいOCRソフトないかな?
オープンソースでOCRソフト作ってみたいな。
アルゴリズムはどうなってるんだろ?

386 :
まずは無料の体験版で比較してから購入してみるか…。

387 :
PDFファイルにスキャンされた画像が含まれている。
Google デスクトップでは、これらの PDF ファイルの名前全体を検索した場合のみ結果が返され、
ドキュメント内のキーワードで検索することはできません。
Googleデスクトップを使ってて、OCRで画像をPDF化する人はお気をつけあそばせ

388 :
携帯で撮った本をOCRできるソフトってないですか?
人間の目では字が小さすぎて読めません。

389 :
本屋で撮ってないよな?

390 :
二度どころか三度読むは
バージョン11

391 :
>>388
俺はスマートプロを使ってる
学習させるまえは使い物にならなかったけど
最近はだいたい認識してくれるようになった。
とった画像を原寸表示して小さくて読めないなら
上半分とか分割して撮影すればいいとおもう

392 :
結局このスレの一押しは何よ?

393 :
用途次第では?

394 :
しかしOCRの用途ってOCR。

395 :
OCR対象の形式のことでしょ。
Justsystemから出しているものは、ATOKの手書き文字認識があるから期待したけど、
縦組みに不対応なので諦めた、というような。

396 :
原稿の内容や状態にもよるし
これがベストってのはないからな・・・
でもたいていはフリーので問題ない

397 :
★ ベクターにて【期間限定】【特価】販売! ★
 『e.Typist v.12.0 for Windows ダウンロード版』
 通常価格 : 13,440円(税込) → 4,515円(税込)
 ※特別価格での販売は2008年3月30日までの期間限定です。
まともに買ってユーザ登録した人にこんな腹の立つメールを送ってくるとはふざけるな!

398 :
投げ売りするほどクソなのか?

399 :
e.Typist の会社は小出しが大好き、完成度の高いOCRソフトを持っていながら,
ちょこちょことバージョンアップして金を集めている、乗るのがアホなのか
乗せるのが馬鹿なのか、踊ってください。


400 :
>>397
これ買ったらまたすぐバージョンアップが待ってるのか?

401 :
つまらん機能追加でバージョンアップする必要もないし
適当なタイミングでアップグレード版買うためにも
今買っておいて損はない

402 :
ベクターをチェックしてみたら4515円はアップグレード版だったぞ
ちなみに発売当初のアップグレードダウンロード版はもっと安かった
オレは4064円でダウンロード版を購入したよ

403 :
アップグレード版の税込み定価は6,042円。
13,440円というのは間違いなくアップグレードではないダウンロード版。
メディアドライブからこのメールが届いた人だけメール記載のURLから買えるんじゃないか。
でも、繰り返し言うが、まともに買ってユーザ登録した人に送るメールじゃないだろ!

404 :
ocrって普通の寝カフェとかにも入ってるのかな?
スキャナがあるとこだと。

405 :
そんなメールが届いてたなんて気づかなかった
ほとんど読まずに捨ててるもんなあ

406 :
私も気付かなかったわ。
バージョンアップしてからユーザー登録していなかったので、
登録してみたけど、何も来ませんね。
バージョンアップだからかな。

>>403のお怒り、ごもっともです。

407 :
まじか、いつベクターの価格が改定されるのか楽しみに待ってたのに。
Docuworkとの連携で都合がいいので e.Typist欲しかったんだがな

408 :
バーコードを認識するOCRソフトってないでしょうか
DR-2510Cについていたe.Typistエントリー2で受領書をスキャンしているのですが
キーになるコードとバーコードが近くにありキーの認識率が低下します。
キーとバーコードは同じ情報なので
そのままバーコードを認識できればと思うのですがそういうソフトはないでしょうか?
バーコードの結果はlogで吐き出すという形でもかまいません。
買った後に気づいたのですが別の機種ではハードでバーコード認識するものがあるのですね。

409 :
>>408
ググると出てきますが、バーコード認識の専用ソフトは皆、値段が高いみたいですね。
自分もDR-2510Cですが、バンドル版じゃなく、e.Typist V12を使ってます。
これだと認識テンプレートというのを作れば、認識させる領域を指定できるので、
多分キーの部分を認識領域にしておけば、バーコードのパターンの干渉を受けずに
キー文字を認識できると思うんですが。
バンドル版にはないですか?
ただし、キーの場所が毎回変わるようじゃ使えません。

410 :
>>409
回答ありがとうございます。
認識テンプレートを確認します。

411 :
>>407
また送ってきた。多分顧客情報が整理できてなくて、e.Typist以外のソフトの
登録情報に基づいて送ってきたんだろうな。
ttp://shop.vector.co.jp/service/catalogue/sr127280/
誰でも買えそうなので、申し込んでみたら?

412 :
>>409
認識テンプレートは見つけられませんでした。
情報ありがとうございます。

413 :
>>411
d

414 :
OCRのことを
おしりって言っていいですか?

415 :
お尻orz
お知りocr

416 :
そんなこと言うから、
OCR が、腰に手を当てて体を曲げる運動をしている人に見えてきたw

417 :
>>416
どういうこと?
ocrのoは頭だとして、
cの上側は腹が空を向いている部分、左側は首とつながっている腕、
下側は腰に手をあてている部分だとして、
rの左側は胴体につながってる足で、右側の突起物は何なの?
それはともかく、
e.Typist>SmartOCRLite106>SmartOCRLite107>読取革命>>読んでここ
ってことでおk?

418 :
smartocrと読取革命の順序が???だけど
etypistのトップは変わらないな

419 :
OCR

ocr
ん〜言われてみると
足を上げているように見える・メタボになった人が
運動してるのかもよ

420 :
(>>416)
Oが頭で、Cが腰にてを当てた胴体で、
それがRの下半身から、横にころっと落ちたというのか曲がったというのか……
こんなネタで盛り上がらないでよ〜

421 :
>>417
空気読めないとか言われたことない?

422 :
かなり薄ら寒い空気だと思ったのはオレだけのなのか・・・

423 :
翻訳ソフトについてきたCROSS OCRって奴、精度悪すぎる

424 :
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 カスタマサポートサービス終了について
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
【サポートサービス終了製品】は以下のとおりです。
 ◆e.Typist v.11.0 Windows版
ん? 1回おきにしかVerUpできない貧乏人は無視かよ。
V12が出てからだいぶ経つし、今頃VerUpするくらいならV13を待ちたいよ。

425 :
サポート終了しても実害はほとんど無いけどな

426 :
ominipage 16が$79.99で買えるキャンペーン中
http://www.digitalriver.com/promo=212017

427 :
数字のみ、日本語のみでの単認識は、読んで!!ココが一番だよ。
ただ、自動実行とかソフト任せにしちゃうと、
このソフトはとたんに糞になるんだが。


428 :
ココにはアクチがある。
大変に鬱陶しい。

429 :
OC=

430 :
etypistがベスト
読み取り革命でもいい
あとは糞

431 :
会社での業務だったらwinreaderがいい

432 :
A4のスキャナ・プリンタの複合機を考えてますが
OCRを使うならスキャナとプリンタは別々のほうが良いでしょうか?

433 :
一緒でも良いんじゃない?

434 :
パナソニックのOCRよりも2万円以下で良いのありますか?

435 :
>>434
>430

436 :
>>435
レスどうもです。
アマゾンでetypistを見てみたらレビューにてボロカスに叩かれていましたが
あの投稿は無視して「読んde!!ココ」というのと二つに搾って考えてみます。

437 :
>>436
eTypist11を使ってます。
Amazonの評価読んだけど、これがホントで、かつヘビーユーザーなら買わないほうが
良いと思います。
自分もアップグレード考えてたけど、止めました。
ユーザー離れ必至ですね。
認識能力はピカイチだけに、馬鹿な仕様変更をしてしまったものだと思います。


438 :
キヤノン製じゃなくてエプソン製スキャナを使えばいいのでは?

439 :
>>437
オーダーするつもりで気持ちを決めてたのですが、
レスをいただいてまたグラグラと気持ちが揺れてしまいました。
どっちにしても買うことは決めているのでもう少し考えてみます。
アドアイスをありがとうございました。

440 :
e.typistじゃなくてwinreaderにすれば?

441 :
>>436
可能です。
以上。
はい次の方。

442 :
age

443 :
読んでココv13の質問なんですが、
認識結果を修正するとき、候補文字から選択するとどんどんユーザー辞書に追加されていきます。
初期状態は、追加するかどうか、確認画面が出てたのですが、確認しないをチェックしてしまいました。
これを元に戻したい(確認画面が出て、不必要な辞書登録をしない)のですが、どこにその設定があるのか分かりません。
かなり探したのですが・・・何処に隠れてるのでしょう?ご存知の方教えてください。

444 :
よく見たら一ヶ月に1カキコの過疎スレか・・・
レス期待できないから移動するわ

445 :
>444
バージョンアップする必要性を全く感じないので、v11のままなので、
v13のことはよくわからないけど、v11では
(1)「オプション」−「環境設定」メニューで「環境設定」ウィンドウを開く。
(2)「環境設定」ウィンドウの「その他」タブを選択する。
(3)「その他の設定」の「設定」ボタンで「操作アシスタントの設定」ウィンドウを開く。
(4)「操作アシスタントの設定」ウィンドウで、認識結果編集時の自動処理の
「辞書登録時に確認を行う」チェックボックスを選択する。
でユーザ辞書登録時に確認操作が必要になる。
もう見てないかも知れないけど。

446 :
>>445
V13 でも似たような手順で設定できる。

447 :
なんだか人が居ないみたいだけど・・・・
eTypistのオーバーレイ機能ってどうですか?
元の原稿と重なってるって見難くないですか?
今は読んでココ使ってるけど、ココは一行上に別窓で表示する方法に慣れてるんだけど。
でもココはunicode文字に対応してないし、unicode対応ってeTypistだけですかね?
eTypistって体験版無いんですかね?HP見たけど見つかりませんでした。

448 :
>>447
体験版あるよ。オレ試してから買ったもん。

449 :
なくなったみたいだよ

450 :
ごめん。あったorz

451 :
>>450
え?どこに?
俺はWinReaderの体験版を試した後にeTypistの体験版を探したけど、見つからなくて買っちゃった。
感想。
WinReaderとeTypistは兄弟だね。操作が全く同じ。
小さい字の認識はWinReaderの勝ち。
認識エリアの設定も認識力もWinRederの勝ち。eTypistはわけわかめ状態になることが多い。
「西村ひろゆき」が巨大な「一」と認識されたり、全く認識されずに画像扱いになったりする。
エリアも意味不明に巨大化したり、全く認識されなかったりとか。

452 :
winreader使ってシステム組んだことある人いる?

453 :
>>451
メーカーHPの体験版リストには載ってないけど、
「eTypist 体験版」でググルと出てくる。
WinReaderてeTypistより一桁高いじゃん。

454 :
>>453
買うつもり満々でした。価格COMで一番安いところにも発注しました。18万円くらいだったかな?
でも、買うまでの手続きが凄く大変でした。販売店もそのあたりを把握していなくて、教育機関勤務じゃないと買えないとか言われて、
それが後でひっくり返ったりとかで面倒でした。結局、2週間たっても入荷しないのでキャンセルしましたね。
ヨドバシで聞いたら、通販は不可で、申込書を書かないと売ってくれないうえに、初年度は強制的に年間サポート4万円が必須とのため、
面倒になってeTypistをダウンロードで買いました。いったんは入金したのに、アホな会社ですよね。

455 :
>>453
現状ではそれファイル自体が鯖から消されてるからダウンロード出来ないよ。
いつダウンしたんだ?

456 :
>>455
ああ、そうなんだ。いや、まだダウンロードしてないんだ。
期限が2週間ってあったから、今の作業がひと段落してからと想ってたんだ。
じゃあ、体験版は無いんだね?
サーバーに削除したページのカスが残ってただけって事か。

457 :
確認してから書き込めよ、うぜえなあ

458 :
WinReaderのエンタープライズ版使ってる?

459 :
>>457
HPの管理ができてないメーカーに言えよ。
普通ダウンロード画面見つけたら、できると思うだろが。
このメーカーなんかイマイチだな。
読んでココがunicode対応してくれないかなー

460 :
>>459
自分の早合点をメーカーのせいにすんなよw

461 :
e.TypistってCUIで使えますか?

462 :
出来ないと思うよ。ヘルプにも載ってないし。

463 :
欧文のスキャンができるフリーのOCRソフト、Softi FreeOCRについて質問。
以前はhttp://softi.co.uk/freeocr.htmからダウンロードできたようなんだけど、
このサイトを見ると
>FreeOCR Notice
>FreeOCR has new owners and can be found at www.freeocr.co.uk
>We no longer have any downloads for FreeOCR so please do not email us.
とあって、どうやら持ち主が変わったらしい。
そしてリンク先のページhttp://www.freeocr.co.uk/を見ると
>FreeOCR V3 - Coming soon
とあって、最新版はまだダウンロードできないとこのこと。
以前のバージョンでいいからダウンロードしたくて、「download」でページ内検索かけるなどして
サイト内を探してみてもそれらしいリンクが見つからない。
いったいこれはどういう事情なんでしょうか。

464 :
質問させて下さい。
週刊誌の目次をスキャンで取り込み、文字検索できるようなデータベースに
したいと考えています。
OCRというのはこのような用途に利用できるものと考えて間違いないでしょうか?

465 :
間違いない

466 :
>>464
簡単にできるかもしれないし、できないかもしれない。
なぜならそれは目次のレイアウト次第。
最悪、がんばって手修正しまくれば大丈夫だよ。

467 :
>>466  有難うございます。
     以前、知人が英語等の外国語文書をスキャンして "word" だかに
とりこみ、データベース化したといった話をしていましたので、
もしかしたらできるかも、と期待したのですが、読み取り精度が甘い点など
難しい問題が残っているようですね。
スキャンしてPDFする商品がネット上でよく挙がっていますが、
それと文字検索などできるデータ化というのは別の話なのですね。

468 :
>>467
試しにAcrobat Reader(バカ高いAcrobatではない)でPDF(スキャンした目次)を
テキスト化してみてはどうかな。
「なんでそんな順序に並べるの?バカなの?死ぬの?」という感じのところもあるけど、
そのPDFがテキスト化できるかどうかの目安にはなると思う。
その後のデータベース化については、また別の問題。

469 :
データーベース化って難しそう。
単純に全文検索のほうが時間対効果が高そう。

470 :
目次程度ならOCRかけて修正するより、一から直に打ち直した方が早くないか

471 :
>>470
シーッ!

472 :
修正する手間があるから
OCRって使いどころが難しい

473 :
>>469  全文検索ができたらいいですが、できないんですよね(笑)
>>470-472 手打ちで入力始めましたよ、トホホ・・・

474 :
>>473
全文検索ソフトは何を使っているの?
つーか、画像はPDFとかxdwにしてないの?
JPGとかのまま?

475 :
>>459
見づらいとは思わないし
お前の確認不足だとおもうぞ

476 :
>>474
・全文検索ソフトは何を使っているの?
 まだ何も使っていません。「全文検索」という言葉の意味もよく分かってないレベルです
・画像はPDFとかxdwにしてないの?
 ネットのフェチ写真と同じ状態で拡大縮小ができるだけです(嘆)
JPGとかのまま?

477 :
>>476
JPGのままじゃどうにもならないでしょう。

478 :
>>473
官庁が配るような超シンプルな感じの文書型の目次だったらOCRほぼ効くよ。
ファッション雑誌みたいな懲りまくったレイアウトとか背景色や背景に画像があると苦手だけど。
検索はOSにもよるけどSpotlight知らないようだからWindowsかな?
Google Desktop使えばいいんじゃね?

479 :
http://yfrog.com/3xapr1401j
スキャンした結果、パソコンの中には上のような写真として保管されています。
これをどうしたら文字検索できるようになるか、って問題なのですが。
>検索はOSにもよるけどSpotlight知らないようだからWindowsかな?
Google Desktop使えばいいんじゃね?
ぐぐって見ます

480 :
>>479
縦組みとか、怪しげなフォントを使ってるとか想像していたけど、
これならOCRで楽勝(たぶん)。
テキストの順番で死んでもいいなら、Adobe Readerでも。

481 :
>>479
ちょっくらeTypistでテストしてみたよ〜
ttp://www.restspace.jp/cgi-bin/orz/img-box/img20090416222706.jpg
ほとんどレイアウトチューンせずにOCRした結果。
eTypistは前後の行より大きな文字とか文字間が大きな行が苦手なので見出しの類いがかなり弱い。
(神 と ネ甲 みたいなもんかと。たぶん1行/2行なのか1文字/2文字なのかわからなくなるんだと思う)。
テストして見た感じだと、毎号このようなレイアウトって決まってるんだったら
それを記憶させておけば毎回手動でレイアウトを調整してやる手間はかなりはぶけると思う。
本当はPDFで書き出したけど、うpロダがPDFを拒否ったので
zipに固めた上で拡張子を.pngにしたもはこっち。
ttp://www.restspace.jp/cgi-bin/orz/img-box/img20090416222822.png
PDFならファイル開いたらAcrobatなどでテキスト検索できるし、Google Desktopでも検索できるはず。
目次だけだったら1ファイルにページを追加していってPDFファイル内で検索した方がいいかも。

482 :
>>481
http://img57.imageshack.us/img57/2120/qooxospu.png

483 :
>>482
ワラタ
こういうのは初めて見たw

484 :
482に観月ありさという称号を与えたたえたいと思う

485 :
Windows用eTypist12.0で、なーんも考えずに解析させテキストに書き出してみた。
(年に数回使うだけなので辞書が鍛えられてないです)
PhotoshpやeTypistでノイズを取ったり、シャープにしたりすると多少は変わるけど、
そんな手間をかけて(ry
事痔愛特爆一轡事鮒’嘩
第69回皐月賞2
データカプセル(この10年の成績と傾向)6
東西スタッフの狙い馬8
出走予定馬の厩舎レポート10
クラシック血統アカデミー14
有力馬の考課表と完全データ15
..中出特溺、;i
京葉S卯月S鹿野山特別袖ヶ浦特別23
第11回中山グランドジャンプ
総武S鹿島特別山藤賞1
今週の狙い馬46
...眠神特別1
魏葛撫『カップ塗娼
淀屋橋S山陽特別はなみずき賞
今週の狙い馬67
福島特別}…
ラジオ福島賞米沢特別雪うさぎ賞70
奥の細道特別医王寺特別桑折特別
読物。_?「「一、、一.。.、.li
八方破れVol・719かなざわいっせい94
おもひでの名勝負・皐月賞阿部珠樹96
競走馬の心技体第66回平賀敦98
競馬ことのはVol・60島田明宏『’100
---------------------[End of Page 1]---------------------

486 :
みなさん いろいろ有難うございます
>>485  
こちらの成果を拝見して思いますに、わたくしの場合は
目次の中の全項目が必要ではないので、チェックと修正の手間を
考えますと、やはり毎週の手入力にてデータ化するのが良さそうです。
それについても、思いますに、ネットで様々な文書資料をサーフィン
しておりますが、あれらも、みな どなたかが最初に手入力して下さった
恩恵なのですね。
OCRの更なる向上が待たれます

487 :
>>486
まさかと思うが、その雑誌、Webに毎号の目次だけでも掲載されてないか?
だったらそれをそのままPDF化して(ry

488 :
>>487  あったまいいですね〜!

489 :
>>487  ありましたよ〜! ただ大分大まかな記載なので自分で足すことに
なりますが、それでも大変作業が軽減されました。感謝です!

490 :
OCRじゃないけどpdftotext惜しい・・
adobeはなぜコマンド提供しないのか

491 :
OCRって誤認識あるから
使いどころが難しいな。。。
なんかいい使い道ない?

492 :
>>491
政治家の著作を引用するときとか

493 :
OMR

494 :
キャノンの複合機 MP-610 に付属の 読取革命 Lite から、製品版にアップグレードできるみたいなので、読取革命 Ver.13 のバージョンアップ版を買おうと思う。
今は、読んdeココ Ver.13 を使ってて特に問題ないんだが、エーアイソフトを吸収したエプソンは読んdeココをバージョンアップする気はないみたいだから、これからのことも考えてね。
5千円ちょっとで買えるしね。

495 :
予言しとくと




まちがいなく後悔する!!

496 :
読み取り革命って悪くないよ

497 :
>>494
同じ事を考えて最新の体験版をインストールしてみたが、
64bitのOSには対応してないので使えなかった。今時64未対応てw
同梱版のLiteのほうだと64bitでも普通に使えるんだな、これが。
安いLiteで対応してるなら当然製品版も大丈夫だろうと思いきや、危ない危ない。買わなくて良かった。

498 :
WinReaderPROの体験版を使ったあとにe-typistを買った。
認識率に差がないんだけど…

499 :
>>498
同じメーカーだし全く同じかは知らないけど似たような傾向になるのは
当然。

500 :
>>499
値段が20倍違うのにね。

501 :
>>500
そりゃ、高い方はそれで商売だ出来る機能を持ってる。でも認識率が
20倍ってわけじゃないのはわかってるはず。特にそんな個人が使わな
いような業務向けのソフトを買うような人や会社は。

502 :
認識率が50%Upなら20万円だしてもいいんだけどね。
e-typistは下線が巨大な「一」になったりして困ってるし。

503 :
>>502
一般に売ってる e.Typist 読んde!!ココ 読取革命 は体験版があるから
他のを試したらどうですか。

504 :
>>502
事前に消去すれば?

505 :
現在は読取革命13ですが近々アップデートする可能性はあるでしょうか。
Windows 7 も出るようですし購入のタイミングに迷ってます。

506 :
>>503
e-typistが使いやすいし、文句をいいつつも認識力はなかなかのものですよ。
>>504
原本をいじりたくない事情がありまして。
PCを新調したらまたWinReaderの体験版を使ってみますよ。
で、OCR精度チェック用のファイルとかあると嬉しいのですが、どうでしょうか?
みんなでテンプレートを作って、主観によらない精度ランキングをしたいですね。

507 :
>>506
e-typist を使ってますか?体験版を落として使ってみたんだけどスキャナーで 600dpi で読んで
PDF を作ると何か文字が汚い。よく調べてみたら 200dpi になっていたんですが、どこの設定を
触ったら解像度を変えられるかわかりませんでした。もしよろしければお教えください。

508 :
>>507
俺もあれには驚いた。とてつもなく汚いんだもんね。
でも、俺はDocuWorks使いだから深く追求しなかったから、知らないんだ。
誰か、わかる人がいるといいね。

509 :
>>508
DocuWorks って e-typist の OCR エンジンと似たようなのが積んであると思いますが
ファイリングソフトだから範囲指定しての OCR とかスキャナで読んだ書類のゴミを除い
たりとかゆうような機能は付いてますか。

510 :
>>509
できるよ。エンジンはこれ。
DocuWorks6.0のOCRエンジンはたしか↓だったと思う。いま調べたけど資料が見つからないから間違っていたらごめん。
活字文書OCRライブラリ v.6.0 http://mediadrive.jp/products/library/katsuji/index.html 
性能は今一。それでも以前のVerはもっと酷かったw
で、いまVer7を調べたら『OCRエンジンは、「WinReader PRO v.12.0」、または「WinReader エンタープライズ」
(メディアドライブ株式会社製、別売)のいずれかを切り替えて使用可能。』だって。
あやうく、WinRederPROを買うところだったw Ver7へUpするわ。

511 :
>>510
という事は OCR ソフトに近い操作ができるんですね。自分はスキャナで読んで紙の周りの黒いところや
ゴミを取り除いて OCR と共に PDF にしてます。もしかしたら値段からいっても DocuWorks も購入対
象になりますね。

512 :
>>511
PDFよりはDocuworksの方が使い勝手がいいと思うよ。でも、普及していないのが難点。
そして出来ないこともたくさんあるはずだから良く検討してくれよ。
俺が恨まれても困るからね。あくまでも自己責任でどうぞ。

513 :
読取革命13のバージョンアップ版を買ってインストールするには複合機についていた読取革命 Lite
を実際にインストールしないとバージョンアップ出来ないようですが、Lite 版じゃないように実際にパソ
コンにインストールしないで認識させる方法はないのでしょうか。例えば仮のPCにインストールして
その実行ファイルがあるフォルダをCDに焼きそれを認識させるとか。

514 :
英字に強いOCRソフトってないでしょうか?
本格読取ではあんまりでした。

515 :
全部英文なのか、混在しているのかで変わってくると思うが

516 :
アメリカの製品は英字に強そうだけど、どうだろうか?

517 :
>>515
全部、英字です。
アメリカの教科書なんですが。

518 :
abby finereader
omnipage
つかググレ

519 :
PDF文書内を検索しようとしたら、日本語環境で作ったPDFじゃないようで透明テキストが日本語じゃない。
仕方ないのでOCR(読んでココ)に取り込んでPDFで出力したら、目次からのページリンクが消えてる・・・
リンクとかは残したまま、透明テキストだけ日本語にOCRできないだろうか?

520 :
読取革命13の体験版使ってみた・・・エロイ人に質問。
認識後の表示倍率が数%になってしまい、必ず表示倍率を上げないと結果がろくに見えない。
数枚なら問題はないが、大量に処理する場合手間がかかってしょうがない。
認識直後の表示倍率を設定・固定する方法はないだろうか?
B5(縦長)・360dpi・横に分割して表示・の条件で、6%になる・・・・読めない。
(縦に分割でも14%。)
読取革命12体験版を使った記憶では、認識直後の表示倍率は結構大きかった記憶があり、通常はそのまま認識結果のチェックが出来た。

521 :
>>520
自己解決・・・・設定項目発見・・・・・。
こういうなんでもないようなところでも、前と変われば使いにくくなる。
変える必然性がほとんどないところなんだから、バージョンアップしてもそのままでいいのに・・・・。

522 :
見出し認識も、12と比べ使い物にならん。
(同じ色の無地の白抜き文字に限りだが・・・。残してあった同じ原稿で確認。)
今回は大量に処理するので、使い勝手がよさそうなら買うつもりだったんだが・・・・。

523 :
複数の画像ファイルを一括してOCRできるソフトってないですか?

524 :
ふつうに売ってるOCRのほとんどがその仕様のはずだけど?

525 :
むしろできないソフトがあれば教えて欲しい

526 :
自炊スレから誘導されてきました。
新聞を画像ファイルとして取り込み、OCRさせたいのですが、
1面すべて取り込もうとすると手持ちのA3スキャナでも入りきりません。
大量にあるのでできるだけ時間をかけない方法を探しているのですが、
よい方法がありましたら教えてください。
試しに縮刷版を600dpiで取り込んだり、1200万画素のデジタル一眼レフで
撮影して読んでココに認識させたのですが、認識率はあまり高くありませんでした。
サンプル画像置いておきます。
http://www.dotup.org/uploda/www.dotup.org139794.zip.html

527 :
発行元に「データください」と言う。

528 :
A4サイズでスキャンして後で合成するか
段ごとにOCRかければ?

529 :
>>526
>縮刷版
もあるってことは現代の新聞ですよね?
大量だとどうやっても認識エラーの絶対量が多くなり、作業の手間が
馬鹿になりません。新聞はもともと印刷もクリアじゃないのでOCR
に向いた素材じゃないと思います。
>>527さんの言うように、デジタルでの契約を
する方がいいんじゃないでしょうか。但し、記事毎の販売になってる
ところが多いので10年分の1面の全記事とかなると今度は費用が現実
的じゃなくなるけど。


530 :
>>527
1年契約で236万円します・・・
>>528
それだと1ページで3分以上かかってしまうんですよ。
もっと短時間でやりたいのですが。

531 :
読取革命の体験版がをインストールすると、プロテクトキットが作動していませんとなります。
32ビットのビスタです。
なぜでしょうか?ご存知の方お教えくださいm(__)m

532 :
>>530
それがやっていいことかどうか非常に気に掛かるんだが、目的は何だ?
目的次第では236万円払ったほうが、256倍得かもしれんぞ。

533 :
>>536のサンプル画像が見られないんだけど

534 :
>>530
なんで小出しにしてばかりなの

535 :
>>532
訴訟用です。

536 :
訴訟用ならむしろ縮刷版のコピーのママのほうが良さそうに思うが、
まあ、テキストが必要というなら必要なんだろうな。
俺はもう降りるわ。何かしらんが頑張れ

537 :
(^^)/

538 :
>>535
ttp://www.kokuyo-st.co.jp/stationery/kws/caminacs_w/index.html
ttps://pi-b.jp/pi_f/?cid=kbs&fid=986212
もう一回誘導。試してみてADFスレでレポ求む。
A3でキャリアシートは反則だろ...

539 :
気の毒に……

540 :
最近質問者が聞いてないような余計なことを書いときながら
情報小出しって言うやつ多いよな。

541 :
分かりやすい質問者乙

542 :
サンプル画像が2時間以内に削除されたのは無視ですか、そうですか。

543 :
訴訟なら勝訴すれば236万円は必要経費として認められるということはないの?

544 :
そうしよう

545 :
読んdeココ13の体験版を使ってみて文字の認識率もいい感じなのですが、
「はばぱほぼぽ」を認識するときによく間違えられたり、「つ」と「っ」などの大文字と小文字の認識があやふやだったりすることが多いのです。
これは製品版になるとアップデート等で精度が向上していたりするのでしょうか?
もしそうならば購入を考えたいと思います。
どうかお持ちの方がいらしたら教えてください。

546 :
持ってないけど
体験版と製品版の精度が違うのはsmartocrくらい

547 :
すいません、教えてください。 フォルダの中におよそ200枚のファイルが入ってまして、
これをOCRにかけてそのままワードへ転写したいんです。
古い本でもはや絶版なのですが、P2Pで手に入れて喜んでいたのですがこれを、
横書きのワードで読みたいのです。
市販のソフトで、ファイルを一括で把握、中身の200枚のJPGを認識してくれるソフトは
ありませんか? いちいち手作業でやってたらとてもとても・・・。
よろしくお願いします。

548 :
ファイル一括登録、出力形式をワードにすればいいので
etypistでできる
ほかのocrでもできると思う

549 :
文書を本格読取2で読んでワード化したのはいいですが,変なレイアウトまで認識してしまい,
それを消去したり,編集したりできないのが不便。
何で,普通に編集できないんですか?

550 :
ワードだからでしょう。嫌がらせしか考えてないからなofficeの開発陣は。

551 :
>>550
ご教示ありがとうございます。
ということは,ワードの操作を幾らしてもこの枠は消せないということでしょうか?
ちなみに,ワードで保存を辞めてテキストで保存にしてもレイアウトは残ってしまうようです...
以前やっていたパワーバインダーではこんなことはなかったのですが...

552 :
>>549
「変なレイアウト」とは、例えばどういうことですか。

553 :
>>552
元の文書に「表題」 「署名欄」「日付」
などが,あると,その位置にレイアウトの枠が出来て,文字のテキストデータがその中に入ります。
長い文章はまとまって大きな枠に入るからまあその中で編集できるのですが,相手の書面部分など
は流用しないので,その枠自体を削除したいと思ってもどうしても削除できないのです。
その頁自体を削除しようと思ってもできないし,長い文章部分だけをコピーして他の文書データに
張り付けようとしても出来ない。
結局全部使えないのです。

554 :
>>553
×書面部分
〇署名部分

555 :
中国語に強いOCR教えて

556 :
>>555
山奥に住んでる16歳くらいのかわいい女の子の中国人を買ってくるといいよ

557 :
>>555
e.Typistは58カ国語対応をうたっているが、使い物になるかどうかはしらん
ttp://mediadrive.jp/products/et/

558 :
読み取り革命13と読んでココの価格差は大きいがどちらがよいか、誰か教えてください。読んでココは最新版はいつでるかも教えてください。

559 :
>>558
前者はこのスレの上の方にあったよ。後者はメーカーに聞くべし。

560 :
OCR読んでココについて質問させてください。
200枚のJPGファイルを一括して認識、その後で全ての認識文字を
一枚のワードかテキストで出力させたいのですがこのようなことは可能でしょうか?
通常ですと一枚ごとに一ページの出力で、合計200枚になります。
これでは200枚を全て手作業でペーストする必要があり大変です。
一つにまとめて出力できる仕様でしょうか? 利用しているソフトは読んでココです。
宜しくお願いします。


561 :
>>560
普段word転送はしないけど、試しにやってみたらできた。
200枚でできるかは試していないけど、複数枚(一応10枚ぐらい)一度に選択してやったら、一つにまとめて出力された。

562 :
>>560
eTypistは出来ると思うよ。テキスト形式で保存できた気がする。
ワード転送ボタンもあるから、直接ワード形式にも出来るんじゃないかな?

563 :
>>556
山奥に住んでる16歳くらいのかわいい女の子
自体の識字率が怪しい

564 :
>>560
今やってみたら、Wordに転送するときにレイアウト転送とテキスト転送の2つのモードが選べた。

565 :
読んでココ13を使用してるんですが、ファイルを読み込むときに
DPI値が足りないって出ます。
いちいち400×400に設定を戻すのですが、そのほかに自動で
DPI値を規定値にするやり方はありませんか?
100枚をいちいち手作業でするのはあまりにもしんどくて・・・。 
お願いします。

566 :
解像度変更君というツールで便利に使ってる。
「解像度 変更」で検索すると一番に出てくるけど。
読んdeココなら「解像度情報がないときは自動的に***dpiにする」みたいな設定なかったっけ。

567 :
>566さま
それやってみたんですけど、やっぱり前と変わらずDPI値の変換を聞いてくるんですよね。
解像度変換君を探してみます。
もうひとついいですか? 段落とページ番号を認識からはずす機能はついてますか?
ページ番号が誤認識、段落とせりふの部分はタブでひとつ下がって認識しています。
不便です。 削除できるやり方があったら教えてもらえませんか? お願いします。
早速探してみます。 ありがとうございました。

568 :
やり方はあるし567さんはたぶんすでにドキュメントスキャナスレであらかじめ答えを得てる。
即座のお礼よりも試してからうまくいった/いかなかった経緯を報告してくれた方が
同じことで躓いている人の役に立つかもしれない。

569 :
567ではないですがドキュメントスキャナスレってどこにあるんですか?
「ドキュメントスキャナ」で検索しても見あたりません

570 :
ああ、ごめん。
【ADF】スキャナで連続取り込み015.jpg【OCR】
http://pc11.2ch.net/test/read.cgi/printer/1251764366/
ScanSnap シリーズ総合スレ Part10
http://pc11.2ch.net/test/read.cgi/printer/1260207598/
【フラベ】本の取り込みに最適なスキャナ4【ADF】
http://pc11.2ch.net/test/read.cgi/printer/1227146432/
このあたりのスレの総称のつもりだった。

571 :
e.Typistで透明テキスト付PDFを作成すると、
画質がかなり落ちるんだけど
調整する方法ある?
文字の認識はこのソフトが一番いいんだけど・・・

572 :
507を見るとやっぱりみんな同じこと思うんだな
そしてクオリティーのコントロールは出来ないようだ
なんともいたしかゆしですなー

573 :
あの機能は何のためにあるのだろう?
PDFに対するアンチキャンペーンの一環かな?

574 :
読み取り革命の体験版探したら、生産終了だから体験版も公開終了なのね
それなら早く次のバージョン出してくれればいいのに
https://p3.support.panasonic.co.jp/p3/EokpControl?&tid=1119408&event=FE0006

575 :
>> 558
エーアイソフトに聞いてみた。
> <問合せ内容>
> 読んde!!ココ は2007年2月にVer.13になって以降、
> 次のバージョンが出ていませんし、他のソフトも
> 3年以上新製品がでていませんが、エプソン販売と合併した後は
> もうソフトウェアの開発は行っていないのでしょうか?
> 読んde!!ココはもう開発終了で次期バージョンは出ない
> ということでよろしいのでしょうか?
>
> <回答>
> この度は弊社製品についてお問い合わせを頂き、ありがとう
> ございます。
> お問い合わせですが、「読んde!!ココ」シリーズの新バージョン
> については、今のところ発売予定はございません。
> 簡単ではございますが、回答とさせて頂きます。
> よろしくお願い致します。
だってさ。

576 :
これよさそうだな
デジカメ写真からも認識する最新OCRソフト
「読取革命ver.14」を試す
http://www.nikkeibp.co.jp/article/column/20100118/205693/
http://panasonic.co.jp/sn/psn/pstc/products/yomikaku/

577 :
複合機で読み込んだTIFファイルを直接マウスドラッグで選択範囲を選んで
右クリックで文字か画像で読み取れるOCRソフトってあるんでしょうか?
職場異動で使っているパソコンで急に使えなくなったので
ショックを受けています。


578 :
今までの部署で使えてんならそのソフトを新しい部署で
買ってもらって使えばいいじゃない

579 :
しかし、マークセンスとかの
OCRソフトは簡単に作れないのかな

580 :
>>577
>急に使えなくなった
のは何がですか?

581 :
e.Typist12ですがスキャナの解像度を600から400以下くらいに落とした方が
認識の精度があがりました。表示される画像に違いは無いように感じられるのですが
みなさんはどうですか?

582 :
読取革命liteが手元にあるから、新バージョンにバージョンアップしようと思ってるんだけど
liteの認識精度がいまいちだ。読ませたデータの場合、e.typist12の体験版のがいい。
でも、安いし買うしかないかな。

583 :
>>575
>>576
読んde!!ココ Ver.13 を使ってるけど、エプソンは実質、捨てちまったみたいだね。
じゃあ今度、Ver.14 になった読取革命を買ってみようかな !?
定価は \12,800。 http://panasonic.co.jp/sn/psn/pstc/products/yomikaku/shopping.html
乗換版があってもいいと思うが・・・

584 :
>>581本来は解像度が高い方が認識率はよくなるんだけど、高くなるとゴミも拾うのでね。
結局適度な解像度ってのが、たいがい400ぐらいになっちゃう。

585 :
>>584
なるほど。一見綺麗に印刷されていてもゴミを拾うんですね。

586 :
もう少しいうと、目に見えないほこりの影を拾うのでしょう。
モノクロコピーすると、黒い斑点が結構ついたりしますよね。
蛍光管の光が埃の蔭を際だたせるのです。
プロの印刷屋がモップみたいなので原稿を拭くのはそのためです。

587 :
>>586
なるほど。
あと、裏写りも無視できないですよね。
ハードカバーの小説でも透けて見えるのに
紙の薄い雑誌なんかてきめんですから。
本日180ページくらいの小説を一冊スキャンしました。
e.typst12は本当にビックリするくらい認識してくれるんですけど
ルビの処理ってどうやってますか?
私はテキストを普通に表示できる携帯音楽プレイヤーで読むつもりなんですけど
できれば青空文庫形式みたいに「漢字(かんじ)」みたいな形式にしたいんですけど
うまい方法が見つかりません。

588 :
>あと、裏写りも無視できないですよね。
>ハードカバーの小説でも透けて見えるのに
>紙の薄い雑誌なんかてきめんですから。
裏側に、黒い紙(自分は百円ショップで買った黒の画用紙を使用)を乗せてスキャンすると、裏写りはかなり減少する。

589 :
>>587えっ?ルビ挿入できませんか?
確かメニューバーにルビの項目があるんだけど。

590 :
>>588
なんと!
>>589
おお、そうでしたか。悪い癖でマニュアルやヘルプなど一切読まず
直感のみで色んなものを使うので。
早速チェックしてみます。

591 :
> 悪い癖でマニュアルやヘルプなど一切読まず
> 直感のみで色んなものを使うので。
×悪い癖で
○馬鹿だから

592 :
>>591
し、失敬な!ヽ(`Д´)ノプンプン
「情弱」と呼んでくださいヽ(°▽、°)ノエヘヘヘヘ

593 :
読取革命14楽しみ。

594 :
早く体験版を使いたいなー

595 :
ちん

596 :
複数台にインストールできるの?

597 :
>>594
体験版着てた。
OCR前のツール類でOCR専用データを作って読ませれば、精度に不満はなさげ。
自分は検索用PDFを作りたいだけなので。updateすれば4500円くらいだし。
英語の認識は、さすがにabby完璧だった。日英混同文とかレイアウトが複雑なのは試してない。
一括画像処理で、トリミングとかをやってほしいんだけど出来ないんかな

598 :
デジカメで文庫本を撮影し読取革命で取り込んだのだが、せいぜい60%しか認識しない。

599 :
デジカメ取り込みは難しいね

600 :
>>598
6割ってことはない。レイアウト認識が崩れてるんでね?
きちっと撮った奴なら、ほぼ完璧になるよ。
複数画像を読ませたときのページ選択ウィンドウのXをおしたら
ウィンドウが消えたのは良いんだけど、表示させる方法がわからない。
ヘルプ見てもわからん。

601 :
わかった。解決。
F9押して、小説ってのがあるからそれでやるといいかも。
レイアウト認識を自動にすると、横書きで判断して結果がボロボロになる。

602 :
きちんとしたスキャナで程度の良い本をスキャンすると
認識率はデジカメよりずっと上がるよ。
本をテキスト化するならそれでも間違いだらけで厳しいと思うのだが。

603 :
e.Typistを超えたかもね

604 :
体験版入れてみた。
横書きの認識はすごいね。
縦書きだとちょっと化けるけど
凄いと思う。

605 :
「読取革命」のMac用はないんだね(泣)

606 :
e.Typist12なんだけど、画像がちょっと斜めになってると途端に読み取りが悪く
ならない?普通の厚みの単行本のある程度ページめくった部分をスキャンしたら
斜めになるのは仕方ないんだけど。このソフトの画像修正だとそういう微妙な
画像の回転とか汚れの除去(ページの真ん中の黒くなってしまう部分とか)が
やりずらいから、いったんフォトショップとかで連続スキャンして画像を修正してから
e.Typistに読み込ませた方がいいのかな?

607 :
傾き補正って自動でできなかった?

608 :
e.Typistって厚みのある原稿には弱いよね
一番いいのは本をバラス

609 :
和文縦書きの書籍で、所々に英文が(90度回転して)挿入されている
文章を自動的に認識してくれるOCRソフトってありますか。
現在使っているe.Typist10の和英混合の認識設定ではできません。
(文章が横書きの場合のみ認識可)
精度はともかく、現在そういう機能のOCRソフトはあるでしょうか。

610 :
>>607
あーなんていうか、見開きでスキャンして片方だけが微妙に斜めになってる
場合あるでしょ。まっすぐな方は問題無く認識するんだけど、ちょっと
斜めになってるだけでほとんど認識しなくなるんだよね。
普通の厚みの本でも多少はななめっちゃう。
あとノンブルも消したいんだけど二百枚とかの画像をなるべく手軽に
修正できるソフトってないのかな。

611 :
scan tailor。クロップとか傾き補正とか
ページ分割とかdpi変更とか出きるよ。日本語メニューじゃないけど。
元画像とは別に加工した画像を作る。

612 :
読取14使って罫線、英語、数字だらけの報告書読み取ってみたが、
識字能力はまあまあ、、表識別能力もまあまあ、
ハイパーチェッカーの使い勝手は良し
数字入力箇所だけのセル再現は、表編集モードで
らくちんでギリ合格
10800円ならこんなもんだろ。

613 :
scan tailorって知らなかった
教えてくれてサンクス

614 :
読取革命の体験版、おおむね満足なんだけど
縦書きで書かれた
> 14 ←
> 日
こういう半角数字の読み取り力が弱い
文字の分離、辞書等もうまくいかない
●14を1文字として認識させ「14」を登録しようとしたが2文字はダメと蹴られた)
●左右分割が出来ず。(「14」の上半分と下半分を分割しようとする)
・・・と思ったが、ヘルプ見てみるとCtrlキーで縦横切り替わったw 恥かくところだった
とはいえ、分離画面で常時表示するようにした方がいい気がするなあ
チラ裏スマン
まあ、縦書き半角数弱いのは確か
今後に期待

615 :
scan tailorすごい。
ところでページ分割すると順番が入れ替わってしまうよね。
これってちゃんと元の順番にする設定ないの?
ググっても全然情報ないし、そもそもヘルプファイルが無いよね。

616 :
>> 615
右綴じの本こと?
Project作成ダイアログで、"Right to left layout (for Hebrew and Arabic)"
にチェック。

617 :
>>616
なんとそうだったのか
早速試してみます
それにしても読取革命14すごい。eTypist12でだめだったのがガンガン認識できる。
スキャン画像と認識文字の比較もこっちの方が見やすい。

618 :
どえらい革命だな

619 :
>>616
バッチグーでした。ScanTailorものすごいソフト。
ところで読取革命レイアウト認識が1ページ丸ごと認識してくれればいいのに
ちょっと文字が離れてると別の四角で囲まれて、認識結果も別れてしまうので
いちいち「認識」→「結合」をしないといけないので面倒くさくない?
ヘルプ読んでもうまいことレイアウトを設定する方法が分からない。
数ページ程度ならなんてことないんだけど普通の小説一冊でも四百ページとか
あるからそうとうかったるい。

620 :
apiか何かで操作できればね

621 :
読取革命。e.Typistでごく普通にできた、本文中へのルビ挿入。
「漢字《かんじ》」みたいなの。ができないみたい。そもそもヘルプで「ルビ」
で検索してもなんも出てこない。俺の最終目的は音声読み上げソフトで録音して
mp3プレイヤーで聞く。ことだからルビあったほうが都合がいいんだよね。

622 :
>>621
e.Typist最強神話が崩れたか、じゃあ「読取革命」を試してみるか、
と思った矢先の不具合報告。(ありがとう)
ルビが出ないとなると、DTPには致命的と言えるかもしれない。

623 :
あと読取革命は「ッ」が全く認識できないね。
e.Typistだと楽勝なのに。
やっぱまだまだe.Typistの方が認識においては上だね。
校正画面とかは読取の方が使い易いと思ったんだけど。

624 :
名刺読取革命の方はだめだめっす

625 :
私は問題集などをテキスト化して利用してるのですが今のところ文字の全体的な
認識は読取革命が高いと思っています。上でルビの話が出ていましたがやはり
利用目的によっては向き不向きがあるのかもしれません。
ちなみに音声化はソフトとか使ってるのですか。音声化ソフトって使えますか。

626 :
やっぱ読取革命14だめだわ。
現時点ではeTypist12の方が総合的に勝ってる。
体験版でダメな点がわかってよかった。
音声化ソフトは「棒読みちゃん」が個人的には好きだな。
eTypist12の読み上げ機能でもいいかもしれないけど。

627 :
総合的・・・?
結局どういう革命だったのよ

628 :
>>627
例えば普通の小説なのにレイアウトが細かく別れてしまって、いちいちレイアウトを設定しなおさないといけないとか
ルビに対応してないとか。

629 :
小説向け、雑誌向け、新聞向けとかに調整してあるのが
デフォルトであるといいのにねえ

630 :
デフォルトであるんだけどねぇ

631 :
へえそうなんだ

632 :
スキャンして紙の縁が汚れたりする事があるけど
これを綺麗にするのは読取革命が一番やりやすかった。
PDF にする場合ね。

633 :
>>632
詳しく
しかし画像修正ならOCRソフトじゃなくてグラフィックソフトの分野じゃないか。

634 :
>>625読取革命でとりあえず読ませてみれば?

635 :
>>632
OCRの認識とは別の話になりますが上に書いたとおりの事です。
文書をスキャンしてPDFにする時、よく紙の縁が微妙に黒く
なったりするのを消すのに画像編集モードとかにしなくても囲って
消すボタンを4辺分するだけです。グラフィックソフトとか大げ
さな話じゃないレベルの話ですが。

636 :
>>635
トリミングのこと?
それならソフト以前にスキャンの時に指定すべきことじゃない?

637 :
>>636
普通のトリミングでは原本とサイズが大きく違ってくるのでトリミングは
使いません。

638 :
>>637
ていうか、スキャンの時にページによってサイズ変えてスキャンなんかしないでしょ?

639 :
>>638
この人、意味不明

640 :
切れてしまった。637が書いたと思われる一連の言いたいことはなんとなく
理解できるけどそれに答えてるヤツのピントのずれ具合が意味不明

641 :
>>640
そうだな。お前が分かりやすく解説してやれよ

642 :
画像編集作業するなら認識領域指定のテンプレート使う方が百倍楽だ。

643 :
>>642
認識領域とは別の話です。認識は別として PDF にする場合の
編集について書いただけです。

644 :
画像のままPDFにするんでしょ?
それって普通にスキャンしてそのままPDFに変換すればいいんじゃないの?

645 :
もういいじゃない。もっと有意義な話しようぜ。
なんでスキャナーに陰毛が入り込むんだ?

646 :
>>644
その画像の編集が読取革命が楽って話。

647 :
>>646
kwsk

648 :
つまり、スキャンした画像のゴミ取りが、ほかの例えばe-Typistなどと比べて
「読取革命」だと楽チンってことだよね?

649 :
>>648
似たような機能はどのソフトにもあるけど読取革命が
画像編集へのアクセスが簡単で操作もわかりやすいと思う

650 :
「e.typist 12」も「読んde!!ココ 13」もVista発売初期のままで小手先だけ
修正しているから、7だけであっても64bit版Windowsへの対応という面では、
「読取革命 14」に軍配が上がる。複合機バンドルのLite版からのUPGはUPG版を
買えばいいという点もありがたい。買った複合機にLite版が入っていれば即
最新のVerにUPGするのに5,000円でおつりが来ることもある
(最近のUPG版は発売後に値上がり傾向にあるが…)。

651 :
上で散々言われているが、ルビが扱えない読取革命14はかなり不利。
e.Typist12で当たり前にできる機能なのにちょっと残念。
あと認識領域が変な形になって、いちいち領域設定を手でしないといけないでしょ
読取革命。あれも何とかしてくれないと使い物にならない。

652 :
e.Typist12も認識領域はひどいよ。
下線付きの文章が巨大な「一」と認識されることが多い。

653 :
e.Typist12は傾いた画像の認識に弱かったけどScanTailor使えば無問題。
「ー」の認識はしょうがないだろうな。これが解決できてるOCRソフトがあったら
逆に教えて欲しい。
読取革命よりはマシだと思う。全体的に手間が少なくてすむよ。
ま、体験版で試してみて、自分の目的にあってる方を選べばいいんじゃない。

654 :
読取革命はバージョンアップされた(=まだ開発が継続されてる)点だけでも十分に評価対象だわ。
どうにも見捨てられたっぽい読んde!!ココ使いとしては。

655 :
読取革命は工作員がいるだけでも評価対象外だな

656 :
>>655
>読取革命は工作員
だまされとところだった。ありがとう。

657 :
e.Typist12が作る透明テキストpdfが破損しまくりなんだけどなんなの?

658 :
メディアドライブに聞け

659 :
OCRで、ついでにPDFに目次とか自動で付いてくれるようなのない?

660 :
むちゃ言うなよ

661 :
>>659
ttp://www.antenna.co.jp/mpd/

662 :
>>661
見当違い

663 :
読取革命って
手描きでも認識しますか?
数字しか読む必要ないのですが。
それと、iPhoneなんかで数字だけQRコードみたいに読めるアブリってあるでしょうか?

664 :
しない

665 :
>663一行だけなら。

666 :
> 読取革命って
> 手描きでも認識しますか?
体験版で試す

667 :
>>661
3は出ないまま開発中止っぽいな。
ワープロ専用機とFDの時代が去ったコンバータ20もしかり。
64bit版WindowsとかWindows 7に非対応では話にならない。

668 :
>>571
ツール→環境設定→認識結果の保存 で「きれい」にすると
普通に見える。
ただ、もとが文庫1ページ取り込んだtif画像1枚(110KB)+テキスト
なのにPDFが1.5MBになってるのが気になるが…… コンパクトだと71KB。
せっかく白黒にしてるのにjpgかなにかで格納してるっぽい。

669 :
1.5MBで何がいけないんだ?

670 :
文庫1冊400MBでも気にしないのなら別にいいんじゃない。
でかいとメモリーカードに入れたりするときに
あまり入らないし時間かかるのでなるべく小さいほうがうれしい。

671 :
なんだバカか

672 :
手書きで書いた自分の名前を認識させたら、ちゃんと読んでしまった。
オレの手書きすげえ。

673 :
>>672
OCRソフトは何を使ったの?

674 :
>>672
そっちかよw

675 :
>673>674
読取革命で、TSUTAYAのカードの裏の氏名欄を読ませたんだけど、条件が合ったのかねw

676 :
読取革命か。docuworksで使えたかな
DocuworksのOCRもだいぶマシになったけど使えるレベルじゃないんだよな

677 :
DocuworksのOCRってエンジンはe.typistと基本同じじゃ?

678 :
それはまだまだOCRは糞ということ?

679 :
>>676-678
DocuworksのOCR機能だが、OCRソフトそのものではないので、
最新のエンジンを積んだOCRソフトが別途いるはず。
読取革命はDocuworksにも対応しているので安心。
両者ともに「Windows 7 x64」に正式対応してるので。

680 :
>>679
OCRエンジンは、「WinReader PRO v.12.0」、または「WinReader エンタープライズ」(メディアドライブ株式会社製、別売)
のいずれかを切り替えて使用可能。
Docuworksの紹介に上の記述がある。


681 :
読取革命とe.typist体験版使ってみたけど精度はDocuWorksの内蔵OCRと大して違わなかった
ファイルに変換できたりするのが便利なんだね。あれは

682 :
>>680
内蔵OCRの代わりにはならないんだよね。一応読取りは出来た。保存が出来るかどうかは試さずに消したけど

683 :
あとe.typistの名刺読取はちょっとよかった(読取革命の名刺ソフトは糞)
角度がグチャグチャの複数枚を水平に読み取ってくれる上に会社名、名前がそれぞれの項目に割り振られる
肝心の管理ソフトが洗練されてなかった。
たかが名刺探すのに画面占有して欲しくないわ。
で、検索も糞。今時項目決めて検索とかね

684 :
でもOCRって、取り込むときのテクニックや経験が必要だと思わない?
写真なんかもそうだけど、原稿置いてパタンではよい結果は生まれないよ。

685 :
単に機械がいまだ発展途上で不便だから補わないといけないだけじゃん
原稿おいてパタンで読み取ってノイズ除去から傾き補正、同時にOCRまで完璧にかけてください
趣味じゃないんでね

686 :
OCRが糞なのは文字の種類が多いからか
英語なんか楽そうだもんな

687 :
FUJITSU ScanSnap S1500 FI-S1500

688 :
PDFを透明文字付き(読み取り文字の誤字を正したもの)で保存したデータを
PDF画像データと文字とに展開しながら読み取ってくれるソフトはありませんでしょうか
読取革命は再度画像データとして認識してしまうようですorz

689 :
何を言ってるのかよく分からないが、以後中間形式を保存しておくようにすりゃいいんじゃね。

690 :
これのPro版使ってる人いる?
ttp://www.vector.co.jp/soft/winnt/business/se476818.html

691 :
SmartOCR lite = RealReader liteなのか?
GUIがそっくりだが

692 :
やらしく名詞ファイリングが、Ver10からアクチ付きになったじゃねーかよ。
メディアドライブ、お前もか!

693 :
今更だが
読んde!!ココ Ver.13.02 へのアップデートモジュール が8月9日付けで公開されてた

694 :
SmartOCR使ってダメダメだった・・。「時間」→「時問」や、
何故か色々な文字を「犬」と読み間違うことが多い
字が小さかったのかな
読み取り革命は小さくてもかなりいい感じで読んでくれるけど、製品版高すぎだな
大量の古い資料を一日で全部データ化したい、って場合ならこれ使えば正解だと思う

695 :
一万八千円だっけ?

696 :
未だにe.Typistを上回るソフトを見たことない。
斜め画像に弱いけど、Scan Tailor使えば無問題だし。
読取革命と違ってルビにも対応してるし。
バージョンアップしないのは、読み取り精度以外の部分はもう完成してるからじゃないかな。
読み取り精度をあげるのにすごい開発費かかるだろうし、OCRソフトなんてそんなに
売れるもんじゃないし。というバランスだと思う。

697 :
このところの自炊ブームなんかがうまく転がってくれたらいいんだけどな。
しかしタイミング悪いよね。各社がOCRにパイなしと判断して、
開発費削って切り捨てモードへの移行がほぼ完了したころに、
電子書籍が注目を集め始めるってのは。

698 :
>>697
自炊っても画像で閲覧してるでしょ。iPadやらiPadもどきの中華やら。

699 :
>>697
透明テキスト付きで画像固めたPDFが凄く便利らしいね。

700 :
>>699
透明の文字なんか読めるのか?

701 :
質問前にググると幸せになれる気がするが自分のうろ覚え知識を書き込み
透明テキストつきPDF
スキャンした画像にOCRかけて、
・スキャンした画像
・抽出したテキストデータ
を一つのPDFファイルにまとめたもの(1ページごとにそのページから抽出したテキストを埋め込む)
透明テキスト付きPDFを表示すると
@表示されるのはスキャンした画像(スキャンなので見た目は紙と一緒)
A画像のみの詰め合わせPDFでは無理だった検索機能が使える
(ページごとにOCR抽出したテキストが埋め込まれているため)
 (※ただし、OCRで抽出したテキストデータなので当然 誤認識はある。)
程度の認識かな(OCR認識したテキストを修正できるかは持ってないので知らない)
読取革命の体験版使ってみたんだが、縦書きの小説とかの領域認識がうまくいかなくて諦めた…
e.Typist v12を買おうと思ってたらv13が10月発売、ということで
発売まで買うのを我慢中(無料アップデート、といっても手続き面倒だし)

702 :
>>701
今のうちに買っておけ、どうせV13にはアクチが入るぞ!!!

703 :
http://mediadrive.jp/topics/2010/20101008et13.html
>その他 アクティベーションを行うためにインターネット接続環境が必要です。

704 :
アクチ情報ありがと
自分の環境的に58言語もいらね、e.Typist NEO V12 でいいや→NEOはアクチあり
v13にはアクチあるけどNEOと一緒だなー、とスルーしてた(e.Typist v12見てなかった)
利用予定は1台のみインターネット環境あり、なので問題ないと思うんだけど
e.Typist NEO v12 のアクチでPC乗り換えとかで面倒だった、なんて体験の人いたら教えてほしいです

705 :
scansnap用にOCR情報を集めたくてこのスレ読んでみたんだが、読取革命かなぁ?
etypistの「認識結果と原稿画像を同時に表示して修正できる」機能は魅力的だけど、
scansnapで大量に読み込む場合、こんな手作業での修正なんか出来ない
むしろ量をこなすなら読取革命の「フォルダウオッチャー」が魅力的
透明文字付きでないPDFもこのフォルダに置いておけば程度の差はあれ透明文字つきPDFを
作ってくれるんだろ?
scansnapはmacで使うことも多いからこの機能で文字認識を向上させたいなぁ

706 :
>>705
そこまで結論出てるなら、その通りにすればどうだ?

707 :
そんなこんなのやりとりを見ていると、誰が言ったか
「テキストデータは永遠に不滅です!」という言葉を思い出す。

708 :
やたら読取革命の宣伝書き込み見るんだけど、俺の気のせいかな…

709 :
scansnapのマニュアル見てたらscansnapOrganizerに同じ機能\があった>>フォルダウオッチャー
PDFのメタデータにscansnap用のキーワードが要るみたいだけどautomatorで追加したらちゃんと認識してくれた。
買わずにすみそう、ラッキー

710 :
>>708
工作員だのなんだのって、読んde!!ココのユーザーの自分から言わせてもらえば「書くネタがない」これだけだよ。
せいぜい>>693ぐらいで、ずっと変化ないんだもん、読んde!!ココ。

711 :
>>710
そのなんとかっていうのが何だかしらないけど、俺は「読取革命」をやたら
ヨイショする書き込みが多いな。と感じているだけ。

712 :
>>711
たとえばどの書き込み?

713 :
>705
ScanSnap1500をつい先日買ったばかりでまだ使いこなせてないけど
アクロバットの9がバンドルされてたよ
きちんと計測したわけじゃないのでアバウトだけど
380ページの文庫本をスキャンして58メガpdfにするのに20分くらい
そのあと全ページ文字認識させて透明テキスト付きにするのに1時間くらいだったかな?
認識率はこんな感じ
風の音は二様に鳴っていた。富士山頂の厳頭に衝突して起こす轟音と、観測所の遥か上空の
あたりで作り出させる鞭をふるような音である。風の呼吸と呼吸との間にしばらく続く間隙
があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引攫って行く。
※改行は原文まま 上記文章でルビが付いてるのは
 厳頭 がんとう
 轟音 ごうおん
 遥か はるか
 鞭  むち
 間隙 かんげき
 引攫 ひきさら
↓上記を認識させた透明テキストをそのままコピペ

がん・とうごうおんはる
風の音は二様に鳴っていた。富士山頂の巌頭に衝突して起す轟音と、観測所の遥か上空の
huちかんげきあたりで作り出される鞭をふるような音である。風の呼吸と呼吸との聞にしばらく続く間隙
ひきさら
があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引擦って行く。

714 :
風の音は二様に鳴っていた。富士山頂の厳頭に衝突して起こす轟音と、観測所の遥か上空の
風の音は二様に鳴っていた。富士山頂の巌頭に衝突して起す轟音と、観測所の遥か上空の
あたりで作り出させる鞭をふるような音である。風の呼吸と呼吸との間にしばらく続く間隙
あたりで作り出される鞭をふるような音である。風の呼吸と呼吸との聞にしばらく続く間隙
があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引攫って行く。
があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引擦って行く。
すごいね。「引擦って」が違うだけだ。1行目は入力ミスかい?

715 :
ごめん、二か所は俺の入力ミスだわ
「起す」「出される」も合ってて、最後の「引擦」は違って認識されてた
どうもルビのあたりで改行が変になる箇所が多々あるんで
今、ルビのない100円文庫をブックオフで買ってきて試してる
それとスキャンが20分?と遅いのは性能の低いネットブックでやったから途中でペースダウンした
ましな方のPCでスキャンしたら330ページを65メガのPDFに変換するのは5分で終了
今からOCR認識やるけど
アクロバットのアクティベーションをその遅いネットブックでやっちゃった…
そのせいでOCR認識が遅いのかもしれない

716 :
アクロバット、やっぱ時間かかる
328ページのOCR認識の透明テキスト化に1時間20分かかった
朝日文庫「日航ジャンボ機墜落」の14ページ目をOCR認識させて、比較してみた
ttp://www1.axfc.net/uploader/Sc/so/155207.jpg&key=123
上から順に
・原文
・Adobe Acrobat 9 Standard
・JUST PDF データ変換
12日午後6時4分 東京・羽田空港18番スポットで乗客を乗せた日航123便(機体番
ロ日午後6時4分東京・羽田空港問番スポットで乗客を乗せた日航123使(機体番
12日午後6時4分 東京・羽田空港18番スポットで乗客を乗せた日航123便(機体番
号JA8119)は、前輪にとりついた牽引車に押されて後退を始めた。車輪が動き始め
号JA8119〉は、前輪にとりついた筆引車に押されて後退を始めた。車輸が動き始め
号JA8119)は、前輪にとりついた華引車に押されて後退を始めた。車輪が動き始め
た時刻が出発時刻と決められているから、同機の出発は定刻の六時より四分遅れだった。
た時刻が出発時刻と決められているから、問機の出発は定刻の六時より四分遅れだった。
た時刻が出発時刻と決められているから、同機の出発は定刻の六時より四分遅れだった。
どの航空会社も十五分以上になって初めて「遅れ」とみなすので、日航123便はこの日
どの航空会社も十五分以上になって初めて「遅れ」とみなすので、日航123便はこの日
どの航空会社も十五分以上になって初めて一'遅れ」とみなすので、日航123便はこの日
「定時出発」したことになる。6時11分20秒離陸許可。三時間十五分ぶんの燃料を積んだ
「定時出発L したことになる。6時U分初秒離陸許可。三時間十五分ぶんの燃料を積んだ
「定時出発」したことになる。6時11分20秒離陸許可。三時間十五分ぶんの燃料を撒んだ

717 :
総重量二百三十九・一九三トンのジャンボ機は、長さ三千百五十メートルのC滑走路を走
総重量二百三十九・一九三トンのジャンボ機は、長さ三千百五十メートルのC滑走路を走
総重:'-l'二百三十九・一九三トンのジャンボ機は、長さ三千百五十メートルのc滑走路を走
り、時速約百六十ノット(約三百キロ)で離陸した。離陸時刻午後6時12分20秒。同機に
り、時速約百六十ノット(約三百キロ)で離陸した。離陸時刻午後6時ロ分m秒。問機に
り、時速約百六十ノット(約三百キロ)で離陸した。離陸時刻午後6時i2分20秒。同機に
とって一万八千八百三十六回目の離陸だった。好天、気温二九度。南西の風約八メートル。
とって一万八千八百三十六回目の離陸だった。好天、気温二九度。南西の風約八メートル。
とって一万八千八百三十六回目の離陸だった。好天、気温二九度。南西の風約ハメートル。
航空管制は離陸までが空港ビル屋上の管制塔(タワー)が担当し、離陸すると七階のI
航空管制は離陸までが空港ビル屋上の管制塔(タワ|)が担当し、離陸すると七階のI
航空管制は離陸までが空港ビル屋上の管制塔(タワー)が担当し、離陸すると七階のI
FRルーム(レーダー室)に引き継がれる。そして、飛行機が巡航高度に達すると、所沢
FRルlム(レーダー室)に引き継がれる。そして、飛行機が巡航高度に達すると、所沢
FRルーム(レーダー室)に引き継がれる。そして、飛行機が巡航高度に達すると、所沢
にある運輸省東京航空交通管制部(ACC)が受け持つことになっている。日航123便
にある運輸省東京航空交通管制部(ACC)が受け持つことになっている。日航l23便
にある運輸省東京航空交通管制部(ACC)が受け持つことになっている。日航123便

上記みたいに文庫小説みたいな単調な文はほぼイケるみたいだけど
新聞やカタログの様に文字の大きさがバラバラで
記事が各所に配置されたりするのは
とても使い物にならなかった
変な記号に変換されまくりで認識できたのは半分くらい

718 :
これ、原本は両方とも縦組み?

719 :
大昔の、戸籍の誤記、活版や写植の誤植のような問題が再燃するね。
うかうかしていられないぞ。

720 :
>718
縦です
>>716に変換した画像あげときました

721 :
>>720
原本ではアルファベットや丸括弧、1桁や3桁以上の連続数字は全角文字なんだね。2桁数字だけが半角。
重箱の隅を突くようなことを言ってすまん。

722 :
716,717 おおお斜めに見える

723 :
>>693
あら、最近のOCR事情はどうなってるかと思って情報収集に来て見たら、
読んでココはまだ地味に開発続けてくれてたのかw
まあ、文字認識の精度を上げるのは当然なんだが、
結局どのOCRだって誤認識はするわけで、最終的にはその修正編集作業がやりやすいか?ってことになって、
使い慣れたものがいいや・・・ってことになるんだよな。
ところで読んでココの中間ファイルでの保存なんだけど、
これって取り込んだ画像1枚単位でしか保存できないのかな?
複数ページ取り込んでも、1枚ずつしか保存できないから面倒なんだよね。
エーアイソフト頑張れよ。

724 :
ところでPDFの透明テキストを修正編集(誤変換や貼り付け位置まで)できるフリーソフトない?
見当たらなかったんで、OCRのPDF作成機能を使ってるんだが、
直接いじれたほうが便利なときあるんだよな。

725 :
QRコードが記載されたPDFファイルを指定すると、
ファイル内のQRコードを読んで、テキストに出力する
OCRソフトって無いですか??

726 :
>>724
やらしくPDFに文字入力

727 :
読み取り革命は、かなり使える。

728 :
>>727
本当?具体的に!

729 :
>>728
いつもの工作員だよ('A`)

730 :
e.Typist13、評判どうなのでしょう?
12に比べて、使い勝手とか向上したのでしょうか?

731 :
>>268
>読取革命はいいよ。松下関連会社社員の俺が保証する。
>どのスキャナにもバンドルされてないのに・・・・
そうか?キヤノンの卓上プリンタ複合機MP450に、付属しておったがな。
複合機のスキャン機能は、松下用語ではスキャナには含まれないのか?
日本語・英語活字カラーOCRソフト「読取革命Lite」
http://panasonic.co.jp/sn/psn/pstc/products/yomikaku_l/

732 :
>>730
使い勝手はほぼ同じ
OCRエンジン部分だけを向上させたようですが、
使った感じでは、ほとんど変わりは無いようです

733 :
>>732
追加です
個人的に期待していたレイアウト枠の自動設定もほとんど同じでした

734 :
読んでココで、透明テキストpdfのフォント指定ってできる?
検索かけると明朝になってるのが気になる。

735 :
読み取り革命より、Adobeに付いてるOCRのほうが性能がイイ。

736 :
なんだかな。
eTypist Neo v13買ったんだが、
なんか笑うしかねーわ。
PDF入力、PDF出力で最終ページだけ認識して全ページを出力できないしさ。
だいたい保管のところでフリーズしまくりだよ。
もっとちゃんとしたソフトにして出してくれ。
Acrobat標準のほうが使いやすいわ。ハゲ!
返品したい気分だ。

737 :
「返品したいんですが」とメーカーに言ってみるのはどう?
返品は無理でも、バグ修正アップデートに繋がるかもしれない。
人柱さん、ありがとう。

738 :
少し使い方がわかって来た。
これ、認識ロジックは海外のものをそのまま移植してるだけだね。

739 :
しかし、透明テキスト付きで保管しようとすると、暴走するのはなぁ。
なんだこりゃ…
あと、pdfの読み込み遅過ぎ…。

740 :
読んdeココ試用版のDLが何度も中断される間に読取革命は試用テストまで終わった。
DL終わらないけどもう読取革命でいいや。

741 :
一応松下製なんだし
よんでここよりはいいと思うけど。。。

742 :
RealReader liteってなくなっちゃった?
ベクターから一部ページが消えてるし、ダウンロードできない。
開発元(http://www.kyodo-networks.net/)にも無いというか…。
つーか、ここの製品情報の中のメニューの日本語が変だw
「ソプとウェア構成」って何よwwwww

743 :
ソフトじゃないかもしれませんが質問です。
WindowsやOfficeに付いているプロダクトキーのバーコードを読み取りたいのですが、
このバーコードの規格は何になるのでしょうか?
と言うのも、手元にあるバーコードではいくらやっても読み取れないので、特別な規格を
使われているのかなと思った次第です。
(プロダクトキーとは別に付いているバーコードの方は読み取れます。)

もしくは、このバーコードスキャナなら読み取れたとか、画像に取り込んでからデコードでも構いませんので
読み取る情報を持っている方教えてください。

744 :
はやく、ルビー付文字をOCRで文字化けしないで正確に再現できるソフトつくってくれ!!!!

745 :
たぶん無理。

746 :
読取革命Lite ウィン7の64ビットで動くけど
ver.14のお試し版エラーが出て動かん・・
64ビットバージョンでも動くってパンフレットに書いてんのにw

747 :
> と言うのも、手元にあるバーコードではいくらやっても読み取れないので、特別な規格を
> 使われているのかなと思った次第です。
> (プロダクトキーとは別に付いているバーコードの方は読み取れます。)
単に海外の規格だから、あなたの手元の日本向けの機械では認識できないだけじゃないかな。

748 :
プロダクトキーのバーコードを読み取って何するの?

749 :
>>746
フィードバックしてなおしてもらえ

750 :
>>745
無理かも知れないが、分野によってはルビだらけだっりするし、ゆとりの増大でルビは
増える一方だから、対応できなかったらOCRソフトの未来は暗い。

751 :
できればそれに越したことはないのだけど、
表示するアプリケーションごとにルビの仕様が異なるのだから、
そこまでOCRソフトに要求はできないのではないかな。
ルビ文字をすっとばさないで「漢字(かんじ)」としてくれるだけで御の字だと想うよ。
その先はユーザーがエディタなり何なりでHTMLやXMLなどにして
それぞれのアプリケーションに読み込むしかないかな、と。

752 :
さみすいすれ

753 :
じゃあ、保守だけやってないで、ネタもってこいw

754 :
RealReader復活記念あげ

755 :
なにこれsmartocrのパクリ?

756 :
OCRって横文字しかスキャンしたことないのよね。
しかも大学の研究室でドイツ語の本20数冊全文やったから、数人がかりで何日もかかった。
日本語の識字率は悪いだろうけど、横文字なら案外いけますよ。
ただし数年前のソフトだからドイツ語のウムラウトを認識してくれなかったけど。

757 :
辞書も使えるしな

758 :
勢いでABBYY FineReader を買ったんだけど
フォントの設定がうまくできず、日本語OCRはほぼ完璧なのに
pdfに書き出しても、検索できない。orz
1ページず手作業でフォントを日本語に設定しなおせば良いんだけど
600ページの辞典と1500ページの医学辞書なので萎えている。
そんな人いませんか?いませんか。

759 :
続き)eTypist Neo v13のお試し版も落として試したけど
500ページ制限、変換精度は許せるとしても、ABBYY FineReaderより遅い。
それに完成したものをpdf書き出ししようとしたら落ちた。

760 :
それって手が後ろに回るようなことなのではないの?(今は手錠を掛けるのは前だけど)

761 :
そんな悶々としているより電子辞書買えばいいじゃない。6、7万でしょ。

762 :
>>760
意味不明。書籍の電子化サービスに頼んで、自宅でOCRを
かける、これのどこが違法なのか聞こうか?
>>761
電子化されていない辞典・辞書なんだけどな。

763 :
>>762
すまん。考え過ぎた。マジで謝る。
「フォントを日本語に設定」するアプリに「自動化」とか「マクロ」とかは無いのか?
JavaScriptで可能かどうかも検討してみては?

764 :
>>760
体験版がある

765 :
>>758
何か良い方法が見つかったか?

766 :
>>764
おそらく、アプリケーションのことではなく、「辞書を複製する」のを問題にしているのだろう。

767 :
ひたすら亀ですが、>>568さんの示唆するやり方がすごく気になります。
よろしければ教えていただけないでしょうか。

768 :
久しぶりにスキャンテイラー落として使ってみたら、日本語化されてて、
使い方が分からなくなってた。

769 :
>>746
最近ダウンロードペ−ジに
「体験版は、64ビットOSでは動作しません。 」と追加記入されてる・・・

770 :
PFU S1500+AC9STDを使っています。
AC10 の OCR性能が上がっているらしいのでUPGしようと思ったのですが、
UPG対象外でした。
AC10 は高いので別途OCRソフトを買おうかと考えています。
どこの製品がいいのでしょうか。
読取革命 Ver.14はでてそろそろ1年経つので 15 がでないかなぁ...
読んでココ は見捨てられている雰囲気がありましたが、最近の
自炊ブームで新バージョン出たらいいなぁ...

771 :
別にOCRが目的ではないんで使い込んではいないが、AcrobatXってそんなにいいかなあ
誤認識も結構あるし。
それはそうと、9STDからXはアップグレードの対象外なの?

772 :
>>771
9 Std →X Std ならアップグレード版でアドビストアのみならずネットショップ・量販店等でも購入可能
9 Std →X Pro or X Suite なら特別優待版でアップグレードすることになり、アドビストアでのみの取り扱い。

773 :
PFU の S1500のセットに入っている 9STD はOEM製品らしく
XへのUPG対象外だそうです。

774 :
RealReader liteなんてものがあったんだねぇ
いくつか試用したけれど、SmartOCRliteが一番合っていたので、これはうれしい

775 :
OCRの案内がロゴビスタから来たけど、なんか商品に魅力を感じないわ・・・
https://www.logovista.co.jp/LVERP/shop/ItemDetail.aspx?contents_code=LVRJA010W
https://www.logovista.co.jp/LVERP/shop/ItemDetail.aspx?contents_code=LVRJP010W

776 :
ロゴビスタからのメールは季節の挨拶がちょっと素敵。そんだけ

777 :
ジャストシステムから出た新しいやつはどうなのかね。

778 :
縦組みに対応した?

779 :
縦書きにも対応してるみたい

780 :
京都大のカンニング君がつかってる携帯OCRはすげーな

781 :
>>780
いや、あれはこういうのもあるよという参考として見せたもので、
彼の使っていたものではなさそうだよ。
わからないけどね、修正したのかもしれないし。
それにしても、明朝系書体は誤認識が少ないとはいえ、
ケータイであれは凄いね。

782 :
読取革命の新バージョンはまだか

783 :
>>782
俺はだいぶ待っていたが、しびれを切らして14購入。

784 :
>>782
>>783
自分もしびれ切れてきた。もう今年はでないのかなぁ...

785 :
読取革命は使えない

786 :
アクロバのocrを一太郎で補正する方が早いな

787 :
あれ補正できたのか…

788 :
沢口が好きな奴へ。
そういえばツタヤに沢口靖子が表紙のチラシが有ったから拾ってきなさい。

789 :
RealReader lite がまた消えている件w

790 :
>>788
誤爆だろうけど、もらってこようっと。

791 :
読取革命15まだかよ

792 :
d3

793 :
認識率のええ、活字OCR出てけえへんかな・・

794 :
e.Typistで我慢しとけ。

795 :
日本語だとetypist、読んdeココ、読取革命(、あとAcrobat?)
が有名みたいだけど、外国だとどんなソフトがあるんだろうか?

796 :
e.Typistは、レイアウト認識が×
あととんでもない文字化けもある

797 :
文句ばっかり言っていてはいけません。
欲しがりません勝つまでは。

798 :
ABBYY FineReaderってどうなの?
ttp://www.abbyy.com/

799 :
RealReader Lite 6.*.*ってSmartOCR Liteみたいに
どこかにないの?今ある7からはシェアウェア化…
機能制限ありでいいからフリー版が欲しいのにぐぬぬ

800 :
新たに出る「一発!OCR Pro7」って
開発:パナソニック ソリューションテクノロジー株式会社
開発協力・販売:株式会社ジャストシステム
って言うことは、実質「読取革命」の後継ソフトなんかな・・・

801 :
MacでOCR Xと言うソフト使っている人はいますか?
話題が出ていないのであまりよくないとか?


802 :
>>801
Macの人が少ないからでしょう。

803 :
>>802
こう言う世界ではMacを使う事は少ないわけですね。
ありがとうございます。勉強になりました。

804 :
だってMacなんて使うメリット無いでしょ。無駄にバカ高いし。
単なるApple信者のためのお布施マシンでしょ。

805 :
>>801
日本語を読み取るのに使うには使えない。英語なら十分に使える。

806 :
>>805
ありがとうございます。
今OCR Xをいれて早速そこにドラッグしてみたのですが、一瞬でconversion completeの表記が出ます。
次に実際にOCRが掛かったのか試してみると全く掛かっていません。
何か設定がおかしいのでしょうか?

807 :
>>806
テキストをスキャンして中に納めたPDFや画像データ(写真の中の文字)を読み取る場合は、ドラックではダメみたい。コピペすれば読み取る。
もし、英語の読み取りに使うならOCR Xよりも、Prismoが使い勝手が良くておすすめ。

808 :
>>807
英語を読み取るのに使うのでは無くてPDFに透明テキストをつけたいんですよね。
Prismoはそれが出来るのでしょうか?

809 :
>>808
話の流れから日本語のテキストを対象にしていないと感じたんでPrismoを挙げてみたんだけど、日本語には対応していないからそちらの要望の対象外みたいね。
透明テキストを付けるならAcrobatでいいでしょ。

810 :
>>795
どういう外国語か知らないけど、英語なら>>798が挙げたAbbyy一択だと思う。
とにかく素早く正確。
もっと幅広くいろんな言語ならReadiris一択。何せ100か国語以上に対応してるから
読み取れない言語はほとんどない。
どのソフト使うにせよ試用版で試してるのが賢明だけどね。

811 :
一発!OCR Pro7は読取革命14と比べてどうなんでしょう?
時期的には読取革命15が出てもおかしくない時期で
日本語メインならeTypist
外国語メインならAbbyyなのかな

812 :
>>811
君が買って、試してみてくれ

813 :
>>811
人柱求む

814 :
JUSTPDF2(Nuance)を使っていて、一発!OCR Pro7と読取革命14の比較できないです・・・

815 :
要するに、機能も何もかも足りなすぎるからグレードアップ望んでるのだろ

816 :
>>814
だから、買って試してみてくれよ。

817 :
悪い、試そうにも読取革命の英語エンジンが乗っていないようなので選択できない
http://www.justsystems.com/jp/products/ocr/
*1 パナソニック ソリューションテクノロジー株式会社調べ
※「一発!OCR Pro7」にはABBYY社製の英語OCRエンジンは搭載しておりません。

818 :
一発!OCR Pro7 の10日間 体験版ダウンロード
http://www.justsystems.com/jp/download/trial/ocr/?w=dl_t
使用感は読取革命14とほぼ同じ、さっき入れたとこなんで
とりあえずの報告です

819 :
レイアウト認識おいといて、
認識率もノーマルのままでは、たいして進歩していない模様

820 :
2・3回400Dpiの文庫本、やってみたけど
ノーマルでは、読み取り革命とほぼ同じ結果
結論としては読み取り革命持ってたら、買っても意味は無いかと・・

821 :
逆に考えれば、読み取り革命は不要ってこと?
そうはイカのキ○タマ?

822 :
818さんに触発され複数体験版を即興で試してみました
ファイル名の末尾でソフト名把握していただきたく
使用ソフトは
just
panasonic
abbyy
typist
http://www1.axfc.net/uploader/Sc/so/321642.zip

823 :
貼っておいてなんですが、適当に見繕った物が現代語辞書使うタイプは苦手な文章でした。
話題の、一発!OCR Pro7と読取革命14はほぼ同じ物でした。

824 :
>>823
僕もそう言う印象です
読み取り革命の誤読場所と、
一発!OCR Pro7の誤読場所が全く同じだったのもあると思いますが

825 :
abbyy11体験版
一発7体験版
typist12製品版
読革14体験版
http://www1.axfc.net/uploader/He/so/354880.zip
typist13を12の製品版入れていてインストールできなかったため一世代前の物になっています。
abbyy11はトライアル制限で1ページずつしか保存できなかったため、ページの区切り目は本来の物ではありません

826 :
scansnap

827 :
途中でかきこんじゃったよ。
scansnapで文字中心をpdfに変換して、全文検索に適してるソフトは
どれですかね?

828 :
適切なスレが他にないようなのでここに書きますけど。
http://www.sciweavers.org/free-online-ocr
i2OCRって使ってる人いますか?
オンラインで無料のサービスですが、グーグルブックスの英文を読み取って翻訳サイトに掛けるのに重宝してます。
いつの間にか日本語にも対応したようです。
このスレはビジネスの伝票とかで使う人が多いのかな?
でも、こんなのもあるよということで。

829 :
無料のPDF変換ソフトPDFMate Lite FreeでTE]T、HtML化などがほぼ完ぺき
軽いし有料の某A○○YY○○R製だと立ち上げ読み込み変換も遅く
複数言語入ってるといちいち設定しないと文字化けするけど
このソフトだと何の設定もせずに対応言語ならちゃんと文字が一瞬で抜き出せる

830 :
なんだ PDFMate Lite Free ってのは、Optical Character Recognition してくれるのか?

831 :
画像からじゃなくPDFの透明文字からだけ
PDFリーダーだとコピペが面倒だし
OCRソフトを立ち上げたりするより読み面倒じゃなくコピペするより早い
画像から文字列を抜き出すことは無理
透明文字の抜出は今まで面倒だったけどこれのおかげで作業がはかどるようになった

832 :
ウハッ マジレスサレタ

833 :
>>832
ちょと期待したじゃないか。バカバカバカ四月バカ〜

834 :
http://www.sourcenext.com/pt/h/1204/23_abbyy_m.html
春になったんで新しいソフトが出たようですが
ソースネクストなんで期待外れでしょう・・・

835 :
ABBYYはアルファベット外の言語は弱いぞ
ABBYYも載ってるPanasonicの買った方が無難に見える
それかTypist

836 :
「Scan Tailor」をお使いの方に質問です。
黒白モードの時はG4Fax圧縮とありましたがどうなっていますでしょうか。
どのパターンでもLZW圧縮になってしまい困っています。

837 :
グレースケールモードにしたらどうだろうか

838 :
>>836
結局は「ScanTailorPlus」の方で出力(G4Fax圧縮)できました。
その他に「scantailor-enhanced」というのもありましたが何がなんだか。
lzw, deflate, packbits, jpeg が可能なようなことも書いてありましたが
どうにも妙な動作で使いこなせません。
jpeg圧縮のTIFが出来たほうが助かるのですが・・・。

839 :
e.Typistてコマンドラインとかオブジェクトとかで操作できないんですかね。
MAC版はオブジェクトが載ってるんですが・・・・・・……

840 :
いきなりPDF for 自炊
http://www.sourcenext.com/product/pc/ikp/pc_ikp_000834/

841 :
Panasonicのエンジンの様ですし本家推奨

842 :
読取革命ver.15まーだー?

843 :
OCRは値段高い方が精度が良いと思てまうw
>>840

844 :
ライセンスの都合でそうなりますよね
読取革命のABBYY
e-TypistのNuance
それと、もう暫くしたらWin8が出ますし、それを見越しe-Typistは精度向上の無いVerUPを行い、Win8対応と謳った精度向上VerUP行うのでしょうね

845 :
一般的にOCRソフトって、日本語と英語ミックスドキュメントの場合、どちらかしかテキスト化できないものなのでしょうか。
ScanSnapやAcrobatはどちらかしか変換できませんでした…

846 :
できますん

847 :
>>846
ありがとうございます。
一番のおすすめ製品ってありますか?
旅行雑誌の自炊を考えてて、あんな感じの文字情報を検索できるPDFに変換できるなら嬉しいのですが…

848 :
読取革命かe-Typistのどちらかとしか答えられないかな、何故かというと、スキャン精度や方法・内容でベターが変わるので

849 :
日英混載でコスト度外視ならWinReader PROがベストでしょうね
WinReader PROという上限というか完全版があるからe-Typistは前にも書かれてますが精度向上が競合製品の後追いしか出来ない

850 :
>>847革命の方がいいと思う。タイピストはビジネス文書には強いが、レイアウトの複雑な雑誌等には弱い。
また縦書きの日本文の中に、横に倒した英単語が入った場合、タイピストでは完全に読み取らない。
まあ後は体験版で実際に試すしかない。

851 :
タイピストはちょっと画像が斜めだと全然読み取れなくなる。
ScanTalarで補正すれば問題ないけど。革命は読み取り精度低いから使い物にならん。

852 :
まったく情弱ですまんが、GoogleDocsにOCR機能がついてるんだな。

853 :
e.Typist v.14.0 アップグレード版、5000円弱やったので買うてしもた、
思うた通り、特筆する性能アップ無し
by 人柱

854 :
e.Typist斜めの画像に弱いのは相変わらず?

855 :
わざと傾けて試したけど、勝手にソフトで傾き補正する
その精度も良し、とりあえずの報告

856 :
ありがとう。じゃあV12よりは進化してるんだね。
俺もうpグレしようかな。

857 :
>>852
そうなんだけど、Googleにデータ渡すのが何となくイヤで試す気にならない。

858 :
どーでもいいが,読んdeが死んだ。
http://www.epson.jp/support/software2/misc/20120801.htm
■後継製品について
今回販売を終了する上記製品については、後継製品の発売予定はございません。

859 :
ただでさえ市場小さい上にライトな需要がEvernoteやGoogle Docsに行ったらもう商売にならないわって判断かな

860 :
終わったか。
使ったことないけど。

861 :
EPSONだったんだ。プリンターには入れるんだろうね

862 :
いやいやAIが喰われた時点で技術消失したろ。
Windowsエイトがでるから対応がメンドくせえって意味なんだろさ
ではバンドルソフトはどこの製品になるのやらw

863 :
結構いいとおもうけどなぁ〜
ところで激安中古ソフト屋さんでググると使えるソフトがかなり安い

864 :
通報されたくないし

865 :
OCRソフトって万人が使うもんじゃないから、バンドルさせて
価格が上がるくらいなら、外したほうがいい。という判断かも。

866 :
e.Typist v.14の新機能も、
・スマートフォン/タブレット連携
・外部クラウドサービス連携
・EPUB出力機能
と、OCRとは直接関係のないものばかりだし、
なんかこのジャンル全体に閉塞感が漂うね……。

867 :
オレはAIの製品を愛してたから、エプソンに喰われたときはがっかりしたよ。
微に入り細に入りのカスタマイズができる反面、簡単な操作もできた。
ここのSEさん、もう引退したのかなあ
エプソンのソフトウェアにはむしろ悪意すら感じてしまうw
e.Typistもインタフェースが全然変わらないんだよなくそのくせにwww


868 :
OCRは必要な技術なんだけど、スキャンの手間が最大の障壁として聳え立っている。
見開いてデジカメでパシャパシャ撮影して、歪みや傾きは自動で修正して完璧なドキュメントを出力。
そんなシステムだったら五千円でも買うぞ!

869 :
機能追加よりも、使い勝手をよくしてくれればいいのに。
よく使う操作はすべてマウスを使わないでキーボード操作のみで
流れ作業のようにできるようにしてくれればいいのに、どれもいまいち。


870 :
>>868
ちょっと趣旨から外れるけど
電気スタンドのようなものの下でページをめくるだけでスキャンできるっての、ある。
ttp://japan.internet.com/busnews/20120405/4.html
これ見ると本を押さえている自分の指まで写ってるんだよね。
自分でめくって読んでる気になる、リアル感のある電子書籍になるかも?

871 :
東大がやってた、ぱらぱらとめくると補正して、とかあったような気が。
5000円じゃ無理でしょうけど。2桁から3桁足りないだろうね。

872 :
>>870
マンガみたいに画像として読むならそれもありだよね。

873 :
これでも使ってろ
つ GT Text

874 :
900円のe.Typist Mobileで充分かも。
本読んでて、重要箇所に線引く代わりにスマホで写真撮って、
まとめてテキスト化したいだけだった。

875 :
その用途だと、これなんかどう?
サンワダイレクト、ハンディスキャナー
ttp://direct.sanwa.co.jp/contents/sp/400-SCN009/

876 :
>>875
かなり良い。
お値段もお手頃だし。

877 :
>>875
あんたは昨日までの俺か。
画像として取り込むだけならスキャナの方が綺麗だし、
OCRもあるのでいいと思ったが、日本語認識率80%なんてダメだろ。
しかもUSB接続でないと使えないから、本とスマホだけの手軽さにも劣る。
OCR機能が弱くてもいいなら400-SCN012BLの方がマシ。

878 :
そうなんだ。ちょっとよろめきかけたとこだった。

879 :
http://panasonic.co.jp/corp/news/official.data/data.dir/2012/08/jn120824-1/jn120824-1.html
15がWin8前に発売か

880 :
> OCR機能が弱くてもいいなら400-SCN012BLの方がマシ。
サイトを見たら、良さ気なんだけど、例えば文庫本とか小さいものは
ちゃんと読み取れるかな?
一枚の紙切れを真っ平な机に載せた状態なら、楽勝だと思うんだけど。
読み取り部が取り外せるファックスを持ってるんだけど、
結構読み取れるものが限られているので。

881 :
スマホ持ってたら、900円のe.Typist Mobileがいいと思うよ。安いし。
どうしてもスキャナー買ってみたいなら、それはそれで使えんことはないだろうが。

882 :
えっ
午前中14買ってしまったOTZ

883 :
角度さえ補正したら、デジカメで撮影したのもちゃんとOCRできるよね。

884 :
e.Typist、PDF画像読み込みの際、読み込みが最優先され、
画像読み込みの間、他の作業ができなくなる
読み取り革命はそういうことが無いのに、15早く出て欲しい

885 :
読み取り15どうですか

886 :
ところでOCRした後のテキストって読んだりすることありますか?
今だったらiPodとかAndroid端末で読んだりするんだろうけど、
やはり紙の本の方が読みやすいですね。
病院とか図書館とかでいきなりiPod見られないし(ケータイと間違えられそうで怖い)

887 :
OCR化の訂正時に、熟読して、しばらく立ってぱらぱら読み程度かな
IPADで読むのは、ほとんど漫画かもw

888 :
読取革命15ポチっちゃったw

889 :
>>886
パソコンでいじりまわして、最終的に本屋に並ぶので、買ってくださいw

890 :
ここをPDFにして某メーカの付録OCRで変換してみた。
「 読んでここ 」が
なぜか???

「 噛んでここ 」に・・・・・


891 :
wwwwwwwwww

892 :
読取革命15の第2水準漢字の認識は
古い書物をOCR化してると非情に助かる、途中報告です

893 :
そうですか。買いですか?

894 :
濁点「・・・」棒線「ー」は、何度登録しても誤変換、これは前と同じ
変換効率は、第2水準が追加されたので、個人的には良く感じます

895 :
http://freesoft.tvbok.com/freesoft/web/texchange.html
複数行を一括置換:文字列置換
これ使えば相当楽。

896 :
プレビューなしでの一括置換には良さそうだね。

897 :
秀丸の「grepして置換」と同じじゃね?

898 :
speeedと何が違うん?

899 :
エディタと違って確認置換は糞重いってことだろうか。試せないけど

900 :
みんな、どういう携帯機器で読んでる?

901 :
読取革命15はPDFを透明テキスト化すると、ファイルサイズが数倍に
ふくれあがる仕様は変わってないのな。
領域設定も全然だめだし。

902 :
 PDF解析ソフトで調べてみた。
 複合機のPDFとかを解析すると文字・図形と背景を分離して別々の圧縮
方式を組み合わせるなどの工夫をして桁違いの高圧縮をかけている。
 手持ちのソフトで透明テキストPDFにすると全画像をJPEGで圧縮しなおして
おり元の工夫が台無しになっていた。高圧縮方式の特許が絡んでいるのかも。

903 :
だとすると、特許を持っているところが文字データだけを取り出すソフトを売り出して欲しく感じてしまう
複合機取り込みOCRの需要は減るが

904 :
逆に図形がない、テキストが殆どの場合は
そんなにサイズが変化ないってことかな?

905 :
>>902
読取革命 以外のソフトもそうなのでしょうか?

906 :
例えば講談社文庫とか読むと使ってるフォント、ポイント数はほぼ同じ。
主要出版社のものをスキャン>OCRすることがほとんどだろうから、
そういうものだけでもパターン登録できないもんか。
無理かな。

907 :
>>904
テキストメインでもサイズはAcrobatで透明テキスト化したときの
5〜6倍になる。図形があってもほとんど変わらない気がする。
高圧縮でpdf化すれば2〜3倍程度になる。
>>905
e-Typist だとAcrobatの3倍ぐらい。
とりあえず、今月末にでるAcrobatXIに期待

908 :
よく分からないのだが、いまどきのPCでPDF文書の高圧縮とかに意味があるの?
モバイルとかだと、重くなるのかな?

909 :
創・価
死・ね
創・価
死・ね 
創・価
死・ね
創・価
死・ね
創・価
死・ね
創・価
死・ね
創・価
死・ね
創・価
死・ね 
創・価
死・ね
創・価
死・ね
創・価
死・ね
創・価
死・ね

910 :
買い物の際に貰うレシートをスキャンして、エクセルで家計簿をつけたいのですが、
無料で良いソフトはないでしょうか?
スレをざっと見た感じSmartOCRというソフトが有名のようですが、現在もSmartOCRが良いのでしょうか?

911 :
あげ

912 :
それ今ダウンできたっけ?

913 :
配布終了になってた

914 :
>>912-913
もうDLできないんですか・・・
他にフリーのやつはないでしょうか?

915 :
>>910
スキャナに付属しているのでは。

916 :
レシート程度なら手打ちでやるのが確実

917 :
>>910
手で入力することでも家計を意識できると思うから、
手入力おすすめ。
「ああっ!このあんぱんは要らなかった!」ってなるかも。

918 :
>>910
スキャンスナップみたいの使うんでなければ
時間ばっかかかるよ

919 :
バーコードリーダーはどうだろう?

920 :
>919
何を買ったかはわかるが、値段がわかんないだろ。

921 :
そっかorz

922 :
>>910
そんなことができるのだろうかと「OCR 家計簿」で検索したら
いろいろあるんですねえ。
下記は試用期間が1ヵ月間もあるみたいだから試してみては。
| ニャーニャー家計簿「ねこのて」 Ver.2.1
| 作 者 : 船ヶ台数理情報研究所 さん
| 対応OS : Windows XP/98
| 種 別 : シェアウェア(3,255円)
| 作者のホームページ : http://www.ne.jp/asahi/fmil/fmil/
| 補 足 : 試用期間は1ヵ月間

923 :
昔主婦向け雑誌か何かでレシート用スキャナと家計簿ソフトを
モニタプレゼントってやってたな。店名・品名も自動入力で
結構よさそうだった。

924 :
OCRは自動的に処理してくれるからいいんだけど、その手前のスキャンが面倒くさくてね。

925 :2012/10/24
>>915
安物のプリンタなのでOCRは付属していませんでした。
>>916-918
家計簿をつけるのにOCRはそれほど便利でもないのか・・・
>>922
シェアウェアならあるんですね。
とりあえず試してみます。
>>923
自動入力でいろいろやってくれるといいですね。
>>924
確かにスキャンって中途半端に時間がかかるし、面倒くさいですね。
TOP カテ一覧 スレ一覧 2ch元 削除依頼
●   糞ソフト決定戦スレ      ■ (510)
ZoneAlarmの使い方 (238)
AutoCAD関連ソフトの裏事情を教えて (739)
Acrobat以外のPDF作成ソフト総合スレ (705)
トレンドマイクロのウィルスバスター2001 (278)
【独占】ゼンリン地図不買運動【傲慢】 (566)
--log9.info------------------
「Ruu」 (200)
小学校の運動会の想い出 (254)
IDに omoide が出るまで頑張るスレ その3 (590)
ローラーゲーム (483)
ピン球で野球やったよな? (802)
ガキの頃に流行った遊び (673)
缶ぽっくり (236)
ドッジボール総合スレ (591)
運動会の棒倒し (367)
(゚Д゚≡゚Д゚)今 懐スポには俺様しか居ない! (813)
スポーツ名だけで1000を目指すスレ (340)
「ろくむし」 (295)
オリエンテーリングってご存知ですか? (225)
プロレスで思いつく言葉を書くだけのスレ (289)
【ヴェストファーレン風】国立競技場スレpart6【改築】 (608)
愛媛県松山市にサッカースタジアムを Part9 (545)
--log55.com------------------
ROCKET LEAGUE ロケットリーグ総合スレ part40
【PS4/XB1】World War Z part5【ゾンビ】
【Switch】Splatoon2/スプラトゥーン2 不満・愚痴スレ Part12
SONIC THE HEDGEHOG ソニック総合 ACT.162
【家庭用総合】シティーズ:スカイライン Cities: Skylines 17タイル目
【PS4】DAYZ part2【海外版のみ】
Watch Dogs/ウォッチドッグス 総合スレ Part79
【PSVR専用FPS】Firewall Zero Hour part19