手書きの文章をweb上で公開するには?

[上に] [前に] [次に]
norika [E-Mail] [HomePage] 2000/01/12(水) 22:43:52
莫大な量の手書きの文書をweb上で公開することになりました。
基本的にはスキャナでとりこんでアップロードしようと思って
いるのですが、なにかいいアイデアがありましたらお教えください。
お願いします。

がんま [E-Mail] 2000/01/13(木) 02:43:57
エディタとかで、打ち込んだ方が良いかも…

と言うのも、手書きとは、ある意味「本人が読めても、他人が読めない」とか
また「読みづらい」ことがあります。

たまに、仕事で名簿や商品名などの打ち込みをしていますが、
原稿が手書きで来た時には、だいたい、読めない字が幾つか
散らばっています。

打ち込みは、量が多ければ、それなりに時間が掛かりますが
読む側の視点に立ったときには、取り込んでアップロードは
控えたほうが良いと思います。

ツーツー 2000/01/13(木) 02:46:41
デジタル化なら、ワープロの代打ちに委託するという手もあるのでは?
相場は10文字で1円から5円くらいでしょうかね?

norika [E-Mail] 2000/01/13(木) 04:37:05
やはり手書きで書いた文章は相当見づらくなりますかーーー。
実際、全く読めないというわけではないのでしょうか?
例えば手書きの字をFAXで送る場合と比べたら、手書きの
字をスキャナでとりこんでアップロードする場合どっちが
見やすいですか?

Nemo 2000/01/13(木) 04:52:25
とりあえず、スキャンするなり、まず出来る簡単な方法を
とってから、その後 対応できる範囲で、コツコツ打ち込む
なり、してはどうでしょう?
スキャナから文字を読み取るようなソフトでもあれば一番
よさそうですけど。

茶しぶ男 2000/01/13(木) 09:32:49
とりあえず、OCRソフト(スキャナーから読みとってテキストに変換)の紹介

e-Typist

http://www.mediadrive.co.jp/katuji/seihin/index.html

各種スキャナにもバンドルされていると思いますが…。
ワタシも(たまに)使ってますが、文字認識率も結構良くって、楽ですね。

ところで、「手書き」を公開することに、どれだけの意味があるのかな…と思いましたが…。

ブラウザ画面上で読みやすいのは、圧倒的に通常の文字のほうです。

例えば、有名作家の原稿などで、筆跡を公開するということによってサイトの価値を持たせるということも考えられますが、それだったら原則的に通常文字での公開として、一部分だけ手書き原稿をスキャンして画像で公開するとかでいいんじゃないかな。

無責任官庁 2000/01/13(木) 10:41:17
>ところで、「手書き」を公開することに、どれだけの意味があるのかな

norikaさんの話から推測すると、全世界の不特定多数に「公開」するのが
目的ではなく、ある特定の相手(複数)に、現在手書きでしかない大量の文書を
見てもらうにはどうするのがBESTか?を質問している。
そういう風に思いましたが。
その中で、手っ取り早く、時間・紙・お金のムダをなくす方法として、
Webがいいかな?って所ですよね?

以上のことから、私は、スキャナで取り込んでPDFに変換するに一票。
プラグインが必要ですが、文書を読むならば文書形式が良いでしょう。

OCRですが、ワープロ文書でさえ結構誤認するOCRソフトを、
手書きで、しかも大量の文書に使用するのはオススメしません。
疲れることを考慮しなければ、おそらく最初からタイプした方が時間的には
早いと思います。

蓮子 2000/01/13(木) 10:42:03
OCRソフトをもう一つ>「読んde!!ココ」
http://www.aisoft.co.jp/japanese/products/p_ocr.htm

手書きの見た目を維持したいのなら、画像として使うのでしょうが、
膨大な量の画像を読みやすいように加工するのもクラクラしますね。
目的が分からないですが、OCRをオススメします。
達筆だった場合はOCRだと読み取れなくて苦労しますけどね。

蓮子 2000/01/13(木) 10:46:37
あらら、反対の意見が並んでしまいました。
確かに書き取りのお手本のような字でないと修正の方が大変かもしれません。
上の発言は「OCRをオススメ」→「文書デジタル化をオススメ」と
訂正させて下さい。(実際それが言いたかったのです。)
短い期間の一時的な公開でなければ、テキストは軽いし後が楽ですよ。

ゆう 2000/01/13(木) 12:19:56
まず規模と質などがわからないと。

Q1.「膨大な量」とは何ページですか?百?万?(まさか億?)
Q2.「手書き」とは何の手書きでしょうか?手紙?帳票?論文?自由形式か、定型か、用紙サイズは?日本語?英語?
Q3.かけられるコストはどのくらいでしょうか。限りなくタダか、数百万円か、数千万円か。
Q4.WEBで公開した後、どのような利用をするつもりですか。見るだけ?検索する?コピーしたり、再加工したりする?また利用形態とも絡みますが、「手書き」文書は手書きであることに意味がありますか?たとえばの話ですが、芥川竜之介の手書き文書なら手書きであることにも意味があるわけですが。

なぜこんな質問をするかというと、例えば定型で、英語なら確実にOCRで行けます。1万ページもあって、ということならパンチ入力は選択肢から外れるかも知れませんし。条件によって変わるからです。

がんま [E-Mail] 2000/01/13(木) 13:06:32
> 例えば手書きの字をFAXで送る場合と比べたら、手書きの
> 字をスキャナでとりこんでアップロードする場合どっちが
> 見やすいですか?

 スキャナで取り込む時に、解像度を仮に300とかに設定しても
 ウェブで扱うには容量が大きくなりすぎ、結局通常の「72dpi」に
 落として扱うことになるでしょう。

 解像度を無視して言えば、スキャナの方が見やすいです。
 FAXは、やはり文字がギザギザに出力されてしまうので
 余計に見づらくなります。

 FAXの場合は、1文字の大きさが9ポイント(約3ミリ角)が限界でしょう。
 もちろん「漢字の画数」によっては9ポイント以下でも見えます。

norika [E-Mail] 2000/01/13(木) 15:41:00
本当にたくさんのアドバイスを頂きありがとうございます。
なんのためにたずねたかといいますと、大学の試験の対策プリントを
web上で公開することになりまして、だいたいB4で500枚くらいあります。日本語ですね。
それにかけられる費用というのが全く無いものですから、(大学生は貧乏です)
こうして質問させて頂いたのですが。
利用方法としては、webの情報を見た人が印刷して使うのを予想しています。
この場合、最もよい方法は何ですか?何度もすいません。

norika [E-Mail] 2000/01/13(木) 15:41:20
本当にたくさんのアドバイスを頂きありがとうございます。
なんのためにたずねたかといいますと、大学の試験の対策プリントを
web上で公開することになりまして、だいたいB4で500枚くらいあります。日本語ですね。
それにかけられる費用というのが全く無いものですから、(大学生は貧乏です)
こうして質問させて頂いたのですが。
利用方法としては、webの情報を見た人が印刷して使うのを予想しています。
この場合、最もよい方法は何ですか?何度もすいません。

茶しぶ男 2000/01/13(木) 16:13:51
> 大学の試験の対策プリントを
> web上で公開することになりまして、だいたいB4で500枚くらい
> あります。日本語ですね。
> それにかけられる費用というのが全く無いものですから、
> (大学生は貧乏です)

 「なりまして」というからには、誰かに依頼されてやってるのかな?
 それにしても、その為の費用の負担はしてくれないのだろうか…?
 という疑問はさておき。

> webの情報を見た人が印刷して使うのを予想しています。

 だったら、スキャン後PDFに変換がいいのではと思います。

 さらに、500ページともなると、見るのもアップするのも大変ですから、いっそのことzipやlzhで圧縮してみては?(ココのページみたいに)

ゆう 2000/01/13(木) 17:30:24
ということなら、
1.スキャナで取り込み、ファイルとして保存。
2.ファイル名、タイトル、内容の短い紹介などをDB化。
3.DBをWEBで検索、表示。ファイルをリンク。
というところでしょうか。
ファイル形式は用紙サイズとブラウザでの閲覧から考えてJPEGが適当かと思います。
また読みにくい場合、元文書を紙として閲覧できるように元文書にも識別番号を付けるとよいでしょう。
PDF化はAcrobat Exchangeなどを購入する余裕があればした方がいいと思います。
DBは購入できる範囲でなんでも構わないと思います(フリーでも)。NTならAccessでも可でしょう。

hiro-kim 2000/01/13(木) 19:49:47
(1) 500枚をひたすらスキャナで読み込む。B4原寸大の画像 L001.jpg〜L500.jpg と,それを1/64に縮小した S001.jpg〜S500.jpg の,1000枚の画像を用意する。

(2) 最終的にどういうレイアウトの文書にしたいのか,十分に熟考して,ひな形となるHTMLファイル(T000.html)を作成する。

(3) 試験対策プリントWeb公開プロジェクトのホームページを開設する。S001.jpg〜S500.jpg をいくつかの組に分けて,トランプの神経衰弱ゲームのように公開ページ上にタイル張りする。(L001.jpg〜L500.jpg もWebサーバに置くが,URLは公にしなくてもよい)

(4) 学生が集まっていそうで,こういう書き込みをしても怒られなさそうな掲示板をいくつか見つけて,ホームページをPRする。
------------------------------------------------------------------------------
○○大学の□□と申します。
大学の試験の対策プリントをWeb公開しようと考えています。
手書きのプリント(B4サイズ)が500枚ちかく大量にあります。
まことに厚かましいお願いですが,お時間に余裕がある方がいらっしゃいましたら,
お1人1枚でけっこうですので,ボランティアとして
HTMLファイルへのキー入力を手伝っていただけないでしょうか。
(プリントに描かれている図については,私のほうで貼付加工します)
申し訳ありませんが,お金をお支払いすることはできません。
謝辞としてお名前を載せる程度のことしかできません。

その代わり,完成のあかつきには,
全国の大学生をはじめとして Internet上の誰からも参照できるよう,
この文書をひろく公開します。私は著作権を主張しません。

もしもご協力いただける方がいらっしゃいましたら,
ホームページ上からお好きなプリントを選んで,私までメールをください。
折り返し,B4サイズの原本画像(※)と,ひな形となるHTMLファイルを送ります。
(※:添付ファイルを嫌う人がいるので,URLだけを通知する方がよいと思う)

これは,いたずらではありません。ご迷惑でしたらお詫び申し上げます。
------------------------------------------------------------------------------

(5) ひたすら待つ。
  入力が済んだ縮小画像を「終了!」画像で置き換えたり,「○月○日:○○枚まで終わりました。ありがとうございます」と日々の進捗をカウントアップしたり,ゲーム性を持たせる。(つまり S001.jpg〜S500.jpg は見栄えを面白くするために用意した)

(6) このプロジェクトが成功のうちに終了したら,どこかのニュースサイトが取り上げてくれるかも知れない。

ねぇねぇ 2000/01/14(金) 01:11:38
>> 例えば手書きの字をFAXで送る場合と比べたら、手書きの
>> 字をスキャナでとりこんでアップロードする場合どっちが
>> 見やすいですか?
> 解像度を無視して言えば、スキャナの方が見やすいです。
FAXの写真(繊細)モードで出力先をレーザプリンタにした場合と、スキャナで取り込んだ画像を印刷した場合とでは、FAXの方がいいような・・・
「配布」じゃなくて「配付」なら、FAXの方がお手軽モードです(電話代が余計に掛かるけど)。

> 例えば定型で、英語なら確実にOCRで行けます。
むむっ? 「確実」ですか?
海外から来る手書きのFAXを読むのに苦労してる身としては、「確実」とは思えないんですが・・・
あ、いや、ブロック体と筆記体が混在してたりしますし、英語圏の外人さんとてスペルミスがありますし・・・
「確実」なら、一度試してみようかしらん?

> ファイル形式は用紙サイズとブラウザでの閲覧から考えてJPEGが適当かと思います。
なんでJPEGなんでしょう? B5なら、GIFの方がファイルサイズが押さえられて、高画質だと思うけどGIFじゃダメなんですか?

ところで、Webで公開した画像は、モニタで見られればいいの? それとも印刷??

ねぇねぇ 2000/01/14(金) 01:29:43
自己レス(汗)

> FAXの方がいいような・・・
“解像度を無視”なら、そうとも言えないですね。ゴメンです。

norika [E-Mail] 2000/01/14(金) 17:41:40
[[解決]]
本当に色々な意見どうもありがとうございました。

[上に] [前に] [次に]