スポンサードリンク

OCR(自動文字認識装置)

年度末になり、年度末納期の仕事が重なってしまったので私も休日返上で文字入力のお手伝いなのである、このコラム書いている暇があればそっちをやらなきゃ いけないのであるが、コラムを書くのは私の息抜きみたいなもんであるから まあいいだろう。

スタッフから手渡されたのはA4版の組合員名簿みたいな 会員企業の一覧が書いてある本で、そこに書いてある内容をそっくりそのまま、テキストで打ち込む単純作業で、デザインが出来ない私に手伝わせる仕事として はうってつけなのであろう。

そこで、私は誰も使わないOCRのソフトを起動して使い始めるのである。
何故、誰も使わないかと言うとOCRを使ったほうが楽そうなのでOCRで始めるのであるが、殆どの場合、途中でOCRをやめて手で一文字づつ打ちこみはじ めることが多いからである。

OCRについて簡単に説明するとテキスト化したい原稿をスキャナーに載せてスキャニングして画像をパソコンに取り込む、取りこんだ画像を OCRのソフトが自分で勝手に画像から日本語の文字に変換してくれて、文字入力完了といたって便利なソフトの筈であるが現実は違うのである。

先ず、多くの印刷物は紙の両面に印刷してあって、裏写りするような紙だと裏側に書いてある文字まで出てきてしまって、上手く変換してくれな いで駄目なのである。

次に変換精度の問題である、パッケージには変換認識正解率98%の高認識正解率とか書いてあるのだが、これは条件の良い時にでた認識正解率 なのであろう。

もし仮に、認識正解率が98%だったとしても、98%って事は100文字変換して98文字正解で2文字が間違えるって事だから、50文字に 一文字は必ず間違えるんですね。

このコラムですと2行に一文字は必ず間違える事になります、実際にはもっと大量におかしな所が出てくるのですが。
それを、又画像を見ながら一文字ずつチェックしながら手で直していく事になるのですが、これが結構時間がかかるし、間抜けな変換をしている事が多いので疲 れます。
”川”って字が111になってたりね?

今回もまた結局は途中でOCRを諦めるのです。

追伸

世の中の文字情報がどんどん電子化されていまして、もう10年も経ちますと、OCRの技術そのものが一般的には使う必要がなくなっ てくる技術になるような気がしてきました。

少し前までは印刷物だけで電子データが無いって事も多かったのですが最近では、まず電子データが手に入るんで有りましてパソコンに インストールしたOCRソフトも出番が殆ど無いのです。

スポンサードリンク

関連コラム

  1. データとソフトまるごと引っ越し(XPパソコン)
  2. 無料ショッピングカートCGI
  3. 迷惑メール
  4. 人大杉対策で2ちゃんねるビューワをインストール
  5. GoogleのメールサービスGmailについて
  6. 差出人偽称、罪作りなウイルスメール
  7. 価格比較サイト
  8. レンタルサーバーとメンテナンス情報
  9. システム管理者の憂鬱
  10. 無料グループウェア
  11. オークションを上手に利用して高値で販売
  12. 無線LANの盗用と無断利用
  13. フリーメール
  14. メールのフッダーに署名は入れようよ
  15. ToDoプログラムの活用
  16. 電子メールの落とし穴
  17. OCR(自動文字認識装置)
  18. デジカメの選び方(Myベストなデジタルカメラ)
  19. 久々にを使う、バイクの修理ではまる
  20. 環境を考えて液晶テレビに買い換えよう
  21. メモリーの掃除ソフトで生き返る
  22. 過信は禁物ウィルス対策ソフト
  23. パソコントラブル解決
  24. カラープリンターの選び方
  25. 自作パソコン
  26. 日本語入力辞書をATOKに変更して快適
  27. 本格読取 おまかせ名刺管理!インプレッション
  28. MS-DOS世代、Windows世代
  29. フォントが消えていく減っていく、Windows98トラブル発生
  30. フロッピーディスクの寿命(保存メディアにご注意)
  31. パソコンの買い替え、入れ替手順
  32. ホームシアターの選び方
  33. 中古パソコンとOS販売の問題
  34. 電波時計とパソコンの内臓時計
  35. 人工知能とコンピュターウィルス
  36. おせっかいなワード(word)
  37. SONYウォークマン25周年
  38. ウィルス対策ソフトの再起動の事
  39. 光学式マウス事情
  40. 次世代ウインドウズ「ロングホーン」
  41. パソコンのデータ消失とバックアップ
  42. 低価格ソフト、パソコンソフト1980円均一
  43. 両面印刷プリンター
  44. テレビ会議システム
  45. 8時だよ全員集合
  46. 腕時計型テレビ
  47. ドラえもんが嫌い
  48. テレビショッピング
  49. 特殊戦隊シリーズ
  50. 年金改革、年金福祉施設売却
  51. 世界に誇る発明品カップラーメン
  52. リサイクル家電横流し事件
  53. ブラザー工業の電話サポートに感心する
  54. 電話サポート拠点の海外設置
  55. リコールの公表と決断と決済と
  56. 青色発色ダイオード 発明対価訴訟に思う
  57. 今度は「フラッシュメモリー」発明訴訟ラッシュの序曲?
  58. 教えて君の事
  59. 電話帳の電話番号データベースソフト
  60. 電話加入権販売と電話加入権廃止議論
  61. 最近の不審電話、傾向と対策
  62. 発明王ドクター中松
  63. 携帯電話の電話番号持ち運び、番号ポータビリティ
  64. 子供の携帯電話通話料金の問題
  65. ボイスレコーダー機能付き携帯電話
  66. SIMロック解除に賛成する
  67. プリペイド式携帯電話
  68. クローン携帯電話
  69. パケット料金定額で通話料金定額
  70. 携帯電話選び
  71. Lモードは本当に普及するのでしょうか?
  72. 携帯電話パケット料金定額制
  73. 3Dメガネの自作
  74. 携帯電話の買い替えにあたり
  75. ISDNは残るのか消えるのか?
  76. ツイッターの弊害
  77. 地デジ移行延期
  78. バージョンアップ
  79. ウイルスと細菌の違い

スポンサードリンク

営業力アップ著作権

コーチングメニュー

ページのトップへ戻る