読者です 読者をやめる 読者になる 読者になる

OCR(光学的文字認識)技術は過渡期の象徴である

f:id:daikeiobachan:20170330190300j:plain

最近、Google翻訳が本気を出し始めて、リアルタイムで映像に捉えた文字を翻訳する機能が実装されました。このように実世界の文字情報をテキストデータ化する技術を「OCR(光学的文字認識)」と言います。

OCRとは?

OCRとは画像データに含まれている文字情報をテキストデータ化して、より汎用的に活用するための技術です。たとえば、新聞の写真をパシャって撮って、その画像に含まれている文字情報に検索をかけたりできます。自分の興味のあるワードを検索すれば、新聞をより能動的・多面的に読むことができます。OCRは他にも、Google翻訳のリアルタイム翻訳や、PDFファイルをテキストデータ化するのとかに使われてます。

固定されたインフラは改変が困難

いきなり例え話ですが、最近よく自動運転技術って聞きますよね。あれって考えられる応用先の一つに、運送業とかも入っていて、つまり人が運転しなくてもトラックが自動で走ってくれたら、今の運送業界のブラック化がなくなるどころか、ドライバーの職そのものも危ういものになってきます。でもこの考え方の基盤にあるのはやっぱり「トラック」なんです。なんでかっていうと、「高速道路」っていうインフラは簡単に変えられないから。つまり「高速道路」なんてものがもともと無かったら「トラック」を自動化しようなんて考えもおそらく無くて、もっと高度な技術を駆使した運送方法があるはずです。

さあここまでの例え話で何が言いたいかというと…次の項ね。

OCRは過渡期の技術

世の中には大量の文書データが「本」という質量のあるオブジェクトに格納されていますよね。この「本」がさっきで言うところの(多少意味合いは違うけど)「高速道路」です。つまり、今現在はIT化が激しくて、ホントは大量の文書データもネットワーク上で扱いたんだけど(そのほうが検索とか出来て便利だから)そのフィールドに大量の「本」を持っていかなければならないと。極論言えば、「本」なんてものが大量に世に出回る前に、全部の文書データをパソコンで書いておけばよかったんです。そしたら全部ネットワーク上でダイレクトに扱えるから。でもまあそんなのは童話・寓話で、それを解消するために「OCR」があるわけなんですね。

現実世界の文字情報

いくらネットワーク上に文書データを放り込んだとしても、私たちはネットワーク上ではなく「現実世界」に暮らしているわけですから、この「現実世界」にも文字情報が無いと不便ですよね。具体的にはコンビニとかファミレスの看板の文字とか。色情報だけだと「あれ緑だけど、多分サイゼリヤかな?」とかなっちゃいます。文字が無くなったら不便極まりないですよね。

次世代の文字情報は?

おそらく前記した現実世界の文字情報もすべて、ネットワーク上に管理されると思います。つまりどういうことかというと、「サイゼリヤ」っていう文字は質量を持たなくなって、そこにある”ように見える”ようになります。それを実現する技術は、最近耳にするVRとかARとか、あるいはMRとか。もっと他の斬新なアイデアもあるかもしれません。

情報媒体すべてが仮想になる

今書いたのは文字情報についてですが、勿論この流れを汲めば、文字情報だけでなくほぼすべての情報媒体は”仮想化”、つまり”無質量化”します。

まとめ

この記事で言いたかったことはOCRについてより、”無質量化”だったんですけど、まあざっくりといい感じに書けたと思います。インフラの固定化とか、いっぱい面白いことって溢れてますよね。

こちらもどうぞ

http://daikeiobachan.hatenablog.com/entry/english_vocabulary_making

http://daikeiobachan.hatenablog.com/entry/safari_css_off

広告を非表示にする