ことだま開発企画 〜手書きと検索の融合〜
趣旨
本プロジェクトでは、手書きデータをテキスト検索するためのシステムを開発する。手書き認識を利用したシステムは従来からもいくつか知られているが(要例示)、認識の精度が十分ではないという問題があった。提案するシステムでは、文字認識技術の不十分さを補うために以下のようなアプローチをとる点が画期的である。
- コンテクスト情報によって、認識へのヒントを与える。つまり手書き入力者が関わっている分野のキーワードなどがよく使われるとみなして文字認識を行う。
- 最初から100%認識することをあきらめ、誤認識を許容しながらコンテンツを収集する。誤認識は後から参照者が変更できるようにする
従来、文字認識を向上させるための仕組みとしては、四角の中に1文字ずつ書くよう強いる、などユーザの使い方を強要するものが多かった。それに対し本システムでは、前述のようなアプローチをとることで手書き入力者の表現の仕方を規制しないようにする。つまり、文字の大きさや、どこに書くかなどは自由である。こうすることで、手書きの表現力を十分に引き出すことができると考える。「黒板とチョーク」と同じような使い勝手で、かつ検索可能なコンテンツ作成の仕組みが目標である。
背景
コンピュータの利用シーンを広げたいというのが元来の動機である。紙と鉛筆(あるいは黒板とチョーク)と同じように、誰でも簡単かつ気楽に入力できるようにしたい。
しかし、ただ入力が便利になっただけでは不十分である。ウェブをはじめとして電子コンテンツの量が膨大になった今日では、「検索で見つからないものは存在していないのと同等である」という認識が広まっている。 したがって、手書きコンテンツを蓄積するための前提として、それが後で検索されなくてはならない。単純な解決策としてはユーザがキーワードを入力するという仕組みが考えられるが、逐一キーワードを入力しなければならないとなるとストレスになり、「紙と鉛筆のように」という理想から遠ざかってしまう。 次のような利用シーンを想定している。
- コンピュータリテラシが高くない人のための入力装置として
- 学校(初等教育)の先生が、教材の作成と共有のための仕組みとして。
- 病院のカルテ電子化の手段として。電子化が遅れている要因として、医者のコンピュータリテラシの低さやテキスト入力の表現力の低さ(絵を描いて説明したいことが多いなど)が考えられる。
- 手書きブログなどによる新たなコミュニティ醸成の仕組みとして。従来コンテンツを発信できなかったようなユーザ層にもネットでの自己表現が可能になる。
- 知的生産の道具として
- 商品企画などの現場では、初期段階での検討は手書きで行われるのが通常である。PowerPointなどのツールはあくまで清書のためのツールである。
栗原による、「誤認識は後から参照者が変更できるようにする」の補足
手書き文字認識技術は未成熟であり、また完全な精度を得ることは難しい。 手書きデータに対して人間が計算機のためにその解釈を教える作業は、人間から見るとただの徒労であり、なるべく避けるべきである。しかしその作業により以後の手書き情報の再利用性が大きく決まることも事実である。したがって、ユーザの手書き情報の再利用性向上へのモチベーションが高まったとき、それを敏感にシステムが受け入れられるようなインタフェースデザインが望まれる。手書きコンテンツの創造・運用プロセスと、手書き解釈情報(タグ)付与プロセスの非同期化により、それは実現される。 (+創造ユーザと活用ユーザが違ってもよいことを盛り込む)
添付ファイル
-
kotodama-project-plan.doc
(149.0 KB) - 登録者 kkato
4 年 前.
企画書
