Evernote(日本)が手書き文字データ収集 [実験]
ツイッターで、Evernotejpのタグを見ていたら、EN社日本が手書き文字データ収集に協力要請しているとのこと。
忙しいので、今は協力できないが、時間ができたらやりましょうとも。
何か他にも、Webに貼るボタンが提供されたりして、流れに乗っている。
しかし、EN社は利用者を巻き込むのが上手いようだ。 日本語の難しさ(検索性能の悪さ)を逆手に、キャンペーンにしている。
まあ、自分の癖字に特化して認識してくれるわけではないだろうが、育成意識は醸成できる。
利用者の忠誠度が高まるだろう。 この手のサービスとしては、利用者にとっても悪いことではない。
私自身は、手書きメモをスキャンして、せっせとノートにしている。
日付を認識させるのに苦労していたが、何のことはない、昔ながらのレイアウト用紙(ブルーの5ミリ方眼紙)を使ってみると、かなり改善された。
結局はノイズの問題が大きかったのかもしれない。
「自家製のOCR用紙」などと考えていたため、文字と同じ黒の枠線が微妙に「読める」用紙を使っていたことが、ノイズになって、数字の認識を妨げていたのだろう。
但し、数字列はやはり誤認の発生率が高いので、年、月、日を漢字で書いて、数字と漢字の組合せで日付を表記している。 結果的に、結構精度を保っているように思う。 結果がよければ良い。
しかし、手書き文字を認識するためとはいえ、手書き文字のデータを集めるのは、何か別の活用法もありそうな気がする。 個人情報なのか微妙なところなので、無断転用はできないか。
忙しいので、今は協力できないが、時間ができたらやりましょうとも。
何か他にも、Webに貼るボタンが提供されたりして、流れに乗っている。
しかし、EN社は利用者を巻き込むのが上手いようだ。 日本語の難しさ(検索性能の悪さ)を逆手に、キャンペーンにしている。
まあ、自分の癖字に特化して認識してくれるわけではないだろうが、育成意識は醸成できる。
利用者の忠誠度が高まるだろう。 この手のサービスとしては、利用者にとっても悪いことではない。
私自身は、手書きメモをスキャンして、せっせとノートにしている。
日付を認識させるのに苦労していたが、何のことはない、昔ながらのレイアウト用紙(ブルーの5ミリ方眼紙)を使ってみると、かなり改善された。
結局はノイズの問題が大きかったのかもしれない。
「自家製のOCR用紙」などと考えていたため、文字と同じ黒の枠線が微妙に「読める」用紙を使っていたことが、ノイズになって、数字の認識を妨げていたのだろう。
但し、数字列はやはり誤認の発生率が高いので、年、月、日を漢字で書いて、数字と漢字の組合せで日付を表記している。 結果的に、結構精度を保っているように思う。 結果がよければ良い。
しかし、手書き文字を認識するためとはいえ、手書き文字のデータを集めるのは、何か別の活用法もありそうな気がする。 個人情報なのか微妙なところなので、無断転用はできないか。
タグ:Evernote
コメント 0