菅江真澄の文章を、テキスト入力している。
OCR処理したテキストの認識誤りの部分を訂正していく。
たまには、ひらがなやカタカナの誤りもあるが、ほとんどは漢字、特に画数の多い複雑な漢字である。
それを、IMEパッドを使って、目的の漢字を探して正しい漢字を入力する。
どこかで使われていた漢字が、再度出てきたら、また同じことを繰り返す。
手描きで認識する方法は、なかなかむずかしくて、なかなか探し出せない。
部首や画数から、探す方法もあるが、これは一覧に出てくる漢字が多すぎるし、デスプレイの表示では細部がよく見えず、漢字の判別がむずかしい。
こんなことをやっていて、今頃になって気がついた。
苦労して探した漢字を、IMEパッドに単語登録すれば、繰り返して使うことができる。
IMEパッドというのは、ウィンドウズ付属のツールであるが、その機能である単語登録では、単語、読み、品詞を登録すれば、優先的に変換候補になるようである。
テキストで一覧表にすれば、まとめての一括登録もできるようだ。
単語というのは、100字くらいまでの文章でもよくて、読みは1字でも可能のようだ。
使い方によっては、入力の手間を格段に減らすことができる。
私は、今までこの単語登録を使ったことがない。
しかし、かつて勤めていてPCを使っていた頃に、よく使うことばを登録すれば楽なんじゃないかな、と考えていたことを思い出した。
単語登録というのは知っていたが、実際にはやってなかった。
たとえば、組織や会社などの正式名称や住所などの長い文字数のものである。
「ひ」という読みで、「柏市立図書館光ヶ丘分館」という単語を登録すれば、「ひ」という1文字の入力で、「柏市立図書館光ヶ丘分館」と11文字の名称に変換できる。
スマホで、メールの入力などをしていると、入力予測という機能がはたらく。
1文字入力しただけで、今までの入力した履歴から予測される言葉が表示される。
そのリストから選択すると、次の予測リストが表示される。
それを、繰り返していると、それだけで入力が終わってしまったりする。
入力の内容が、決まりきったものだったら、入力はわずかなものである。
この「入力予測」という機能は、私が20年近く前に、PDAのクリエを使っていた頃に、「PoBox」というアプリがあってそれが「入力予測」の最初のアプリだったと思う。
今は、各社からさまざまなアプリが出ているようだ。
ケータイやスマホが、ここまで爆発的に普及したのは、このアプリのおかげなのではないだろうか。
文章のすべてを、いちいち入力しなければならなかったら、ここまでみんなが使おうとはしなかっただろう。
ここで、菅江真澄に戻るが、彼は200年ほど前江戸時代後期の人である。
真澄の文章には、とてもむずかしい漢字が多く使われている。
彼の文章は、他の人に読んでもらうために書いたものだと思われるので、ことさらにむずかしい漢字を使ったのではないと思う。
江戸時代の知識人が、身につけている漢字の教養が、そこに現れているのだろう。
現代の日本人が使っている漢字は、教育漢字1026字、当用漢字2136字である。
でも、戦前から戦後にかけて日本で刊行された「大漢和辞典」には、50306字収録されているそうだ。
中華民国で刊行された「字典」では、10万字を越えているらしい。
菅江真澄全集の本文では、漢字のわきにカタカナで振り仮名があったりする。
振り仮名は、フォントが小さいので、濁点「゛」か半濁点「゜」かわからない。
私は、ど近眼なので、だいたいは目を近づければ小さな文字でも見ることができるが、それでも限界がある。
もちろん、その場合はメガネをはずす。
それでもだめなら、スマホのカメラで、拡大撮影して、確認しているのが現状である。
いつもながら、思うこと。
著作権が切れているような古典は国の財産なのだから、電子テキスト化を国がやらないのかな。