菅江真澄のテキストを校正していて、苦労するのは正確な漢字を探すことだ。
OCR、つまり「光化学文字認識機能」によって、文字画像から文字データに変換させているのだが、時にはとんでもない文字として認識されている間違いがある。
そんな時には、まず、漢字の読みがわかっていれば、かな入力をして、漢字変換してみる。
だいたいは、これで解決するが、それでも、正しい漢字が出てこないことも多い。
次に、ウィンドウズ付属の「IME Pad」を使う。
これには、「総画数検索」、「部首検索」、そして「手書き検索」がある。
「総画数検索」は、画数を数えるのも面倒だが、候補の文字数が多すぎてそこから目的の漢字を探すのはむずかしい。
「部首検索」は、「へん」「つくり」「かんむり」「たれ」「かまえ」「にょう」「あし」の7種類あるという部首から絞っていく。
総数で、214種類あるというが、それでも候補の漢字が多すぎて探すのは困難だ。
この、部首を複数使って絞ることができればいいなあ、とずっと思っていた。
漢字は、この部首の組み合わせでできているのだから、複数の部首を使えば、候補の漢字はずっと少なくなる。
最近になって、だったらそれができるアプリかサイトがあるんじゃないかと、気がついた。
探してみたら、いろいろとあった。
その中から、使いやすそうなのを選んでみた。
「漢字辞典オンライン」というサイトがあった。
検索の入力欄に、とりあえず、部首名か部首そのものを入力すると、その条件を満たす漢字を教えてくれる。
たとえば、こういう具合になる。
「鹿」と「鳥」を入力して、検索ボタン。
「鸝」という字が出たので、この字をクリックしての情報を開き、コピーボタンをクリックすれば、好きなところに貼り付けできる。
菅江真澄の文章を読んでいると、意味は同じ漢字なのに、字体の違うものをよく使っている。
「異体字」というものである。
同じ意味を表す漢字が、同じ文章の中で、いくつも使われている。
さらに、「万葉仮名」というような使い方もしている。
漢字を必ずしも意味に関係なく、表音文字としてだけつかっている。
アルファベット的な使い方である。
菅江真澄は、先日の記事にも書いたが、賀茂真淵の流れを汲む国学系の人である。
旅先でいろいろなひとたちにお世話になって、別れにあたっては、互いに和歌を贈ったり、それに答えたりしている。
それでも、江戸時代のひとにとっては、教養の基礎にあるあるのは、漢字、漢文なのだな、と思う。
漢字に対する感覚が、現代の私たちとはまったく違うのだ
この異体字というのを、簡単に調べられるサイトを見つけた。
「漢字検索 異体字検索」というサイトで、FUKUIさんという人が運営している。
どうも、経済産業省がやっていた「文字情報基盤整備事業」で整備していた漢字データを利用したものらしい。
https://code4fukui.github.io/mojikiban/
ここで、知りたい漢字を入力すれば、異体字を教えてくれる。
私の住んでる、千葉県東葛飾の「葛」を検索すると、こうなった。
なんと、9文字もある。
ついでに、「下総国」の「総」の字を検索。
これは、なんと14字もあるのだ。
たしか、かつて読んだ文章では、漢字は10万字を越える種類があるということだった。
でも、日本人が、学校で習う「教育漢字」は、現在のところたったの(?)の1026字だけらしい。
一般の社会生活で必要とされる「常用漢字」でも、2136字だそうだ。
これだけあれば、とりあえずは、だいたいの表現はできるということだろう。
このことから、考えてみると、10万字を超える漢字のかなり多くの数は、「異体字」であるということなのだろうか。
もう少し、調べてみると必要がありそうだな。