ども。
なかなかハードな日々が続いていて、週末が待ち遠しかった担当ちゅんです。
何がハードなのかといえば、実はこの1ヵ月ほどびっちり「ふるさと納税」の対応にあたっていました。1月10日が「ワンストップ特例申請」の申請書提出期限となっていることから、その申請受付処理に従事していたのです。来る日も来る日も申請書をチェックしてシステム入力を行い、今週でようやく終わりが見えてきた、そんな状況です。とはいえ、まだ全ての処理が終わったわけではないので、しばらくは忙しい状況が続きます。
そんななかで、業務主担当の職員から「困ったことになりました」と相談を受けました。ふるさと納税の申請処理に利用しているシステムがあるのですが、そのシステムから寄付者情報をExcelデータとして出力すると、氏名が正しく表示されない方が相当数いるとのこと。確認すると、そうした方は氏名の漢字として旧字体等が使われている方(例えばいわゆる「はしごだか」など)であることがわかりました。
氏名なのですから、旧字体であろうとあくまで正確に入力することは行政の職員としては当たり前のことです。しかし、これがシステムの事情だけで考えると大問題となります。
出力されたExcelデータを見ると、明らかに文字が抜け落ちてしまった方や、中には「U+2363A」みたいに文字コードに置き換わってしまっている方まで様々。こうした文字をシステム的にデータとして取り扱うためには、一般的な文字に置き換える必要があるのですが、受理している申請は数万件。これらをチェックして(現状では)手作業で文字の置き換えを行うという作業が必要となりました。途方にくれます。
ところで、そもそもなぜシステム上で機種依存文字を入力することができたのかという疑問が出ます。それは、システムが「Unicode」という文字コードで処理できるようになっているからなんですが、であれば出力するときもUnicodeで出力できないものなのか、と思ってしまいます。この辺はシステムの仕様にもよりますから何とも言えませんが、あらためて「日本語って難しいんだな」と感じます。アルファベットでは決して起きない問題ですからね。
例えばこの文字。これは文字コードに置き換わって出力されてしまいます。
(投稿者:ちゅん)