ユーザー辞書をJapanistにインポートする方法(親指シフト導入記8)
Japanistは入力予測機能(注)が強力であるため、単語登録にはあまり神経質にならなくてもいいと、ベテラン・ユーザーはよく言う。
(注)一度入力した文字列を学習しておいて、後で同じ読みを入力すると、過去に学習した文字列の中から該当しそうな候補をその都度、列挙してくれる機能のこと。
しかし、別のIMEからJapanistへ移行したばかりのユーザーは、以前登録した読みですんなり変換できないと、やはりストレスを感じることだろう。
そこで、ここではATOKのユーザー辞書をJapanistにインポートする手順について、筆者なりにまとめておこうと思う。
ただし、登録単語の一部しか移植できなかった(しなかった)こと、かなり面倒な作業を伴うことを、あらかじめお断り申し上げておく。(注)
(注)なお、こちらのサイトにも、ATOKの辞書をJapanistに移植する方法が詳細に記載されている。
ただし、MS-DOSプロンプト(コマンドプロンプト)でのコマンドライン入力作業を伴うので、そうした知識がない人には少々、しんどい方法かもしれない(筆者自身、まったくチンプンカンプンだったので(笑)、下記のような手作業的な方法を取らざるを得なかった)
ただプログラムの知識に長けた人なら、上記のサイトの方法で、もっと楽に作業を済ませることができるのかもしれない。どちらの方法を選択するかは、各人におまかせしたいと思う。
0 作業に入る前に
別のIMEで作成したユーザー辞書をJapanistにインポートする方法については、ヘルプ(注)、及び、こちらのFAQに記載がある。
(注)Japanist2003の場合は、ヘルプの目次タブをクリックして、「辞書を利用する」→「辞書を管理する(辞書ツールキット)」→「他の日本語入力システムの辞書をJapanistで使う」と辿っていけばよい。
参考までに、その頁(PDFファイル)へのリンクを張っておく。
作業に入る前にこれらの記載に目を通して、作業手順の大幅な流れを把握して置くこと(ヘルプは分量がやや多いので、該当ページをプリントアウトしておいた方が目を通しやすい)
1 Japanistのユーザー辞書を抽出する
1・1 単語を登録する(新規ユーザーは必須)
初めてJapanistを使う人は、必ず何か一語、単語登録を行うこと。この作業をしておかないと、後述する「ツール」→「抽出ファイルへ単語を出力」の操作を行うことができない。
単語登録の手順は以下の通り。
- 登録したい単語を選択してコピーし、「Ctrl+T」を押す
- 「単語登録」のダイアログボックスが開く(以下の図を参照)
- 「読み」の入力と「品詞の指定」を行い、「登録」ボタンを押す
作業を終えたら、「入力モード」から「辞書ツールキット」を選択する(タスクトレイに収納している場合は、アイコン(「あ」か「a」)を右クリックして、「辞書ツールキット」を選択すればよい)
キットが開いたら、「標準ユーザー辞書」を選択し、右の欄に登録した単語や読み・品詞が表示されていることを確認する。
1・2 抽出ファイルの作成
抽出ファイルの作成手順は以下の通りである。
- 「辞書ツールキット」を起動する
- 左の欄の「標準ユーザー辞書」を選択して、ボックスにチェックを入れる
- 「ツール」→「抽出ファイルへ単語を出力」を選択(この項目を選択できない場合は、上の手順で単語登録してから、もう一度チャレンジすること)
- 「作成するファイルの指定」が開いたら、「ファイルの保存先」を指定して、保存
- 保存先に「新規単語抽出ファイル」というテキスト・ファイルがあることを確認する
「新規単語抽出ファイル」を開いて、以下のような内容になっていることを確認する。左から「読み」「登録単語」「品詞」がタブ区切で記述されているはずである。
2 ATOKのユーザー辞書をテキスト出力する
ここではATOK2011(現時点で最新版)のケースで説明する。
- 「ATOKバレット」から「辞書メンテナンス」→「辞書ユーティリティ」をクリック
- ユーティリティが開いたら、「ツール」→「単語・用例の一覧出力」を選択
- 出力ファイルのファイル名と出力先を適宜、指定する。
- 「単語の種類」は「登録単語」だけに、チェックを入れる
- 対象品詞は全てを選択すると多くなりすぎるので、できるだけ絞り込む(筆者は名詞群だけを選択した)
- 全て指定し終わったら、「実行」ボタンを押す
- 指定先にテキスト・ファイル(以下の図は、そのファイルを開いたもの)があることを確認したら、ユーティリティを閉じる
3 抽出ファイルの編集
抽出したATOKの辞書ファイルをJapanistにインポートするわけだが、その前に品詞名や保存の形式などをいろいろと編集してやる必要がある。
3・1 データの絞り込み
すべての登録単語をインポートすると、Japanistの軽快さが損なわれる可能性があるので、これからも多用しそうな単語以外は思い切って削除する。
筆者の場合は、よく使うHTMLやエディタのタグ(ルビや太字など)と固有名詞(人名や組織名など)以外はほとんど削除した。
3・2 品詞の修正、他
・品詞割当の変更
ATOK辞書の品詞の割当を、Japanistのそれに修正してやる必要がある(そのままではインポートできない)
(ATOKにはあって)Japanistの品詞項目にはないものについては、適当なカテゴリーを割り当てておいて、そのコードをどこかにメモしておく。(注)
(注)たとえば筆者は、(ATOKでは「固有商品」に割り当てていた)アルバムや曲のタイトルを、名詞の「文書」に割り当てることにした。
・表計算ソフトの活用
表計算ソフトのオートフィルタ機能で該当品詞を含んだデータを抽出し、Japanist用の品詞名を貼り付けてやれば、これらの置換作業を比較的楽に済ませることができると思う。(注)
(注)ただそのためにも、最初の段階で単語をできるだけ絞り込むことが望ましい。筆者自身は500語ほどに絞った。
データの並びが「読みがな」「登録単語」「品詞」の順番でない場合も、表計算ソフトを使えば、楽に入れ換えることができるだろう。
なお、表計算ソフトの使い方(テキスト・ファイルの読み込み方や、オートフィルタ機能の使い方・並べ替えの方法など)については、各ソフトのマニュアルにあたっていただきたい。
すべての編集作業を終えたら、「テキスト形式(タブ区切)」で保存する。
3・3 抽出ファイルの完成
修正したATOK辞書のテキスト・ファイルとJapanistの辞書ファイルを開き、後者の既に登録してある単語の下の行に、前者の登録データをコピーする。
データを保存してファイルを閉じれば、抽出ファイルの完成である。
4 抽出ファイルから単語の登録
作成した抽出ファイルをJapanistに登録する手順は、以下の通り。
- 辞書ツールキットを開いて、「標準ユーザー辞書」を選択
- 「ツール」→「抽出ファイルから単語を登録」を選択
- 「ファイルの選択」ダイアログボックスが開くので、先ほど作成した抽出ファイルを選択して「開く」を押す
- 「抽出ファイルから単語を登録」→「OK」を押す。すると、登録作業が始まる。
- 右側の欄に登録した単語が表示されれば、インポートは成功。
・注意事項
品詞の割当が違っていたりするなどして、登録できない単語がいくつか出てくるかもしれないが、構わず作業を続けて構わない。
Japanistの入力予測機能に慣れれば、単語登録についてはあまり気にならなくなるし、本当に重要な(頻出する)単語や記号については、Japanistで改めて登録し直せばいいだけの話だからである。
追記(2011年10月31日)
以上、ユーザー辞書の移植の仕方についてあれこれ説明してきた。確かに面倒な工程を含んではいるが、1日か2日もあれば、全ての作業を終えることができると思う。
また抽出ファイルの編集過程で、登録ミス(これがけっこう多い)を修正したり、今後2度と使いそうもない登録語句を削除したりすることで、精神的にもリフレッシュすることができた。面倒な作業にも、それなりの効用はあるものである(笑)
とはいえ、やはり作業に手間と時間がかかることには違いがない。そして辞書の移植のこうしたややこしさが、Japanistの普及を妨げる一因になっているとも考えられる。
それゆえ次回のヴァージョン・アップでは、この移植作業をより簡便化するための機能をぜひJapanistに標準装備していただきたい。開発担当の方に切にお願いする次第である。
(以下、次号)
| 固定リンク
この記事へのコメントは終了しました。
コメント