A Riddle Wrapped in a Mystery

中身はエニグマ・Emacs

Emacs Lookup で Karak PDIC中日辞書を使う

Emacs Lookup で、Karak氏 が作成した中日辞書 を使うことができる。

PDIC形式辞書

PDIC は Unicode にフル対応した辞書フォーマットで、日本の多言語辞書によ く利用されている。特徴として、内部文字符号として BOCU (Binary Ordered Compression of Unicode) と呼ばれる圧縮形式を採用している。

BOCUはハフマン符号ほど圧縮率は大きくはないが、圧縮後の文字列が辞書式順 序を維持しているため、辞書には適した圧縮方式である。

BOCUデコーダ

Lookup に付属している bocu.el は、BOCU符号をデコードする。 bocu.el は、レジスタベースのCCL言語で記述されていて、Emacs Lisp に比べておよそ 5~10倍程度高速に動作する。

ndpdicエージェント

ndpdicエージェントは、 bocu.el を利用して、PDIC辞書の検索と表示を行う。 CJ2辞書で利用するには以下のように設定する。

1: (setq lookup-search-agents
2:       '(....
3:         (ndpdic "~/edicts/cj2")
4:         ...

ndpdicエージェントは、PDIC辞書が入ったフォルダを指定すると、そこから拡 張子 ”.dic” のファイルを探し、辞書オブジェクトを生成する。

M-x lookup-restart で中日辞書が現れるかを確認し、検索する。

2013-03-15-cj2.png