海野秀之(うんのひでゆき)の外部記憶
Twitter (twilog) / RSS / アンテナ / ぶくま
http://d.hatena.ne.jp/hituzinosanpo/20080707/1215442015
学生のころ、「せめてすべての漢字に振りがながふってあればなぁ」 という趣旨のことを外国人が言っていたらしいという話を聞いた。
「そうだ、そうだ!」とその時は思ったんだけど、すっかり忘れてたよ。
いま思い出した。ひとまずメモるだけなんだが。
一般にcommon prefix search を 効率的に行うためにトライ(TRIE) というデータ構造を用いる。図2.2 に日本語トライ 辞書の一部を示す。トライ構造は一回の問い合わせで文中のある位置からはじまる全て の語を返すことが可能なので、効率的な辞書検索ができる。例えば、「海老名へ行く」と いう文字列を図2.2 のトライで検索すれば、枝を一回たどるだけで、「海(名詞)」「海老 (名詞)」「海老名(固有名詞)」という語が見つかる。文中の全ての語を探す単純な方法は、 文頭から一文字ずつ文字位置をずらしながら各位置でcommon prefix search を行うとい うものである。しかし、Aho とCorasick により提案されたAC 法[3] を用いれば、入力 文を一回スキャンするだけで入力文に含まれる全ての語候補を取り出すことができ、ト ライによる方法と比べ検索速度は格段に向上する。Maruyama[4] はこのAC 法を用いて 日本語形態素解析の辞書検索の高速化を行っている。だが、辞書のデータ格納領域が大き くなるという欠点がある。ここでは前者のトライによる方法を用いて以降の解説を行う。
http://developer.yahoo.co.jp/jlp/FuriganaService/V1/furigana.html
ここんとこ、子供(下の子)の体調が少しわるくて、 ずっと機嫌がわるいし、夜は寝ないしで、妻はかなり疲れている様子。
よーし、今日は早く帰ろう。でもって、例のお勉強は家にもって帰ろう……とか思ってたんですが。
しまった!今日は残業時間に会議だった。
くそー、やっぱ残業時間に会議をいれるのは良くないよ。
http://harvardmedblog.blog90.fc2.com/blog-entry-241.html
まったくその通りだと思うのだけど、この日記は全部「初稿」です(苦笑)。