海野秀之(うんのひでゆき)の外部記憶
Twitter (twilog) / RSS / アンテナ / ぶくま
Haskell プログラムをあるていど読み書きできるようになってから読むと、面白いぞ!
http://d.hatena.ne.jp/m-hiyama/20060821/1156120185
第2歩のコメント欄より:
圏の一般論では、圏の条件(公理)で述べていること以外は何も仮定しません。圏の公理のどこをみても、「対象は集合だ」とか、「射は作用である」とか書いてないですよね。
ふむふむ。
誰でも思いつきそうなので、きっとだれか思いついてそうですが、メモっておくことにする。
ざっと文献をチラ見したところによると、日本語の音声認識において、母音を認識するだけなら(もちろん識別率100%ではないが)、比較的容易らしい。第1、第2フォルマントによる二次元ベクトル量で特徴抽出が可能だとか。
考えてみれば、われわれ人間だった、純粋に「耳」だけで、日本語の音をきちんと識別しているかというと、大変うたがわしい。識別率うんぬんについて、機械をバカにできるほど、きちんと聞き分けているかというと、そんなことなさそうです。
一方、Slime なんかを見ると、コンピウタさんは偉いもので、母音がだいたいわかれば、元の文を推測するなんて芸当を(人間には苦痛ですが)、なんとかこなしてくれそうな気もします。
つまり、音響認識部では、母音の識別+αくらいにしておいて、基本、母音列から推定するつもりで、後段でがんばる。
いけそうじゃない?
# うんの [さすがに、母音しかわからない状態まで縮退した情報から、もとの文を推定するのはムリゲーくさい。 ふと、大学時代の先生..]
# うんの [母音の識別に従来通りフーリエ解析を用いつつ、母音の直前には1個または0個の子音があるかもという知識と、ウェーブレット..]