KAKASIを使って増田を音声読み上げ

ソースはこれ
汎用化しようとするとnormalizeがたいへんそうな気が。

$KCODE = 's'

ENV['KANWADICTPATH']  = 'C:\usr\local\kakasi\share\kakasi\kanwadict'
ENV['ITAIJIDICTPATH'] = 'C:\usr\local\kakasi\share\kakasi\itaijidict'

require 'rubygems'
require 'aqtk'
require 'kakasi'
require 'kconv'
require 'hpricot'
require 'open-uri'

def normalize!(src)
  src.tr!('ぁぃぅぇぉ', 'あいうえお')
  src.gsub!('', '')
  src.gsub!('', '')
  src.gsub!('', '')
end

src = open('http://anond.hatelabo.jp/20090211054509')
doc = Hpricot(src)
content = (doc/'div.section p').select {|i| i.attributes['class'] != 'sectionfooter' }.map {|i| i.inner_text }

content.each do |row|
  koe = Kakasi.kakasi('-isjis -osjis -JH -KH', row.tosjis)
  normalize!(koe)
  puts koe
  AquesTalk::Da.play_sync(koe)
end

/MTでビルドされたKAKASIはないかなぁ…。