前回の記事で、日本Androidの会の定例イベントに行ってきたと報告しましたが、続きです。
というか、「講演やその後の懇親会の様子等は、後で別記事として追記予定です」と書いたのですが、いつの間にか半月が経過してしまいました。
もう記憶があやふやになってしまったので、ちゃんとしたレポートは「日本Androidの会 女子部」さんのブログで!
以下、メモ程度に書き連ねていきます。
今回のセッションは以下の3本でした。Ustreamに動画がありますので、フルで見たい方はそちらをどうぞ。
- 【前半】NTT音声認識技術の最前線 (NTTコミュニケーション科学基礎研究所): 重み付き有限状態トランスデューサ (WFST) に基づく音声認識技術、雑音混じりの音声から人の声だけを抜き出す音声強調処理、マルコフモデル、組み込みでも動作可能。
- 【後半】音声認識応用アプリの現状と未来 (NTTサイバースペース研究所): 音声による株価照会システム、マルチモーダルWeb、対話型案内システム、テレビリアルタイム字幕作成システム (アナウンサーの声は認識しやすい。スポーツ中継などは字幕作成用に要約して発話する専任アナウンサーで対応)、議会録作成システム (会社の会議録は難しい)。
- 【ショートセッション】「World Mobile Congress 2010」レポート (日本Androidの会)
後半の質疑応答タイムで、最後に一人だけ手短に質問をと求められたので、記念に質問をしてみました。音声認識という話題ではあまり専門的なことは聞けないので、プレゼンテーションの最終ページで「あなたなら、ちょっと癖のある音声認識技術を何に応用しますか?」という問いかけがなされていた点について:
質問: 「『音声認識技術を何に応用しますか?』ということなんですけども、あのー、なにかこう、遊べるような、そういうものが提供されていると、それを使っていろいろ『柔軟な』ものができていくと思うんですけど、NTTさんではそういったものというのはすでにあるんでしょうか、それともこれからそういった予定があるんでしょうか」(Ustreamから文字起こししたのですが、やっぱり相当テンパっていて、音声認識率は悪そうです)
回答: NTTも一企業なのでフリーでそういったソフトの提供はできないが、複数の大学が共同でフリーウェアの音声認識エンジン「Julius」を開発・公開している。かなり高度な音声認識が可能なので、APIを理解すればそういったものを使って音声認識を自由に活用することができる。
時間を大幅にオーバーして終了した後、懇親会へとなだれ込みました。
前回参加した去年5月の懇親会は30人いるかいないかくらいの規模でしたが、今回は軽く倍以上の規模になっていて驚きました。
しかも今回は「World Mobile Congress 2010」のおみやげを賞品としたじゃんけん大会付き。各テーブルからの勝ち抜き戦で、自分は一回戦敗退を喫したものの、すぐ隣に座っていたTさんが見事1等賞品を獲得です!
1等はカンファレンスのロゴが入ったリュックサック。しかしその中を開けると……?
なんと、Google製スマートフォン「Nexus One」が入っていました! 当たった方には、Androidアプリを最低1つ作る義務が課せられるそうです。何はともあれ、おめでとうございます。(ちなみに、3枚上の写真はTさんがスピーチしている状況だったと思います。)
今回、たくさんの方とお話ししたり、名刺を交換したりさせていただきました。「名刺にTwitterのアカウントは載せてないんですか?」と聞かれたので、こんど個人名刺を作るときにはTwitterのアカウント付きにしたいと思います。
次回、2010年4月の定例イベントは4/5(月)、東京大学駒場第二キャンパス コンペンションホールにて開催されます。今回と同様、定員300人の広い会場なので、抽選にはならない気がします。忘れずに申し込みたいですね。
コメント
コメントフィードを購読すればディスカッションを追いかけることができます。