Top > Programmingとか > VB / VB.NET > VB小ネタ

聞けるWindows

直前のエントリーと同じく、MSDN Magazine日本語版2006年1月号の記事からWindows Vista における音声認識と音声合成の新規 API

その技術的な情報以前に私が一番びっくりしたのは、

Windows Vista には、キーボード、またはマウスを使用せずに Windows を制御したり、テキストを入力したりする必要のあるユーザー専用に設計された組み込みの音声認識ユーザー インターフェイスが含まれます。また、最新の汎用的な音声認識エンジンもあります。
今度のWindowsは聞く耳持ってるぜ!
また、Windows Vista は、音声合成においてもマイクロソフトの新世代の始まりとなります。これは、最新の技術を活用するために完全に作成し直されています。
トークが愉快なナイスガイだぜ!


ほんとはねぇ。

Officeのイベント音なんかも大いに「気づき」に貢献していて、私なんかは耳をそばだてて作業したいクチなんですけど。
今の職場は原則音声禁止だもんなー。サウンドカードのないビジネスモデルマシンがほとんどで、でなけりゃスピーカーつけないで使えってことになっているので。
ヘッドフォンも、電話に出にくいとか周囲の呼びかけに反応しにくいとの理由で休日出勤時以外はアウト。
環境としてはわずかな差ですが、けっこぅ効率に響いています(T-T)。

そんな状況下でVistaはしゃべりますか。マイクつなげてしゃべれと言いますか。
おもしろいけど、おもしろいけど職場でつぶやきながら作業することを元請さんは認めてくれるだろうかなぁ。



実はもひとつ懸念。

今回の音声機能提供の前に、Microsoft Agentって音声合成技術があるんですが、こいつ、英語しかしゃべれなかったんですよね確か。
音声合成の大元を日本語の発音で構成しなきゃならないので、他の製品のように文字/文章を邦訳すれば済むって話ではなかったんですよね。

今回Vistaに搭載される音声認識/合成機能も、ひょっとしたら英語圏オンリーなんではないのかしら。ネイティブランゲージがイングリッシュで日本語は学生の時に第二外国語でちょっと学んだことがあります程度の語学力になってしまわないかしら。

上記の記事をざっと読んだ感じでは、最初からさまざまな言語の聞き話しを前提として開発が進められているようなんですけど。どこまで期待していいんだろう。

  1. Vista日本語版にはあらかじめ日本語対応の音声エンジンが搭載されて発売開始。

  2. まずは英語版。日本語版はVista発売開始とは別タイミング、半年~1年くらいずれてMicrosoft Update経由で組み込み。「日本語の言語モデルがようやく完成しました!」とかあり得そう。

  3. がんばったんだけど、今回は日本語モデルは無理でした。
応用範囲が絶対とんでもなく広いので、期待したいところなんだけどなぁ。

トラックバック

このエントリーのトラックバックURL:
http://salv.miscnotes.com/mt/mt-tb.cgi/512

コメント

(この文章は音声認識で入力しています。)

Vistaの音声認識、すごく気に入りました。
音声入力だけでなく、音声操作の方も面白いです。

「電卓を起動」 (でんたくをきどう)
「3*3 =」 (さん あすたりすく さん いこーる)
なんてやって遊んでいます。

気になったのが、英語ベースで開発されているためか、
変換キー、無変換キー、漢字キー、英数キー、が押せないことです。
スペースキーや、ファンクションキーで代用ができますが、やはり不便です。

Vistaの発表前には、音声認識に関する記事がたくさんありましたが、
最近はとんと見かけなくなってしまい残念です。
音声認識の情報を、拡充していただけるようお願いいたします。

あっすごい。Vistaの音声機能を使い込んでいる方に初めてお会いしました。

文字入力だけではなく電卓などの起動と操作も音声でできるのであれば、かなり面白いことができそうですね。

> 最近はとんと見かけなく

そうですね。

いち早く知りたいというユーザ側のニーズもあるせいで、発売前にベータ版をベースにした記事ばかり公開される状況を、私も少々残念に思っています。

Vistaマシンを入手した方がぼちぼち出てきた今こそ、製品版をベースとしたしっかりした情報がほしいですよね。

> 気になったのが、

うーん。
変換・無変換・カタカナは、英文の資料では「Henkan」「Muhenkan」「Katakana/Hiragana」となっていますが…そのまま発音しても通らないでしょうか…。

> 音声認識の情報を、拡充していただけるよう

えーと私はまだXPメインで作業していますのでそうそうは難しいかもです。

5/19のCLTイベント広島(もうすぐマイクロソフトから正式アナウンスがあるはず)で、VB Stationの樋口さんが音声技術についてのセッションを張るはずですので、公開されたら情報回しますね。

コメントを投稿