【fjconsultants365日Blog:3,763投稿目】fjコンサルタンツ藤原毅芳

音声入力にはまる

2年ほど前から「音声入力」にはまっています。
精度が許容範囲に入ってきたので通常使用で問題を感じない
ことが大きな要因。

書く量が増加したのも、もうひとつの要因です。
ここ1年ほどはさらに書く量を増加させているので
テキストの入力作業が問題になってくるのです。

キーボードで入力する場合、自分に会ったキーボードを
見つけることができれば入力作業は軽減されます。

ただ私の場合は定位置で作業することがかいのでどうしても
ノートパソコン、タブレット、スマートフォンで入力するしか
ありません。

ノートパソコンはキーボードに個性はないので、そのキーボード
にこちらが合わせるしかないのです。
そのため腱鞘炎になったこともあります。
(打ち方がわるいのが原因です)

そうなるとキーボードを打って入力するという方法以外を
模索することになるのです。

今のところキーボード以外となると音声入力に落ち着きます。
これが将来どうなっていくのかを見ていきたいと思います。

音声入力の現在

音声入力はスマホ、タブレットには標準搭載されるように
なりました。

ノートパソコンでも標準で搭載される率は上がっています。
精度も上がっており、使用に関して嫌悪感を抱くレベルを
脱しており実用レベルにまで到達しています。

というのも、音声入力から文字への変換が通信を介して
行われており、文脈を読み取って変換しているからです。

通信をしながら変換するという手法は、ポケット翻訳機でも
使われており、当たり前の構造となりました。

音声入力ソフト単体では変換に対応できる範囲に限定的であり
またバージョンアップがその都度必要になるので限界があった
のです。

これが常時通信をすることによって解決されているのです。

音声入力の効能もある

実は音声入力は日本語には大きなメリットがあります。
日本語はキーボード入力するときにローマ字入力が主流で
一文字を入力するのにキーを2回打つことになります。

そのため頭で考えたことを入力用に変換をしてキーを
打っているのです。
手書きに比べて、ひと手間増えてしまうのです。

それが音声入力では頭に浮かんだことを音声として発すれば
そのまま文字になるので、思考が停止することがありません。

スムーズに文章を書き記すことができるのです。
この快感を知ってしまうと音声入力から離れられなくなります。

音声入力の問題点は

音声入力の問題点は、同じ空間に他人がいると、やりにくい
感覚があることです。

人がいるところで音声入力をすると他人の目が気になるので
「恥ずかしさ」が出てしまいます。

この感覚は日本では大きく、AIスピーカーも広がらないのは
こうした感覚が強いからだと思います。

音声入力が使えるなら言い訳できない

今までキーボードを打つのが苦手、ということ報告資料
の作成を避けてきた層の人がいます。

この人たち、今後は言い訳できません。
音声入力なら誰でもできるからです。
子どもでもできる程度にハードルが下がってしまうと
大人は言い訳できなくなるのです。

資料作成や報告、メール、グループウェアなどの入力に
対して「ちょっと苦手なので」といったことが今後は
なくなるということ。

社内のデジタル化も障壁のひとつが消滅したといっても
過言ではないでしょう。

入力インターフェイスは今後も変化する

入力インターフェースはキーボード→音声入力と変化していますが
この後はどのように変化するのでしょうか。

いくつかの新しい技術が開発されようとしています。
そのうち、次の2点を取り上げます。

  • ジェスチャ インターフェース
  • 非接触コマンド入力インターフェース

ジェスチャ インターフェース

ジェスチャ インターフェースとは手の動きによって
操作する仕組みです。

まだマウスの動きをジェスチャに置き換える形になるので
テキスト入力を直接できるわけではありません。
補助的にジェスチャ インターフェースを使うというポジションに
落ち着いています。

しかし、ARと合体した時には仮想キーボードを指でなぞるだけで
テキスト入力できるようにはなっていきます。
販売はされていませんが技術開発はできています。
SF映画に出てくる場面が実際に実現するのもそんなに遠くは
ないでしょう。

【参考】
「モバイル指向ジェスチャ入力デバイスの研究」


「スマートグラスを業務で利活用するためのキーボードレス環境での文字入力を実現」
https://www.nttdata.com/jp/ja/news/release/2014/101502/

非接触型コマンド入力インターフェース

非接触型コマンド入力インターフェースとは
口唇の動きから入力する方式です。

音声入力はマイクが拾う雑音が精度を下げてしまうという欠点が
あります。

その点、口唇の動きで入力できれば雑音は入ってきません。
実際に音にしなくても口唇の動きだけで入力できるので楽な
作業になります。

音声入力と口唇の動きを読み取る非接触型インターフェースが
合体したら飛躍的に便利になるのは想像できます。

小さな音量でしゃべっても正確に入力できるようになるからです。
会議の議事録も自動で正確に記録できるようになるでしょう。

【参考】
「口唇の動き特徴を用いた非接触型コマンド入力インタフェースに関する検討」

まとめ

音声入力の現状を振り返り、将来の入力インターフェースを
考えてみましたが、まだまだ改善の余地があることに気がつきます。

テキストの入力作業はハードルが高いと感じながら15年ぐらい
経とうとしています。

ようやくひとつハードルを超えたのを実感する時期にきました。
今後はさらに飛躍していくと想像しています。
「あの時はキーボードというハードを打って入力していたんだよ」
と言う時代が来るのでしょう。