---
title: "音声入力の実用性と次の入力インターフェースとは"
date: 2019-04-19
url: https://businesscreation.jp/2019/04/19/%e9%9f%b3%e5%a3%b0%e5%85%a5%e5%8a%9b%e3%81%ae%e5%ae%9f%e7%94%a8%e6%80%a7%e3%81%a8%e6%ac%a1%e3%81%ae%e5%85%a5%e5%8a%9b%e3%82%a4%e3%83%b3%e3%82%bf%e3%83%bc%e3%83%95%e3%82%a7%e3%83%bc%e3%82%b9%e3%81%a8/
categories: [ビジネスキーワード]
tags: [キーボード, 音声入力]
---

# 音声入力の実用性と次の入力インターフェースとは

【fjconsultants365日Blog：3,763投稿目】fjコンサルタンツ藤原毅芳

## 音声入力にはまる

2年ほど前から「音声入力」にはまっています。
精度が許容範囲に入ってきたので通常使用で問題を感じない
ことが大きな要因。

書く量が増加したのも、もうひとつの要因です。
ここ1年ほどはさらに書く量を増加させているので
テキストの入力作業が問題になってくるのです。

キーボードで入力する場合、自分に会ったキーボードを
見つけることができれば入力作業は軽減されます。

ただ私の場合は定位置で作業することがかいのでどうしても
ノートパソコン、タブレット、スマートフォンで入力するしか
ありません。

ノートパソコンはキーボードに個性はないので、そのキーボード
にこちらが合わせるしかないのです。
そのため腱鞘炎になったこともあります。
（打ち方がわるいのが原因です）

そうなるとキーボードを打って入力するという方法以外を
模索することになるのです。

今のところキーボード以外となると音声入力に落ち着きます。
これが将来どうなっていくのかを見ていきたいと思います。

### 音声入力の現在

音声入力はスマホ、タブレットには標準搭載されるように
なりました。

ノートパソコンでも標準で搭載される率は上がっています。
精度も上がっており、使用に関して嫌悪感を抱くレベルを
脱しており実用レベルにまで到達しています。

というのも、音声入力から文字への変換が通信を介して
行われており、文脈を読み取って変換しているからです。

通信をしながら変換するという手法は、ポケット翻訳機でも
使われており、当たり前の構造となりました。

音声入力ソフト単体では変換に対応できる範囲に限定的であり
またバージョンアップがその都度必要になるので限界があった
のです。

これが常時通信をすることによって解決されているのです。

![](https://www.businesscreation.jp/wp-content/uploads/2016/12/MBP9V9A8418_TP_V-300x200.jpg)

#### 音声入力の効能もある

実は音声入力は日本語には大きなメリットがあります。
日本語はキーボード入力するときにローマ字入力が主流で
一文字を入力するのにキーを2回打つことになります。

そのため頭で考えたことを入力用に変換をしてキーを
打っているのです。
手書きに比べて、ひと手間増えてしまうのです。

それが音声入力では頭に浮かんだことを音声として発すれば
そのまま文字になるので、思考が停止することがありません。

スムーズに文章を書き記すことができるのです。
この快感を知ってしまうと音声入力から離れられなくなります。

#### 音声入力の問題点は

音声入力の問題点は、同じ空間に他人がいると、やりにくい
感覚があることです。

人がいるところで音声入力をすると他人の目が気になるので
「恥ずかしさ」が出てしまいます。

この感覚は日本では大きく、AIスピーカーも広がらないのは
こうした感覚が強いからだと思います。

### 音声入力が使えるなら言い訳できない

今までキーボードを打つのが苦手、ということ報告資料
の作成を避けてきた層の人がいます。

この人たち、今後は言い訳できません。
音声入力なら誰でもできるからです。
子どもでもできる程度にハードルが下がってしまうと
大人は言い訳できなくなるのです。

資料作成や報告、メール、グループウェアなどの入力に
対して「ちょっと苦手なので」といったことが今後は
なくなるということ。

社内のデジタル化も障壁のひとつが消滅したといっても
過言ではないでしょう。

### 入力インターフェイスは今後も変化する

入力インターフェースはキーボード→音声入力と変化していますが
この後はどのように変化するのでしょうか。

いくつかの新しい技術が開発されようとしています。
そのうち、次の2点を取り上げます。

- ジェスチャ インターフェース
- 非接触コマンド入力インターフェース

#### ジェスチャ インターフェース

ジェスチャ インターフェースとは手の動きによって
操作する仕組みです。

まだマウスの動きをジェスチャに置き換える形になるので
テキスト入力を直接できるわけではありません。
補助的にジェスチャ インターフェースを使うというポジションに
落ち着いています。

しかし、ARと合体した時には仮想キーボードを指でなぞるだけで
テキスト入力できるようにはなっていきます。
販売はされていませんが技術開発はできています。
SF映画に出てくる場面が実際に実現するのもそんなに遠くは
ないでしょう。

【参考】
「モバイル指向ジェスチャ入力デバイスの研究」

「スマートグラスを業務で利活用するためのキーボードレス環境での文字入力を実現」
https://www.nttdata.com/jp/ja/news/release/2014/101502/

#### 非接触型コマンド入力インターフェース

非接触型コマンド入力インターフェースとは
口唇の動きから入力する方式です。

音声入力はマイクが拾う雑音が精度を下げてしまうという欠点が
あります。

その点、口唇の動きで入力できれば雑音は入ってきません。
実際に音にしなくても口唇の動きだけで入力できるので楽な
作業になります。

音声入力と口唇の動きを読み取る非接触型インターフェースが
合体したら飛躍的に便利になるのは想像できます。

小さな音量でしゃべっても正確に入力できるようになるからです。
会議の議事録も自動で正確に記録できるようになるでしょう。

【参考】
「口唇の動き特徴を用いた非接触型コマンド入力インタフェースに関する検討」

## まとめ

音声入力の現状を振り返り、将来の入力インターフェースを
考えてみましたが、まだまだ改善の余地があることに気がつきます。

テキストの入力作業はハードルが高いと感じながら15年ぐらい
経とうとしています。

ようやくひとつハードルを超えたのを実感する時期にきました。
今後はさらに飛躍していくと想像しています。
「あの時はキーボードというハードを打って入力していたんだよ」
と言う時代が来るのでしょう。