音声入力による文章の作成。
今回私のサブマシーン、MacBook Pro (Ratina, 13-inch, Early 2015), プロセッサ 2.7 GHz Intel Core i5に最新のCatalinaをインストールしてみました。
多くの機能強化がなされているとのことですが、私の興味は音声入力。
これまでと比べて音声入力の正確性はどうなのでしょうか?
音声入力といえば、現在世間ではGoogleの音声入力が最強だと言われています。
しかしGoogleの音声入力はChromeのGoogleアプリであるドキュメントの上でしか使うことができません。
Googleアプリのドキュメント自体が大変優れたアプリであるので、それはそれで有用ではありますが、いかんせん、日本語入力では句読点を入力することができません。
仕方がないので、普段私は「Voice Note]という無料のアプリを使って音声入力しています。これも句読点入れられませんが、Google音声入力よりも手軽に使えるのです。
しかしこのソフトがいくら優秀であっても、文章を音声で入力して、その文章をコピーしてブログに貼り付けるという手間が必要なのです。
一方これまでMacに付属していた音声入力は、句読点は入力できるものの、Googleの音声入力よりは正確性に若干劣るとの評価のようでした。(Windowの音声入力よりはよっぽどいいですが)
なので一度試したきり、今まで使用していなかったのです。
しかし、今回新しいMac OSに変わったことで、Macの音声入力も精度が増しているかもしれないと思いトライしてみることにしました。
結果として、Macの音声入力の精度はGoogleの音声入力と互角レベルであり、さらには句読点の入力、そして改行までもが音声入力可能であることがわかりました。
Googleの音声入力とMacのCatalinaに付属の音声入力の正確性を比べてみる。
まずはGoogleの音声入力から始めましょう。
当サイトの人気記事であるピタでんの記事を音声で読み上げていきます。
こちらが今回入力する文章です。
まずはピタですが、ピタでんとはF-Powerという会社が行っている家庭向け新電力供給事業のサービス名なんです。
F-Powerは1997年5月2日に設立された株式会社ファーストエスコが会社分割し、2009年4月に設立された電力供給事業会社です。
2011年4月から中部地域で電力の小売を開始。つまり産業用の電力小売りに参入した会社ということになります。
電力供給専門会社ですね。
産業用電力小売事業としてはシェアNo.1だと言われています。
Googleの音声入力の実力を検証
上記文章をGoogle音声入力で文章化してみます。
Googleドキュメントを立ち上げることから始めます。詳しくは下記記事をご参照。
リビングのMac BookProで、結構テレビの音が大きい環境です。
マイクは使っていません。Macの内蔵マイクでのテストです。
では、その結果からです。
まずはぴたでんですがイタ電とは F Power という会社が遅なっている家庭向け新電力供給事業のサービス名なのです
FP は前 は1997年5月2日に設立されたか は1997年5月2日に設立された株式会社パワー は1997年5月2日に設立された株式会社ファーストエスコが会社分割して は1997年5月2日に設立された株式会社ファーストエスコが会社分割し2009年4月に設立された件
2011年4月から中部地域で電力の小売を開始つまり産業用の電力小売りに参入した会社ということになります
電力供給専門会社ですね
産業用電力小売事業としてはナンバーワンだと言われています
上記は、Google音声入力での結果です。
時々反応せず、数秒おいて再度トライすると入力が開始されるという状況がありました。
改行は全て手で行いました。句読点は打てないので、次は句読点も手で入力してみます。
まずはぴたでんですが、イタ電とは F Power という会社が行なっている家庭向け新電力供給事業のサービス名なんです。
エフパワーは1997年5月2日に設立された株式会社ファーストエスコは会社分割し、2009年4月に設立された電力供給事業会社です。
2011年4月から中部地域で電力の小売りを開始。つまり産業用の電力小売りに参入した会社ということになります。
電力供給専門会社ですね。
産業用電力小売事業としてはシェアナンバーワンだと言われています。
これは、手で句読点入力と改行を行った結果です。「ファーストエスコは会社分割し、」と入力した時点でいったん中断され、数秒待ってから再度入力を開始しました。
概ね良好な認識力です。
「ピタでん」や「F-Power」という固有名詞は苦手なようで、それ以外はほぼ満点です。
次はMacのCatalinaに標準搭載の音声入力を試してみます
Google音声入力と同じ環境。テレビの音は相変わらず大きいです(笑
設定方法はとても簡単です。
りんごマークからシステム環境設定を選択します。システム環境設定が開いたらその中のキーボードををクリックです。↓
キーボードの設定が開いたら1番右端の音声入力をクリックし音声入力をオンにします。
デフォルトではファンクションキー(Fn) を2回押すことで音声入力が可能になります。
では、始めていきましょう。
まずは北店ですが、来た人とはエフパワーと言う会社が行っている家庭向け新電力供給事業のサービス名なんです。
エフパワーは1997年5月2日に設立された株式会社ファーストエスクが会社分割し、2009年4月に設立された電力供給事業外車です。
2011年4月から中部地域で電力の小売りを開始。つまり産業用に電力小売りに参入した会社と言うことになります。
電力供給専門会社ですね。
産業用電力小売事業としてはシェアナンバーワンだと言われています。
MacのCatalinaに搭載されている音声入力もGoogleに負けない結果になったと思いますが、いかがでしょうか?
Google音声入力同様に「ピタでん」、「F-Power」はまともに入力できませんでした。やはり固有名詞は苦手なようです。
「でんりょくきょうきゅうがいしゃ」と読み上げたところ、会社が外車になっています。
さらに、1文章ごとに音声入力が終了してしまいます。文章を確定させて改行させるためにReturn Keyを押すと、音声入力が自動的に終了してしまいました。
それ以外はGoogleと同レベルですね。
Macの音声入力では、句読点は問題なく入力できます。
「。」を入力するときには「まる」
「、」入力するときには「てん」と発音します。
「?」は「クエスチョン」
「!」は「びっくりマーク」です。
更になんと、「改行」は、「リターンキーを押す」で対応します。
現時点のMacのCatalinaは開発バージョンで正式版ではありません。
正式版がリリースされたら、追記したいと思います。
念のために、現行OS Mojave 10.14.5でも検証
Macの音声入力は、Googleと同じく基本はクラウドサービスです。
つまりAppleが設置しているクラウドのコンピュータに接続して、そこで音声を認識しているのです。
その意味では、個別のMacに搭載されるOSのレベルは関係ないとも考えられます。
そこで念のために、現行のOS Mojave10.14.5でも同様に音声入力を試してみました。
使用したのは私のメインマシン。MacBook Pro(15-inch, 2016) プロセッサ 2.7 GHz Intel COre i7。
まずはぴたでんですが、ピタデントはエフパワーという会社が行っている家庭向け新電力供給事業のサービス名なんです。
エフパワーは1997年5月2日に設立された株式会社ファーストとエスコが会社分割し、2009年4月に設立された電力供給事業会社です。
2011年4月から中部地域で電力の小売を開始。つまり産業用の電力小売に参入した会社ということになります。
電力供給専門会社ですね。
産業用電力小売事業としてはしやナンバーワンだといわれています。
この結果を見る限り、現行OSと新OSでの音声入力の精度については差がないように見えます。
さらにこのマシンで試したところ、文章は即時に確定され、Returnをおす必要がありませんでした。
クラウドサービスの場合は、多くの人のインプットによって日々精度が改善されていきます。
つまりMacを使っている人にとって、音声入力は既にGoogleの音声入力に匹敵するレベルになっているのではないか、と思います。
まとめ
Macの新OSであるCatalinaをインストールして音声入力を試してみました。
結果として音声の認識率はGoogleの音声入力と遜色ないレベルになっていることが確認できました。そしてそれはCatalinaだけではなく、Macに標準搭載の音声入力自体の進化だということが確認できました。
この結果によりMacユーザはどのようなアプリであっても、気軽に音声入力ができるということになります。
Macの音声入力についてメリットデメリットをまとめてみます。
マックの音声入力のメリット
-
ファンクションキーを2度押すことで瞬時に立ち上がる。
-
どのようなアプリケーションであっても精度の高い音声入力が可能になる。
-
句読点の入力も、改行も音声で実行できる。
マックの音声入力のデメリット
-
現時点のCatalinaでは1つのセンテンスが終了するごとにReturnを入力する必要があった。しかし、CPU昨日の高いMojave搭載機種では、Returnを押さずとも文章が確定された。さらなる検証が必要。
-
文章を確定するためにReturnを入力することで音声入力機能は一旦終了する(旧機種、開発バージョンCatalina)。したがって、次の文章を入力するには再度音声入力機能を立ち上げる必要があった。
-
個人の辞書は登録できないので、固有名詞の誤変換は避けられない。
現時点でも完璧とは言い切れません。
しかしその手軽さと音声認識精度の高さから、Macは十分な音声入力の能力を備えたと言えると思います。
これまで私は、Voice noteと言う外部アプリを使って音声入力をしていました。
このアプリも大変優秀なアプリで重宝していました。
しかし、Mac標準の音声入力がこれほど高精度になったので、今後はMacの音声入力システムで入力していくことになるでしょう。
ITの世界は日進月歩ですね。素晴らしいエンジニアのおかげでますます便利になっていきます。
せっかくの機能なので使わない手はありません。Macユーザのあなたならこの秋の正式バージョンのCatalinaをインストールしてぜひ楽しんでみてください。