2019年4月
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30        
サイト内検索
ココログ最強検索 by 暴想

« XperiaTablet Z SO-03E 買っちゃった | トップページ | 暗記パン! »

2013年8月 1日 (木)

AmiVoice SP2を購入した感想を音声入力

main_img_001   
   

皆さんこんばんは。いつもブログを見ていただきましてありがとうございます。   

今日から8月。夏真っ盛りですね毎日暑い日が続いています。なぜこのような季節柄の挨拶をしているかというと、ただいま音声認識ソフトのテスト中なんです。   
   
前購入した DragonSpeech11というソフトがあります。しばらく使ってみたのですが、確かに混戦(音声)認識の精度は高いかもしれませんが、動作が重くパソコンが固まってしまうことが近縛(しばしば)りました。それで結局使わなくなってしまったという事情があります。もったいないですね   
   
でも何とか音声認識でそれなりに使えるソフトがないだろうかというのはずっと気にしていました。なぜこんなに音声認識ソフトにこだわっているかというと、仕事上また活動上で、音声で記録をとってそれを文字起こしするという作業がどうしても必要になるからです   
   
全文をすべて綺麗に文字を故障するというのが無理なのはわかっています。ただ全体の雰囲気をつかんで、そこから文字を見ながら、音声を改めて生き直すことなく簡単な記録であればつくれるようなソフトはないかとずっと探していました。   
   
そこで改めて調べてみたところ、アドバンスト・メディアという会社から発売されている AmiVoice の新しいバージョン AmiVoice SP2というものがあり、ちょっとそれを試したいなと思いまして購入しました。実は、今の文章もAmiVoice SP2の音声認識で使っています。   
   
AmiVoice というソフトは以前にダウンロード版を購入して以来1年ほど使ってきました。このソフトはおへ(声)の登録が不要でさらに系買い(軽快)に動作するというのが売りのソフトでしたが、たしかにその通りパソコンが重くなるということはありませんでした。ただ、音声認識の精度にやや問題があり、単語登録などをしてもなかなか思い通りに変換をしてくれるということはありませんでした。それでも全体の雰囲気がわかるほどの文章にはなったかと思います。時々変な誤変換なんててくる(出てくる)ことがあり、それを見ながら笑っていたりもしましたが、やっぱり実用性についてはちょっと届かないかなと思っていました。   
   
このバージョンアップ版が発売された時に気にはなっていたんですが、 DragonSpeech を使用中だったこともあって、あんまり音声認識ソフトばっかり購入するのもどうだろうと思って控えておりましたが、ちょっとまた気になって激戦州(先週)、間違えました。今週の火曜日だったかな。いつも行きつけのソフマップ神戸店にてアップグレード版を購入しました。お値段がだいたい11万円(1万円)しないぐらいだったと思います。1万円があればおいしいものは沢山食べられます。服もちょっといい服が買えます(。)なのにパソコン用品や家電製品ばっかり買っている自分はちょっとどうかと思います。   
   
さて、ただいま自宅の部屋で1人でしゃべっているわけですが、客観的に見たら結構おかしな状況です。しかも考えながらしゃべっているので話があっちこっちで皆さんにはお見苦しいものになっているかもしれません。どうしても気会長(機械調)のしゃべり方になってしまって自然なしゃべり方ができないのが自分の性格が出ているところでしょうか。   
   
さてさて、前回のバージョンもそうだったのですが、このソフトはしゃべればしゃべるほど音響学習と言って周りの環境や自分の話し方などを学習してくれるソフトです。今は購入したばっかりなのでレベルが2人)(2)ぐらいしかありませんが、最大まで学習させると120ほどになるそうです。前回のバージョンは音声認識のために用意された単語が4万語という話でしたが今回は標準で200,000個も搭載されているそうです。すごいですね。   
   
ここまで話してみてどうでしょうか。基本的に意味がわからないとかおかしいという文書にはなっていないかと思います。所々おかしなところが(は)カッコで本来の意味で入力しています。1人でマイクでしゃべる分には結構実用性が上がったのではないかと思いますが、複数人がしゃべっている会議を録音してそれは文字起こしにすぐ活用するというのはなかなか難しいようです。その場合は聞いたものを自分の声で復唱して再生すると良いということで書いてありましたので、次回何かのきっかけの時にやってみたいと思います。   
   
IT はいろいろ進化しましたが、音声認識の分野はなかなかという状況です。聞こえる人が多い社会の中でしゃべったことがすぐ文字なるという技術は聴覚障害者にとってとても良いということなのは間違いないですが、なかなか人のしゃべりかなのくせやイントネーションが記録をする環境などについて様々な要因があるため、綺麗に文章が出るということはなさそうです。ただ短文の場合は、最近はスマートフォンですぐ音声を文字にしてくれるという機能もついてきましたので、そういった機能も活用して聴覚障害者の情報保障を進めていけたら良いと思っています。   
   
最近は、テレビの生放送にも字幕がつくようになりました。このソフトは一般で販売されてるものですが、きっと業務用のソフトでこういった感じでテレビでしゃべっている人の音声を学習をさせた人が復唱してそれを少し修正しながら生放送をリアルタイムで字幕を創出しているのではないかとちょっと思っています。だんだん社会が進んでいったら良いですね。   
   
話は最初に戻りますが、今日から8月ということで本格的な夏がやってきました。8月になったからといって何かいいことが起きるとか。体重が減るとかダイエットするとか、そういった予定は特にありません。今日は珍しく早く帰ってきました。電気屋さんに行きたかったのですが、やっぱり何か衝動買いをしてしまいそうで、電気屋さんに行くのはやめておきました。今日の晩御飯はどうしようかなと思っているところですが、賞味期限の切れかかったお店(おでん)にでもしようかと思います。なぜ夏に午前(おでん)なのかということについては今日昨日あたりにお腹の調子がずっと悪くてなかなか消化に良いもの(が)を食べた方がいいのではないかと思っております。   
   
というわけで、音声認識でブログの文章を書いてみました。結局ダダだらだらとしゃべりまして、長文になってしまいましたが、 まだそんなに学習させてない段階でこれだけ綺麗に文章になれば結構使えるのではないかと思っています。ということで、もっと学習させてからまたブログの記事をしゃべってみたいと思います。その他新聞の記事とか。声に出して読みたい日本語みたいなものをしゃべるとどうなるのか。いろいろ検証してみたいと思います。こういうことをしているからお金がなくなるというのはわかるのですが、しょうがないですね。

« XperiaTablet Z SO-03E 買っちゃった | トップページ | 暗記パン! »

パソコン」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« XperiaTablet Z SO-03E 買っちゃった | トップページ | 暗記パン! »

ウメダス広告

  • 01.おすすめの商品
  • 02.売れ筋の商品
  • 03.ウメダス商品

手話関連ニュース

ウメダスカウンター

  • FC2のカウンターです。
  • ウメダス閲覧中の方
    現在: