Googleの新世代音声合成エンジン「WaveNet」が日本語に対応したってことで早速試すなう。https://t.co/6ipj13z5TD
— 松VR (@matsu_vr) 2018年7月19日
やっぱレベル高い! 何がすごいって、英単語をちゃんとカタカナ読みしてるんです。まさに日本語エンジン。これが誰でも100万文字あたり16ドルで使えるなんてすごい時代だ...! pic.twitter.com/i4C6RNZAFb
滑らかで間違いが少ない、イントネーションが普通の語りっぽい音声合成エンジンは全人類の夢ではあるけど(そこまでオーバーでは無い)、グーグルもこんなものを開発していたのかあという驚きと、その品質にちょいとびっくり。英単語をちゃんと読んでくれるのは嬉しいね、確かに。
ただ、価格が従量制なので、アプリの買取タイプの方が精神的負担は少ないなあという感じはある。なので、例のボーカロイドシリーズの方が個人的にはいいかな、と。
Cloud Text-to-Speech https://t.co/HgB2KQPfMg 日本語でもそこそこ。ただし日本語の解析には時間がかかるようで、長文になるとハングってしまうのです。 pic.twitter.com/fp0KSJjkfD
— 不破雷蔵 (@Fuwarin) 2018年7月20日
実際に試してみると、本当に結構なレベルでのスマートさに驚かされる。ここまで出来るんだなあ、と。ただ現状では日本語においては結構難儀しているようで、一定量の文章をぶち込むとハングを起こしてしまうのが難点。
それよりも時々出てくる例の画像認証。最新のロジックだと何度でも繰り返し入力を求められ、事実上リロードしてキャンセルしなさいというのと同義に。 pic.twitter.com/LtmodInGzc
— 不破雷蔵 (@Fuwarin) 2018年7月20日
それよりも頭を抱えたのは、この画像認証。バスとか道路標識が入っているエリアをチェックしなさいというものだけど、先日mixiにも導入されたタイプ...なんだけど、判定を繰り返し繰り返し求めてきて、いつまで経っても終わらない次第。これではログインするなと言っているのとどれほどの違いがあるのか。ロボットか人間かを確認するのなら、1、2回の精査で十分なんだけどな。
コメントする