先日少し時間ができたので、python/speech-to-text apiを利用して音声認識+文字起こしを行うコードを書きました。

スポンサーリンク

demo動画

実際の活用シーン

実際このようなスクリプトを利用して、翻訳ツールなどは作成されているケースが多く見受けられます。

また、2020年3月上旬にこの領域のスタートアップが資金調達しています。この領域の技術を活用してビジネスを立ち上げている(この会社の場合はスピンオフですが)会社もあるということは、少なからずマーケットニーズがあるともいえます。

文字起こしは昔からテープ起こしなどの領域で存在したビジネスですが、AIにより少しずつ代替されてくるものといえます。

他方、まだまだ日本語の領域は自然言語処理が進んでいないものでもあります。完全に人間を代替するステージまではまだ先という印象もありますね。

スクリプトの詳細について

スクリプトの詳細については、追ってblogの方で公開・解説していく予定です。

ぜひ、こちらもご覧ください。