tts

tts

pyopenjtalkへのユーザー辞書登録

こんにちは、eQOL(イーキュオル)の山下です。今回はOpenJTalkへのユーザー辞書登録、特にPythonのラッパーであるpyopenjtalkへのユーザー辞書登録について紹介します。OpenJTalkはMecabを利用していますので基本的にはMecabへのユーザー辞書登録なのですが、OpenJTalkがTextToSpeech(TTS)のライブラリなので、若干Mecab辞書と異なる点があります。その点を中心に解説していきたいと思います。OpenJTalkとは名工大や情報通信研究機構(NICT)が中心となって作ったオープンソースのTTSシステムで、簡単なコマンドやプログラミングインタフェースを通じて利用できます。テキストから音声合成を行う際、使いやすいAPIやコマンドラインツールを提供し、幅広い環境で利用可能です。また、カスタマイズ性が高く、ユーザーが音声の特性や発音を調整できる柔軟性も持ち合わせています。ESPnetとOpenJTalkESPnetは、End-to-Endの音声処理のためのオープンソース・ツールキットです。言語翻訳、音声認識、音声合成など、多岐にわたる音声処理のタ...
tts

Mecabへのユーザー辞書登録

こんにちは、eQOL(イーキュオル)の山下です。テキストを自動で読み上げるTextToSpeechが身近な存在になりつつあります。youTubeの音声が自動読み上げ音声であることも多くなりましたが、時折人間ではありえないような読み間違えがあリます。これらはあらかじめ人間が文章をチェックして読みを修正できれば問題はありませんがマンパワーが課題となります。さらにChatGPTなどの生成AIとの組み合せとなると、人間が介在して読みを補正することは現実的ではありません。生成AIが立派な文章を生成しても読み違えが起こるようでは、サービス自体への信用にも影響が出かねません。テキストを「読み」に、そして「発声」へと変換する仕組みには、形態素解析という日本語ならではの技術が必要で、それを行う代表的なオープンソースライブラリとして知られるのがMecabです。テキストを音声に変換する日本語TextToSpeech(TTS)代表的オープンソースのOpenJTalkもMecabを利用しています。Mecabの辞書をカスタマイズしてみよう、というのか今回のブログの内容です。MeCab で楽にシステム辞書に単語を追...