2023-12

tts

pyopenjtalkへのユーザー辞書登録

こんにちは、eQOL(イーキュオル)の山下です。今回はOpenJTalkへのユーザー辞書登録、特にPythonのラッパーであるpyopenjtalkへのユーザー辞書登録について紹介します。OpenJTalkはMecabを利用していますので基本的にはMecabへのユーザー辞書登録なのですが、OpenJTalkがTextToSpeech(TTS)のライブラリなので、若干Mecab辞書と異なる点があります。その点を中心に解説していきたいと思います。OpenJTalkとは名工大や情報通信研究機構(NICT)が中心となって作ったオープンソースのTTSシステムで、簡単なコマンドやプログラミングインタフェースを通じて利用できます。テキストから音声合成を行う際、使いやすいAPIやコマンドラインツールを提供し、幅広い環境で利用可能です。また、カスタマイズ性が高く、ユーザーが音声の特性や発音を調整できる柔軟性も持ち合わせています。ESPnetとOpenJTalkESPnetは、End-to-Endの音声処理のためのオープンソース・ツールキットです。言語翻訳、音声認識、音声合成など、多岐にわたる音声処理のタ...
tts

Mecabへのユーザー辞書登録

こんにちは、eQOL(イーキュオル)の山下です。テキストを自動で読み上げるTextToSpeechが身近な存在になりつつあります。youTubeの音声が自動読み上げ音声であることも多くなりましたが、時折人間ではありえないような読み間違えがあリます。これらはあらかじめ人間が文章をチェックして読みを修正できれば問題はありませんがマンパワーが課題となります。さらにChatGPTなどの生成AIとの組み合せとなると、人間が介在して読みを補正することは現実的ではありません。生成AIが立派な文章を生成しても読み違えが起こるようでは、サービス自体への信用にも影響が出かねません。テキストを「読み」に、そして「発声」へと変換する仕組みには、形態素解析という日本語ならではの技術が必要で、それを行う代表的なオープンソースライブラリとして知られるのがMecabです。テキストを音声に変換する日本語TextToSpeech(TTS)代表的オープンソースのOpenJTalkもMecabを利用しています。Mecabの辞書をカスタマイズしてみよう、というのか今回のブログの内容です。MeCab で楽にシステム辞書に単語を追...
アプリ

Translate Text in Firestore

こんにちは、eQOL(イーキュオル)の山下です。本日は行政等の窓口で使える通訳アプリの開発の際にとても便利だったFirebaseの機能拡張について紹介します。通訳アプリはスマホOSに標準装備されている時代ですが、それでも行政や病院などの窓口で使いやすい専用アプリの需要があります。今回は多国語対応の通訳システムをGoogleのクラウドサービスであるFirebaseを利用してGoogle Translation APIを簡便に利用する方法を紹介します。FirebaseとFirestoreFirebaseはGoogleが提供する開発者向けのプラットフォームで、アプリの開発、改善、運営をサポートする統合ツール群です。Firebaseには多岐にわたる機能がありますが、その中でFirestoreはNoSQLクラウドデータベースのサービスです。スマホネイティブアプリやwebアプリを作成する際のバックエンド機能を実装する際には極めて便利なツールと言えます。FirestoreGoogle Translation API翻訳系のAPIといえば、まず思い浮かぶのはこれではないでしょうか。Googleの翻訳サ...