コードでオーディオブックを作る方法 - 「santinic/audiblez」を使った自動化解説


コードでオーディオブックを作る方法 - 「santinic/audiblez」を使った自動化解説

santinic/audiblez

2025-08-29

「santinic/audiblez」は、ソフトウェアエンジニアにとって、特に以下のような点で非常に役に立ちます。

音声データ生成の自動化
音声データの生成は、手動で行うと非常に手間がかかります。このツールを使えば、既存のEPUBファイルから一括でオーディオブックを生成でき、作業時間を大幅に削減できます。

オフラインでの利用
オンラインのTTS(Text-to-Speech)サービスは、API利用料やインターネット接続が必要です。このライブラリはオフラインで動作するため、コストを抑えつつ、いつでもどこでも利用できます。

カスタマイズ性
TTSエンジンの選択、音声速度の調整、不要なテキストの削除など、生成される音声の細かい設定が可能です。

導入はとてもシンプルです。Pythonのパッケージマネージャpipを使ってインストールできます。

pip install audiblez

必要なライブラリ
audiblezは、テキスト読み上げ機能にpyttsx3というライブラリを使用しています。このライブラリは、OSにインストールされているTTSエンジンを利用するため、別途インストールする必要がある場合があります。

Windows
SAPI5が標準で入っているため、追加インストールは不要です。

macOS
NSSpeechSynthesizerが標準で入っています。

Linux
espeakまたはfestivalが必要です。

sudo apt-get install espeak

sudo apt-get install festival

EPUBファイルからオーディオブックを生成する基本的なサンプルコードです。

from audiblez import AudiobookGenerator

# AudiobookGeneratorクラスを初期化
generator = AudiobookGenerator(
    input_file="your_book.epub",  #  ここにEPUBファイル名を設定
    output_file="your_book.mp3", #  生成されるオーディオファイル名
    engine="pyttsx3"             #  TTSエンジンを指定
)

# オーディオブックを生成
generator.generate()
print("オーディオブックの生成が完了しました!")

生成したオーディオブックを、章ごとに分割して保存したい場合は、以下のようにsplit_by_chapterTrueに設定します。

from audiblez import AudiobookGenerator

generator = AudiobookGenerator(
    input_file="your_book.epub",
    output_dir="audiobooks",      #  生成されるオーディオファイルの保存先ディレクトリ
    split_by_chapter=True         #  章ごとにファイルを分割
)

generator.generate()
print("章ごとに分割されたオーディオブックの生成が完了しました!")

さあ、お待たせしました!スター・ウォーズのコントです。

舞台
デス・スターの通信室

ルーク 「父さん!ついに完成しました!これで、父さんの好きな文学作品を、好きなだけ聴けるオーディオブックにできます!」

ベイダー 「(深く、重い呼吸音)…ホォォォ…馬鹿な。なぜワタシに文学が必要なのだ?フォースの力で全てを読み取れる…」

ルーク 「いやいや、フォースは疲れるでしょう?このsantinic/audiblezを使えば、pip install audiblezとコマンドを打つだけで、EPUBファイルから自動でオーディオブックが作れるんです!」

ベイダー 「なんだと…?(呼吸音)…本当に、ワタシの時間を奪わないと誓えるか?」

ルーク 「もちろんです!それに、音声の速度も調整できます。父さんのセリフみたいに、ゆっくりと重厚な音声も作れますよ!」

ベイダー 「ふん。試してみる価値はあるかもしれぬな。だが、もし役に立たなければ…フォースチョークだ…」

ルーク 「(焦って)大丈夫!大丈夫ですから!まず、このinput_fileに父さんの好きな「帝国の歴史」を入れて、output_fileにempires_history.mp3と…」

ベイダー 「…待て。そのoutput_dirdarkside_audiobooksと設定しろ。ワタシのコレクションだ…」

ルーク 「は、はい!わかりました、父さん!」

ナレーター そして、デス・スターの通信室には、機械音声で朗読される「帝国の歴史」のBGMが流れ始めたのであった…


santinic/audiblez




証拠物件(EPUB)を逃がすな。calibredbで実現する、エンジニア流・電子書籍取り調べ術

エンジニアの皆さん、お疲れ様です。今日は、電子書籍界の「巨大な証拠保管庫」こと calibre について、警察のガサ入れ…ではなく、技術的な「現場検証」をしていきましょう。電子書籍の管理ソフトとして有名な calibre ですが、中身は Python で書かれた超巨大なオープンソースプロジェクト です。エンジニアにとっては、ただの「本棚」以上の価値があります。


ソフトウェアエンジニア必見!PyTorch導入ガイドとGPU活用で実現する高速ディープラーニング

PyTorchは、FacebookのAI研究グループによって開発された、Pythonベースのオープンソース機械学習ライブラリです。特に深層学習(ディープラーニング)の研究や開発で非常に人気があります。ユーザーさんが指定してくださった説明にあるように、その核となる要素は以下の2点です。


血液型占い風解説!AIエージェントのチームマネジメントツール「agent-squad」とは?

今回は、ソフトウェアエンジニアの視点から、ちょっと面白いツール「agent-squad」について、血液型占いの運勢みたいに、楽しく分かりやすく解説していきますね。全体運最高潮!まるで優秀なチームを瞬時に結成できる魔法の杖を手に入れたかのよう。これまで一人で抱え込んでいた複雑なタスクも、チームで分担することでサクサクこなせるようになります。特に、複数のAIを組み合わせて、まるで人間同士が話し合っているかのように協調させたい場面で、その真価を発揮します。


動画ファイルが賢くなる?NLPとOpenCVでテキスト検索を可能にする「memvid」とは

「memvid」は、Olow304/memvid というGitHubリポジトリで公開されている、Pythonで書かれたライブラリです。NLP(自然言語処理)とOpenCV(コンピュータービジョンライブラリ)を組み合わせて、テキスト情報を動画ファイル(MP4)の中に効率的に保存し、高速な意味検索を可能にします。


ソフトウェア開発を加速するDocsGPT:ハルシネーション回避で信頼度UP

DocsGPTは、あなたの持つドキュメントや知識ベースから、信頼性の高い情報を引き出すためのオープンソースツールです。よくある生成AIの課題である「ハルシネーション(AIが事実ではない情報を生成すること)」を避け、プライベートな情報源から正確な答えを導き出すことに特化しています。


AIの知性を飛躍させる「MemoriLabs/Memori」入門:記憶の保存と検索のアーキテクチャ

ご提示いただいたオープンソースの記憶エンジン「MemoriLabs/Memori」について、ソフトウェアエンジニアの視点から、その有用性、導入方法、そしてサンプルコードの例を、コントのお化け屋敷のように面白おかしく、しかし技術的に分かりやすく解説しますね!


Big Techも注目のAIパワーをセキュリティに。PentestGPTで効率化する侵入テストの最前線

今回は、サイバーセキュリティの分野で非常に注目されている、LLM(大規模言語法モデル)をペネトレーションテスト(侵入テスト)に活用したツール「PentestGPT」について解説します。Big Tech(Apple, Google, Amazonなど)が提供する最先端のAI技術を、実際の現場でどう「武器」として使うか、という視点でお話ししますね。


電波の届かない場所でも安心!魔法少女のための音楽ダウンロード術

今回のミッションは、そんな寂しい気持ちを吹き飛ばす、素敵な魔法アイテムのお話よ!みんな、お気に入りのアニメやゲームの主題歌ってあるでしょう?CDショップに探しに行っても、なかなか見つからなかったり、全部揃えるのが大変だったりするわよね。そんなとき、私たちの秘密兵器「Spotify-downloader」の出番よ!これは、魔法の呪文を唱えるだけで、Spotifyにある音楽を、YouTubeから探してきて、宝石みたいに輝くMP3ファイルとして手に入れられる、とっても便利な魔法の道具なの。


ソフトウェアエンジニア必見! MCPでAI開発の密室を突破する

おいおい、一体どういうことだ!? この部屋は完全に密室じゃないか!…おっと、すみません。ついドラマの役に入り込んでしまいました。でも、この密室、実は我々ソフトウェアエンジニアの目の前にある「AI開発の密室」かもしれません。「ん? AIの密室ってどういうこと?」と、あなたは首を傾げていますね。ご説明しましょう。


モダンAIスタックの結晶:MoneyPrinterV2を活用した自動化パイプライン構築術

今回、我々が調査する伝説の秘宝は、GitHubに眠る FujiwaraChoki/MoneyPrinterV2 だ。名前からして「お金を刷る機械」なんて、ワクワクするじゃないか?さあ、松明を掲げて、エンジニアの視点からこのツールの正体を暴いていこう!