Aivis Project(アイビス プロジェクト)とは?特徴や料金、使い方まで完全解説!

この記事のまとめ

Aivis Project(アイビス プロジェクト)とは「誰でも簡単に感情豊かな“声”を作れる音声合成プラットフォーム」です。すべての機能が日本語対応・基本無料で提供されており、専門知識がなくてもPCひとつで本格的な合成音声を扱えるのが特長です。音声合成というと難しい印象を抱きがちですが、Aivis Projectはそのハードルを大きく下げ、幅広い層の方々が気軽に“声の創造”にチャレンジできる環境を整えています。

この記事では、AI音声合成(TTS)プラットフォーム「Aivis Project(アイビス プロジェクト)」について、初めて触れる方にも分かりやすく解説します。Aivis Project は、自然で感情表現のある日本語音声を生成できる点が注目されており、ナレーション作成や動画制作、教材制作、ゲーム開発、社内向け音声ガイダンスなど、幅広い用途で活用されています。

とはいえ、「Aivis Project は他の音声生成AIと何が違うのか」「無料でどこまで使えるのか」「商用利用は問題ないのか」「PCで使うのとAPIで使うのはどう違うのか」といった疑問を持つ方も多いはずです。

そこで本記事では、Aivis Project の全体像を整理したうえで、主な特徴、料金プラン(無料で使える範囲も含む)、日本語対応や音声モデルの追加方法、そして実際の使い方までを一気通貫で解説します。この記事を読むことで、Aivis Project が自分の目的に合うかどうかを判断でき、導入まで迷わず進められるようになります。ぜひ最後までご覧ください。

弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。⇒AI導入支援サービスの概要はこちら

執筆者:山口 鳳汰
 

執筆者:山口 鳳汰
累計100万PV以上のAI・ノーコード専門メディアの編集長。
アプリ開発の電子書籍を3冊出版し、1冊はAmazonベストセラーを獲得。

その他、受託開発や教育など多数のノーコード事業に参画している。

運営会社:株式会社Walkers

運営会社:株式会社Walkers
AI・ノーコード専門の開発会社。
300件以上の開発/制作実績、200件以上の企業様を支援。
マーケティングやUI/UXと掛け合わせたサービス開発を得意としている。

執筆者:山口 鳳汰

執筆者:山口 鳳汰
累計100万PV以上のAI・ノーコード専門メディアの編集長。
アプリ開発の電子書籍を3冊出版し、1冊はAmazonベストセラーを獲得。

運営会社:株式会社Walkers

運営会社:株式会社Walkers
AI・ノーコード専門の開発会社。
これまでに300件以上の開発/制作実績、200件以上の企業様を支援。

クリックできる目次

Aivis Project(アイビス プロジェクト)とは?

AivisSpeechの実演動画(実際の音声あり・手動でのチューニングなし)

Aivis Project(アイビス プロジェクト)は、「感情豊かな音声合成技術を、誰もがかんたんに活用できる未来」を目指して生まれた、次世代のAI音声合成(TTS: Text-to-Speech/テキスト読み上げ)プラットフォームです。

従来の音声合成は、機械的で単調になりやすく、自然な抑揚や感情表現を再現するのが難しいイメージがありました。Aivis Projectは、そのハードルを大きく下げ、専門知識がなくてもPCひとつで「表情のあるAI音声(AIボイス)」を制作できる環境を整えています。

Aivis Projectを支える主要サービスは、以下の5つです。

  • 直感的に音声を制作できるデスクトップアプリ「AivisSpeech」
  • 音声合成モデル(話者)を共有・導入できる「AivisHub」
  • 録音データから自分だけの音声合成モデルを制作できる「AivisBuilder(現在開発中)」
  • GPUサーバーで高速に音声合成できるクラウドAPIサービス「Aivis Cloud API」
  • オンプレミス環境で運用できる音声合成サーバー「Citoras」

これらを組み合わせることで、テキストを入力するだけで自然で感情豊かな音声を生成できるだけでなく、音声モデルを追加して声のバリエーションを増やしたり、将来的にはモデルを自作して育てたり、APIでシステムに組み込んだりと、用途に応じて「つくる・配る・育てる」までを一気通貫で実現できる構造になっています。

「機械音声では味気ない」「キャラクターの声で物語を語らせたい」「動画ナレーションを手軽に作りたい」

そんなニーズに対して、Aivis Projectは“声をデザインする”という新しい選択肢を提供します。

ソフトもモデルも基本無料で始められ、操作もシンプル。まずはAivisSpeechでTTS(テキスト読み上げ)を試し、気に入った音声モデルをAivisHubから追加するだけでも、表現の幅は大きく広がります。

かつて一部の限られた人だけが手にできた“理想の声”を、誰もが自由に使える未来へ。

Aivis Projectで、あなたの想いを感動的な“声”にのせて届けてみてください。

Aivis Projectの4つの特徴

【特徴①】感情豊かで自然な音声合成

AivisHubで視聴できる、公式モデル「まお」のボイスサンプル一例
AivisHubで視聴できる 公式モデル「まお」のボイスサンプル一例

Aivis Project 最大の魅力は、AI音声合成(TTS)とは思えないほど人間らしい“表現力”にあります。

一般的な機械音声は、発音が正しくても抑揚が平坦になりやすく、聞き続けると単調に感じてしまうことがあります。一方Aivis Project は、文章の流れに合わせて抑揚・間・アクセントを自然に付けられるため、読み上げが「棒読み」ではなく、会話やナレーションに近い質感になります。

特に公式モデル「まお」「コハク」では、アニメ調・セリフ調・ナレーション調など用途に応じた話し方を作りやすく、感情のニュアンスまで含めて丁寧に表現できるのが特徴です。
同じ文章でも、言葉のトーンや間合いを変えることで「やさしく伝える」「落ち着いて説明する」「テンション高めに盛り上げる」といった雰囲気の違いを出せます。

例えば、物語の登場人物に“気持ち”を持たせて話させたり、教育コンテンツを聞き取りやすいテンポで読み上げたり、ニュース原稿を穏やかに伝えたりと、幅広い用途に対応できます。動画ナレーションやゲームのキャラクターボイスなど、「声の印象がコンテンツの品質を左右する場面」で特に強みが出ます。

また、自然さを支えているのは感情表現だけではありません。日本語のTTSで違和感が出やすいポイント(句読点による間、語尾の処理、アクセントの破綻など)も崩れにくく、長文でも聞き疲れしにくい音声に仕上げやすいのが特長です。

「まるで生きて話しているかのような合成音声を、たった数クリックで」

これがAivis Project の真価です。

【特徴②】簡単操作&高い互換性

AivisSpeechの音声合成画面
AivisSpeechの音声合成画面

Aivis Project の特徴2つ目は、「直感的に使える操作性」と「既存ツールとの高い互換性」です。

音声合成を行うデスクトップアプリ「AivisSpeech」は、初心者でも迷いにくいUIで構成されており、基本操作は「テキストを入力 → 再生をクリック」の2ステップ。難しい設定はほぼ不要なので、音声合成(TTS)の専門知識がない方でもすぐに使い始められます。

初めて触る方でも「とりあえず音を出す」までが早く、導入のハードルが低いのが強みです。

さらに、音量・話速・アクセントの強さ・声の高さといった調整項目もスライダーで視覚的に調整でき、変更内容をその場でプレビューできるのが便利です。文章の読み上げは「少し遅くするだけで聞きやすくなる」「アクセントを整えるだけで自然になる」といったことがよくあるため、結果を即確認しながら微調整できる設計は実務でもかなり役立ちます。

また、Aivis Project は日本語特化の音声合成プラットフォームとして設計されており、インターフェースも完全に日本語対応です。英語UIのツールが苦手な方でも安心して利用できます。特に、教材・社内資料・ナレーション用途では日本語の扱いやすさがそのまま制作効率に直結します。

加えて、AivisSpeech は既存の制作フローに組み込みやすい点も魅力です。例えばVOICEVOXなどの無料TTSソフトに慣れている方なら、ほぼ同じ感覚で操作できるため学習コストを抑えられます。さらに、生成した音声は動画編集ソフトや配信ツール、ゲーム制作などに取り込む前提で使われるケースが多いですが、AivisSpeech は「まず音声を作って、後工程に渡す」流れがスムーズで、ナレーション制作やボイス素材作りの起点として使いやすい構成です。

「すぐ使える」「迷わない」「制作フローに乗せやすい」

この3点が揃っていることが、Aivis Project の使いやすさと継続利用のしやすさを支えています。

【特徴③】ソフトもモデルも無料で利用可能

AivisProject 商用利用についての説明
AivisProject 商用利用についての説明

Aivis Project の特徴3つ目は、「ソフトもモデルも基本無料で利用できる」という大きなポイントです。

Aivis Project の中心的なサービスである「AivisSpeech」および「AivisHub」は、完全無料で提供されています。
音声合成(TTS)ツールは「まず試すだけでもコストがかかる」ケースもありますが、Aivis Project は導入コストをほぼゼロに近づけた状態で始められるのが魅力です。

使い方もシンプルで、AivisHub で音声合成モデルを探してダウンロードし、AivisSpeech に導入するだけ

2026年2月時点では、AivisHub 上ですべてのモデルが無料で配布されているため、用途に合わせて声を変えながら試せます。ナレーション向け・キャラクターボイス向けなど、目的別に“声”を選べるのは大きなメリットです。

また、AivisSpeech はローカル動作(オフライン)にも対応しているため、基本的にはインターネット環境がなくても利用できます。(※初回利用時のみインターネット環境が必要)

さらに実務で重要なのが、商用利用できるモデルが多数存在する点です。動画ナレーションや広告、ゲーム、教材などに活用する際、「このモデルは商用利用できるのか」「クレジット表記は必要か」がネックになりがちですが、AivisHub では商用利用可能なモデルや、クレジット表記不要のモデルも多数用意されています。

もちろん、最終的にはモデルごとのライセンス確認は必要ですが、全体として音声合成にありがちな“ライセンスの壁”を強く意識せずに使い始められるのは、Aivis Project の大きな強みです。

「無料で始められて、声も増やせて、商用利用もしやすい」

この自由度の高さが、Aivis Project が選ばれる理由のひとつになっています。

【特徴④】モデルの追加・カスタマイズ性

AivisBuilderの紹介文章
AivisBuilderの紹介文章

Aivis Project の特徴4つ目は、「モデルの追加・カスタマイズ性」です。

Aivis Project は、音声合成(TTS)を“使うだけ”で終わらず、用途に合わせて声(音声モデル/話者)を増やし、作り込みまで視野に入れられるのが大きな強みです。

モデル共有サイト「AivisHub」では、多数の音声モデルが公開されており、気に入った声をダウンロードしてAivisSpeech に追加するだけで話者を増やせます
ナレーション向け・キャラクター向けなど、目的に応じて声を切り替えられるため、動画制作やゲーム制作、教材制作などでコンテンツの表現幅を一気に広げられるのがメリットです。

さらに、録音データから自作モデルを制作できる「AivisBuilder(現在開発中)」も用意されており、将来的には自分だけの声を作って運用・共有できる世界観が整っています。
既存モデルを使うだけでなく、「声そのものを自分で持つ」方向に進められる点は、Aivis Project ならではの価値です。

また、自作が難しい方向けには、「まるなげボイス by Aivis Project」として自分の声のモデル制作を依頼する選択肢も用意されています。
料金は1モデルあたり15万円の均一料金(※関西弁など特殊な話し方の処理が必要な場合を除く)で、手軽に高品質な合成音声モデルを作成することも可能です。

このように、モデル追加(AivisHub)/自作(AivisBuilder)/外注(まるなげボイス)まで選べることで、「理想の声」を現実にする選択肢が揃っているのがAivis Project の魅力です。

Aivis Projectの料金プラン

AIvis Project は様々なサービスを提供しています。
この記事では、「AivisSpeech」「AivisHub」「AIvis Cloud API」の主要3サービスの料金プランを解説します。

AivisSpeech / AivisHub:無料で利用可能

現在提供されている範囲では、Aivis Projectの中心機能である AivisSpeech(デスクトップ)AivisHub(音声モデル共有) は、いずれも基本無料で利用できます。

AivisSpeechは無料でダウンロードでき、音声モデルもAivisHub上で無料配布されているものを選んで導入するだけで、すぐに音声合成(TTS)を始められます。

また、AivisSpeechはローカル動作(オフライン)にも対応しているため、基本的にはインターネット環境がない場所でも利用可能です。

※初回利用時など一部でインターネット接続が必要なケースがあります。

Aivis Cloud API:2つの料金プラン(従量課金 / 月額定額)

Aivis ProjectをWebサービスやアプリに組み込んで使いたい場合は、クラウド版の Aivis Cloud API(TTS API) を利用する形になります。料金プランは以下の2種類です。

  • 従量課金プラン:1万文字あたり440円
  • Aivis プレミアム(月額定額):月額1,980円1分あたり10リクエストのレート制限内なら、月間文字数制限なし

「まずは小さく試すなら従量課金」「月額固定で運用したいなら定額」という形で、用途や利用規模に応じて選びやすいのが特徴です。

Aivis Project の使い方

この記事では、Aivis Projectの主要サービスである「AivisSpeech」での音声合成の利用方法を解説します。

完全無料で音声合成を利用することができますので、ぜひご覧ください。

AivisSpeechの使い方

STEP
以下のURLより公式サイトに移動する
STEP
AivisSpeech をダウンロードする

Aivis Project の公式サイトから、「AIvisSpeech をダウンロード」というボタンをクリックし、自身のパソコンに適したインストーラーをダウンロード・起動します。

AivisSpeech は、Mac(Apple Silicon 搭載を推奨・macOS 13 Ventura 以降)およびWindows(Windows 10 (22H2 以降)・Windows 11)に対応しています。

ダウンロード後、「WindowsによってPCが保護されました」や「発行元が検証できないため開けません」と表示された場合には、公式が発表しているこちらの記事を参考にPCの設定を変更しましょう。

STEP
音声合成モデルの起動を行う
AivisSpeechの音声合成エンジン起動画面
AivisSpeechの音声合成エンジン起動画面

ダウンロード後、初めてAivisSpeechを起動する際に「音声合成エンジン」の起動作業が自動的に行われます。お使いのPC性能にもよりますが、2分〜30分ほど要します。
どれだけ待っても・何度試しても「音声合成エンジン起動中」の画面から切り替わらない場合は、再起動をお試しいただいた後に、Aivis Project 公式サイトよりお問い合わせください。

公式デフォルトモデルのダウンロードが並行して行われるため、初回起動時には必ずインターネット環境が必要です。

STEP
制作したい音声をテキストで入力する
AivisSpeechの音声合成画面
AivisSpeechの音声合成画面

AivisSpeechは、インストール直後からすぐに音声合成(TTS)を試せるように設計されています。起動が完了すると音声合成画面が表示され、画面中央のテキストボックスに読み上げたい文章を入力するだけで準備完了です。

音声制作の流れは非常にシンプルで、テキストを入力したら、画面上部または下部の再生ボタンをクリックするだけで音声が再生されます。
アクセントや抑揚などは自動で調整されるため、まずは「入力→再生」の2ステップで自然な読み上げを確認できます。

さらに、細かいチューニングも直感的に行えます。右側の設定パネルでは、話す速さ(話速)・声の高さ(ピッチ)・音量などをスライダーで調整でき、変更した内容をすぐにプレビューできます。
また、アクセントをよりこだわって調整したい場合は、画面下部のアクセント編集エリアで詳細な設定が可能です。

まずは短い文章で再生し、話速や音量を調整しながら、用途(動画ナレーション・教材・キャラクターボイスなど)に合う“声の雰囲気”に寄せていくのがおすすめです。設定を自由にカスタマイズしながら、自分の理想に近い音声を作ってみてください。

AivisHub の使い方

ここでは、「AivisHub」から合成音声モデルをダウンロードし、AivisSpeechで利用する方法を解説します。

STEP
以下のURLよりAivisHub の公式サイトに移動する
STEP
音声合成モデル一覧から、好みのモデルを選択する
AivisHubの公式サイト

AivisHubでは、音声合成モデル(話者)を一覧から探して、好みの“声”を見つけることができます。

モデル一覧では、各モデルにスタイルサンプル音声が表示されており、画面上の再生ボタンをクリックするだけで、その場で音声を試聴できます。まずはここで、声質や雰囲気の当たりを付けるのがおすすめです。

気になるモデルをクリックすると詳細ページへ移動します。詳細ページでは、より多くのサンプル音声を再生できるため、同じ声でも話し方の傾向読み上げの自然さナレーション向きかキャラクター向きかといった違いを比較しながら確認できます。

この段階で「用途に合うかどうか」を意識して選ぶと、後の音声制作がスムーズになります。

お気に入りのモデルが見つかったら、次のステップでダウンロードしてAivisSpeechに導入していきましょう。

STEP
音声合成モデルをダウンロードする
AivisHubのモデル詳細画面

音声合成モデルの詳細ページ右上にある「AIVMXをダウンロード」をクリックし、音声合成モデルをダウンロードします。

AivisSpeech を起動した状態でAivisHub にアクセスした場合、「AIVMXをダウンロード」のボタンの上に「起動中のAivisSpeechにインストール」というボタンが表示されます。
このボタンを押すことによって、以降のステップをすべて省略して、AivisSpeechに音声合成モデルを導入することも可能です。

STEP
AivisSpeech に音声合成モデルをインストールする①
AivisSpeechの音声合成画面
AivisSpeechの音声合成画面

AivisSpeechの上部メニューに表示されている「音声合成モデル」をクリックし、メニュー一覧にある「音声合成モデルのインストール・管理」をクリックします。

STEP
AivisSpeech に音声合成モデルをインストールする②
AivisSpeechのモデルインストール画面

画面右上の「インストール・更新」をクリックし、ステップ③にてダウンロードしたAIVMXファイルをアップロードします。

最後に、画面下の「イントール/更新」ボタンをクリックすると、AivisSpeechへのモデル登録が完了します。

STEP
音声を生成する
AivisSpeechの音声合成画面
AivisSpeechの音声合成画面

音声合成画面に戻り、テキストボックス左のキャラクターアイコンをクリックします。

すると、現時点で利用できる音声合成モデル一覧が表示されるため、先ほどインストールした音声合成モデルを選択します。

すると、ステップ③にてダウンロードした音声合成モデルの声を実際に利用することができます。


AI音声合成(TTS)プラットフォーム「Aivis Project」の解説は以上です。

Aivis Projectは、無料で始められる手軽さに加えて、日本語に特化した自然な読み上げと感情表現にも対応している点が大きな魅力です。声の雰囲気はコンテンツの印象を大きく左右しますが、Aivis Projectを使えば、ナレーションやキャラクターボイスを自分の意図に合わせて作り込みやすく、制作の幅を一気に広げることができます。

YouTube動画やショート動画のナレーション、教材・研修資料の読み上げ、ゲームやアプリのキャラクターボイス、店舗や社内システムの音声案内など、音声が必要になる場面は想像以上に多くあります。まずは短い文章から試してみて、「この声で伝えたい」「こういう温度感にしたい」といった感覚を掴むところから始めるのがおすすめです。

ぜひAivis Projectを活用して、あなたのアイデアやコンテンツを“声”という形で届けてみてください。音声制作のハードルが下がることで、表現できる世界が確実に広がります。

弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。

AI導入支援サービスの概要はこちら>>

Walkersに無料で相談する>>

  • URLをコピーしました!
クリックできる目次