こんにちは、パレイド技術部の夏目です。
「ローカルで音楽生成 AI を動かしたい。ACE-Step が良いらしい。でも 1.0 / 1.5 / 1.5 XL とあって、結局どれをどう入れればいいのか分からない」——この記事は、その迷いを一枚の地図で解くために書きました。
パレイドでは ACE-Step を、導入・版の比較・ComfyUI 自動化・他モデルとの対比と個別の記事に分けて書いてきました。さらに、遠野物語や夢十夜の AI ショート動画では実際に ACE-Step で BGM を作っています。本記事はそれらを目的別・版別に束ねた総合ガイド(目次)です。まず地図を見て、自分の目的地に最短で着くルートを選んでください。
本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。
ACE-Step を使う前の3つの前提
個別の手順に入る前に、ACE-Step を選ぶ理由そのものになる共通点を押さえておきます。
- ローカル完結:初回セットアップ後はオフラインで動きます。生成した音源をクラウドに上げずに済み、何曲作ってもコストは増えません。
- 無料・商用可:オープンソースで商用利用もできます。ただし版でライセンスが違う点に注意——本体(1.0 系)の
ace-step/ACE-Stepは Apache-2.0、現行のace-step/ACE-Step-1.5(1.5 / 1.5 XL)は MIT です。いずれも商用利用は可能です。 - 版がある:1.0 → 1.5 → 1.5 XL と進化しており、新しいほど速く・軽く・多機能になりますが、入手するリポジトリも異なります。まずは「どの版を使うか」を決めるのが近道です。
30秒早見表:目的から逆引きする
ACE-Step は版と使い方の組み合わせで入口が変わります。中身は同じ系譜でも得意分野と手間が違うので、目的から逆引きするのが最短です。
| やりたいこと | おすすめ | 記事 |
|---|---|---|
| まず無料でローカル作曲を体験したい | 本体 ACE-Step を導入 | 導入ガイド |
| 最新版で速く・軽く、日本語歌詞も試したい | ACE-Step 1.5 | 1.5 解説 |
| 商用品質・多言語・長尺(最大10分)まで狙う | ACE-Step 1.5 XL | XL レビュー |
| コードを書かず GUI で回したい | ComfyUI テンプレート | ComfyUI 編 |
| 生成を Python / API で自動化したい | ComfyUI API 連載 | 自動化編 |
| 他の音楽生成 AI(ローカル/クラウド)と比べたい | Stable Audio・Suno などとの対比 | 対比記事 |
以下、各ルートを順に案内します。
まず動かす:基本の導入
何はともあれ、まずは本体の ACE-Step を動かして「ローカル作曲とはこういうものか」という基準を作るのがおすすめです。ace-step/ACE-Step(Apache-2.0)を git clone → pip install -e . → acestep で起動し、ブラウザの Web UI から最初の一曲を生成するところまでを、ローカルで動く AI 作曲 ACE-Step の使い方(Windows / Mac / Linux) にまとめています。
ここで一度ローカル実行の感覚をつかんでおくと、後の「版の違い」や「ComfyUI 自動化」の話が一気に腹落ちします。
版を選ぶ:1.0 / 1.5 / 1.5 XL の違い
ACE-Step の現在地は、ざっくり次の3段です。
- 1.0(本体):
ace-step/ACE-Step・Apache-2.0。基本形で、上の導入ガイドが対象とする版です。 - 1.5:別リポジトリ
ace-step/ACE-Step-1.5・MIT。2〜10秒/曲の高速化・4GB 未満の GPU でも動く軽量化・ComfyUI テンプレート同梱・日本語歌詞対応が目玉。1.0 との実測比較は ACE-Step 1.5 とは?1.0 との違いを実測(2〜10秒/曲・4GB GPU 対応・ComfyUI) に。 - 1.5 XL:MIT。約40億パラメータの DiT、50言語以上、最大10分の長尺生成に対応し、ベンチマークでは商用モデル超えを謳います。実際に試した記録は 商用利用OKの音楽生成AI「ACE-Step 1.5 XL」を試してみた|Suno v5 超えは本当か? に。
まず軽く試すなら 1.5、品質と長尺を攻めるなら 1.5 XL、という選び方で大きくは外しません。
コードを書かず/自動化する:ComfyUI
1.5 以降は ComfyUI テンプレートが標準的な導線です。ノードを置いて回すだけなので、Python 環境を整えずに使い始められます。導入は 簡単にローカルで試せる音楽生成 AI:ComfyUI で ACE-Step を使う から。
さらに、ComfyUI の API を使って生成を自動化する連載も用意しています。Python から音楽生成を叩き、WebSocket で進捗を受け取り、出力をダウンロードし、最終的に「ガチャ」的な大量生成まで自動化する流れです(上の ComfyUI 導入記事から各回へ辿れます)。BGM をまとめて作りたい人向けの実用ルートです。
他の音楽生成 AI と比べる
ACE-Step だけが選択肢ではありません。立ち位置を知るために、ローカル・クラウド双方の近いサービスとの対比も置いておきます。
- Stable Audio 3(ローカル・Mac M5 実測):ACE-Step 1.5 と同じ土俵で比較した実測記事。→ Stable Audio 3 Small-Music を M5 MacBook Air で動かす|ACE-Step 1.5 と対比したローカル音楽生成の現在地
- Suno(クラウド):手軽さで人気のクラウド作曲。ローカルとの違いは 無料でここまで!言葉が音楽になる AI 作曲を体験 Suno AI 入門 に。
- ローカル音楽生成の全体像:そもそも何が動くのかを概観したいなら ローカルで音楽を生成するには(1週間検証記) が入口になります。
まとめ:目的から逆引きする
ACE-Step の分かれ道を、もう一度一枚にまとめます。「版の新しさ」ではなく「目的との相性」で選ぶのが、遠回りしないコツです。
| 目的 | おすすめ | 記事 |
|---|---|---|
| まず無料でローカル作曲を体験 | 本体 ACE-Step | 導入ガイド |
| 最新・高速・軽量・日本語歌詞 | ACE-Step 1.5 | 1.5 解説 |
| 商用品質・多言語・長尺 | ACE-Step 1.5 XL | XL レビュー |
| GUI で手軽に回す | ComfyUI テンプレート | ComfyUI 編 |
| 他モデルと比較 | Stable Audio 対比 | 対比記事 |
迷ったら、まず導入ガイドで一度動かし、軽さ・速さが欲しくなったら1.5 解説へ——この二本を行き来するだけでも、ローカル作曲はかなり実用になります。




-300x158.png)