生成AI

AI音楽

ローカル無料で効果音を作るAIツール比較ガイド【Stable Audio Open / AudioGen / Riffusion】

効果音や短い音素材を生成したいとき、どのAIツールを選べばよいかは悩みどころです。有料の音楽生成AIクラウドサービスは優秀ですが、様々なパターンを試したい場合には課金が気になります。本記事では 「ローカルで」「無料で使えて」「短い音源(効果...
AI音楽

MAGNeT入門:特徴・サンプル・実用設定まで最短で理解するガイド

MAGNeTはMetaが公開した短尺の音楽生成に最適化されたモデルで、MusicGenの後継・改良版に位置づけられています。テンポ・質感・楽器感がより自然で、破綻しにくいのが特徴です。この記事では、MAGNeTを最短ルートで動かし、特徴を理...
AI音楽

AudioGen入門:サンプル・Gradioデモ・設定まとめ

AudioGenはMetaが公開したテキストから効果音を生成するモデルで、短いSEを素早く作る用途に向いています。この記事では、最短ルートで「動かす」「理解する」「実務で使う」の流れをまとめます。AudioGenとは何かAudioGenはB...
AI音声

AudioCraft Windows CUDA環境導入ガイド:依存関係を手動で解決

Meta社のAudioCraftは、ローカルでテキストから音楽や効果音を生成できるAIフレームワークです。実質商用利用NGのため、個人用途が主となりますが、ローカルでの音源生成の可能性を試すことができます。音楽生成ができるMusicGen、...
AI音声

Stable Audio Open 検証・運用で遭遇した問題一覧(2025年10月現在)

本記事では、Stable Audio Open を Windows(CUDA/CPU)および macOS(MPS)環境で検証・運用する過程で遭遇した問題と、その対応策・教訓を体系的にまとめます。🧩 主要な問題と対処法導入関連Python3....
AI音楽

Stable Audio Open入門:ローカルで使うテキスト→サウンド生成(Stability AI)

短いサウンドから世界は変わります。Stable Audio Openは、テキストを手がかりに44.1kHz・最大約47秒のステレオ音を生成できるStability AIのオープンウェイトモデルです。研究・検証に開かれつつ、現場のSFX(効果...
AI音声

Mac版Whisper比較ガイド:openai-whisper・faster-whisper・whisper.cpp、あなたに最適なのは?

MacでWhisperを使いたいけど、どれを選べばいいか迷っていませんか?OpenAI Whisperには主に3つの実装方式があります:openai-whisper(Python公式版)faster-whisper(高速・GPU対応版)wh...
AI音声

MacでWhisperを高速化する方法②:whisper.cpp編(ネイティブCLI・Apple Silicon最適)

Pythonを使わずにWhisperを動かしたいなら、最適解はwhisper.cppです。これはC/C++で書かれたネイティブ実装版のWhisperで、Apple Siliconでも高速に動作します。依存が少なく、CLIだけで即実行可能。軽...
AI音声

MacでWhisperを高速化する方法①:faster-whisper編(Python実装・Apple Silicon対応)

Mac (Apple Silicon対応) で faster-whisper を導入し、Whisper の文字起こしを最大3倍高速化する方法を解説します。
AI音声

MacでWhisperをインストールして音声認識を試す(ローカル実行・Apple Silicon対応)

Whisperとは(1分で把握)WhisperはOpenAIが提供する音声→テキストの汎用ASR(Automatic Speech Recognition)モデル。多言語対応・雑音耐性が高く、ローカルでも動作します。お手軽:Pythonパッ...