生成AI

AI音声

VOICEVOX Nemoの導入ガイド:ビジネス向け音声合成の始め方

VOICEVOX Nemoは、落ち着いた声質が特徴の音声合成エンジンです。キャラクター性で人気の従来のVOICEVOXと比べ、ニュートラルで聞きやすいナレーションに適しています。Nemoは業務用途を意識した声作りが行われており、ビジネス環境...
AI音声

Macで音声通知や時報をショートカットアプリで気軽に作成

パソコンに時間のかかる処理をさせている時に、画面をずっと見続けるのは疲れます。処理の終了や定期的な実行など、Macが“音声で知らせてくれる通知システム”があれば便利です。本記事では、macOSの標準機能のショートカットアプリを使って、通知・...
基礎知識

ffmpegの導入ガイド:AI音声・動画処理の基礎

ffmpegとはffmpegは、音声や映像データの変換や抽出、圧縮などを行うオープンソースのツールです。AI音声合成、動画生成、音声認識のプロジェクトでは、ファイル形式の変換や音声抽出に欠かせません。本記事では、ffmpegを利用する前提と...
AIテキスト

LM Studio入門:Macで動かす最短ガイド

LM Studioは、Windows・macOS・Linuxで動くローカルLLM用のデスクトップアプリで、GUIからモデルの検索・ダウンロード・チャット・APIサーバー起動までをまとめて扱えるツールです。 LM Studio ここではMac...
AI音楽

MusicGen入門:簡単サンプル・Gradioデモ・実用的設定まとめ

MusicGenは、数秒〜十数秒のフレーズをローカル環境で生成できる無料のAI音楽モデルです。Pythonから扱え、テキストの指示に対する音源をクイックに確認できます。商用利用はできませんが、曲の方向性を探したり、アイデアのヒントを得る用途...
AI音楽

ローカル無料で効果音を作るAIツール比較ガイド【Stable Audio Open / AudioGen / Riffusion】

効果音や短い音素材を生成したいとき、どのAIツールを選べばよいかは悩みどころです。有料の音楽生成AIクラウドサービスは優秀ですが、様々なパターンを試したい場合には課金が気になります。本記事では 「ローカルで」「無料で使えて」「短い音源(効果...
AI音楽

MAGNeT入門:特徴・サンプル・実用設定まで最短で理解するガイド

MAGNeTはMetaが公開した短尺の音楽生成に最適化されたモデルで、MusicGenの後継・改良版に位置づけられています。テンポ・質感・楽器感がより自然で、破綻しにくいのが特徴です。この記事では、MAGNeTを最短ルートで動かし、特徴を理...
AI音楽

AudioGen入門:サンプル・Gradioデモ・設定まとめ

AudioGenはMetaが公開したテキストから効果音を生成するモデルで、短いSEを素早く作る用途に向いています。この記事では、最短ルートで「動かす」「理解する」「実務で使う」の流れをまとめます。AudioGenとは何かAudioGenはB...
AI音声

AudioCraft Windows CUDA環境導入ガイド:依存関係を手動で解決

Meta社のAudioCraftは、ローカルでテキストから音楽や効果音を生成できるAIフレームワークです。実質商用利用NGのため、個人用途が主となりますが、ローカルでの音源生成の可能性を試すことができます。音楽生成ができるMusicGen、...
基礎知識

pyenv入門:Pythonバージョンを安全に切り替える基礎

Pythonの環境構築で最も多いトラブルのひとつが「どのPythonを使っているのか分からない」問題です。特にAIの利用では 、Python 3.9系など以前のバージョンが要求されるため、複数のPythonをインストールして使い分ける必要が...