AI音楽

AIテキスト

Vibe coding実践例:RSS記事をOllamaでAI要約してMarkdown化するPythonコード(llama3.1:8b)

RSSから記事本文を取得し、Ollama(llama3.1:8b)で要約してMarkdownに整形する最小構成をまとめます。進捗ログ付きで、後からRAG素材として再利用しやすい出力にします。
AI画像

Stable Diffusion WebUI reForgeの手動導入方法(Windows/Mac)

Stability Matrixのワンクリック導入に頼らず、Stable Diffusion WebUI reForgeをWindowsとMacに手動インストールする手順と、ForgeやA1111との違い・更新方法・連携の考え方をまとめました。
AI画像

Stable Diffusion WebUI Forgeを手動で導入する手順 Windows/Mac

Stability Matrixに頼らず、Stable Diffusion ForgeをWindowsとMacに手動インストールする手順を、環境準備から更新方法・トラブルシュートまでまとめました。
AI動画

Stability Matrixの導入と起動方法:Stable Diffusion環境をまとめて管理

Stability Matrixは、Lykos AIが開発しているStable Diffusionを始めとする生成AIのGUIパッケージマネージャです。Stable DiffusionやComfy等の各種Web UIをワンクリックでインスト...
AI音声

VOICEVOX Nemoの導入ガイド:ビジネス向け音声合成の始め方

VOICEVOX Nemoは、落ち着いた声質が特徴の音声合成エンジンです。キャラクター性で人気の従来のVOICEVOXと比べ、ニュートラルで聞きやすいナレーションに適しています。Nemoは業務用途を意識した声作りが行われており、ビジネス環境...
AI音声

VOICEVOX のインストール方法と初期設定 — Windows/Mac対応ガイド

VOICEVOX は、YouTubeでも人気の無料テキスト読み上げ/合成音声ソフトウェアです。 この記事では、WindowsとMacでのダウンロードからインストール、起動、音声生成までの流れを紹介します。VOICEVOX とはVOICEVO...
基礎知識

ffmpegの導入ガイド:AI音声・動画処理の基礎

ffmpegとはffmpegは、音声や映像データの変換や抽出、圧縮などを行うオープンソースのツールです。AI音声合成、動画生成、音声認識のプロジェクトでは、ファイル形式の変換や音声抽出に欠かせません。本記事では、ffmpegを利用する前提と...
AI音楽

MusicGen入門:簡単サンプル・Gradioデモ・実用的設定まとめ

MusicGenは、数秒〜十数秒のフレーズをローカル環境で生成できる無料のAI音楽モデルです。Pythonから扱え、テキストの指示に対する音源をクイックに確認できます。商用利用はできませんが、曲の方向性を探したり、アイデアのヒントを得る用途...
AI音楽

MAGNeT入門:特徴・サンプル・実用設定まで最短で理解するガイド

MAGNeTはMetaが公開した短尺の音楽生成に最適化されたモデルで、MusicGenの後継・改良版に位置づけられています。テンポ・質感・楽器感がより自然で、破綻しにくいのが特徴です。この記事では、MAGNeTを最短ルートで動かし、特徴を理...
AI音楽

AudioGen入門:サンプル・Gradioデモ・設定まとめ

AudioGenはMetaが公開したテキストから効果音を生成するモデルで、短いSEを素早く作る用途に向いています。この記事では、最短ルートで「動かす」「理解する」「実務で使う」の流れをまとめます。AudioGenとは何かAudioGenはB...