生成AI

AI音楽

AudioGen入門:サンプル・Gradioデモ・設定まとめ

AudioGenはMetaが公開したテキストから効果音を生成するモデルで、短いSEを素早く作る用途に向いています。この記事では、最短ルートで「動かす」「理解する」「実務で使う」の流れをまとめます。AudioGenとは何かAudioGenはB...
AI音声

AudioCraft Windows CUDA環境導入ガイド:依存関係を手動で解決

Meta社のAudioCraftは、ローカルでテキストから音楽や効果音を生成できるAIフレームワークです。実質商用利用NGのため、個人用途が主となりますが、ローカルでの音源生成の可能性を試すことができます。音楽生成ができるMusicGen、...
AI音声

Stable Audio Open 検証・運用で遭遇した問題一覧(2025年10月現在)

本記事では、Stable Audio Open を Windows(CUDA/CPU)および macOS(MPS)環境で検証・運用する過程で遭遇した問題と、その対応策・教訓を体系的にまとめます。🧩 主要な問題と対処法導入関連Python3....
AI音楽

Stable Audio Open入門:ローカルで使うテキスト→サウンド生成(Stability AI)

短いサウンドから世界は変わります。Stable Audio Openは、テキストを手がかりに44.1kHz・最大約47秒のステレオ音を生成できるStability AIのオープンウェイトモデルです。研究・検証に開かれつつ、現場のSFX(効果...
AI音声

Mac版Whisper比較ガイド:openai-whisper・faster-whisper・whisper.cpp、あなたに最適なのは?

MacでWhisperを使いたいけど、どれを選べばいいか迷っていませんか?OpenAI Whisperには主に3つの実装方式があります:openai-whisper(Python公式版)faster-whisper(高速・GPU対応版)wh...
AI音声

MacでWhisperを高速化する方法②:whisper.cpp編(ネイティブCLI・Apple Silicon最適)

Pythonを使わずにWhisperを動かしたいなら、最適解はwhisper.cppです。これはC/C++で書かれたネイティブ実装版のWhisperで、Apple Siliconでも高速に動作します。依存が少なく、CLIだけで即実行可能。軽...
AI音声

MacでWhisperを高速化する方法①:faster-whisper編(Python実装・Apple Silicon対応)

Mac (Apple Silicon対応) で faster-whisper を導入し、Whisper の文字起こしを最大3倍高速化する方法を解説します。
AI音声

MacでWhisperをインストールして音声認識を試す(ローカル実行・Apple Silicon対応)

Whisperとは(1分で把握)WhisperはOpenAIが提供する音声→テキストの汎用ASR(Automatic Speech Recognition)モデル。多言語対応・雑音耐性が高く、ローカルでも動作します。お手軽:Pythonパッ...
AIテキスト

ChatGPTとVSCodeで“Vibe Coding”を体験:AIと人が共にコードを書く新時代

はじめに:コードを書くという体験が変わり始めているChatGPTとVisual Studio Code(VSCode)をつなぐと、まるでAIと肩を並べてコーディングしているような感覚になります。生成AIと伴にコーディングを行うこのスタイルは...
AIテキスト

VSCodeとOllamaでGithub Copilotをローカルで使うガイド

はじめに:GitHub Copilotのbyok機能でOllamaとローカルで接続Visual Studio Code(VSCode)のGitHub Copilot拡張機能には、byok(Bring Your Own Key)という仕組みが...