技術部

AI音楽

AudioGen入門:サンプル・Gradioデモ・設定まとめ

AudioGenはMetaが公開したテキストから効果音を生成するモデルで、短いSEを素早く作る用途に向いています。この記事では、最短ルートで「動かす」「理解する」「実務で使う」の流れをまとめます。AudioGenとは何かAudioGenはB...
AI音声

AudioCraft Windows CUDA環境導入ガイド:依存関係を手動で解決

Meta社のAudioCraftは、ローカルでテキストから音楽や効果音を生成できるAIフレームワークです。実質商用利用NGのため、個人用途が主となりますが、ローカルでの音源生成の可能性を試すことができます。音楽生成ができるMusicGen、...
基礎知識

ローカルLLMモデル選定:コンテキスト長の最適化からパラメータ調整まで

はじめにローカル或いはオンプレでのLLM運用が注目される中、実行環境を実用レベルに仕上げるには、「どのモデルを選び」「どのようなコンテキスト長(文脈長)・その他パラメータを設定するか」が重要です。本稿では、モデル選定とコンテキスト長を中心と...
基礎知識

venv入門:Python仮想環境でプロジェクトを安全に分ける方法

Pythonで開発を始めると、ライブラリのバージョン違いや依存関係の衝突に悩まされることがあります。そんなときに役立つのが、Python標準の仮想環境ツール venv(ブイエンブ) です。この記事では、mac・Windows共通で使える最も...
基礎知識

pyenv入門:Pythonバージョンを安全に切り替える基礎

Pythonの環境構築で最も多いトラブルのひとつが「どのPythonを使っているのか分からない」問題です。特にAIの利用では 、Python 3.9系など以前のバージョンが要求されるため、複数のPythonをインストールして使い分ける必要が...
AI音声

Stable Audio Open 検証・運用で遭遇した問題一覧(2025年10月現在)

本記事では、Stable Audio Open を Windows(CUDA/CPU)および macOS(MPS)環境で検証・運用する過程で遭遇した問題と、その対応策・教訓を体系的にまとめます。🧩 主要な問題と対処法導入関連Python3....
基礎知識

Hugging Faceのサインアップからアクセストークン取得までの完全ガイド

はじめにHugging Face(ハギングフェイス)は、AIモデルやデータセットを共有するための世界最大級のプラットフォームです。モデルをローカルで実行したり、Stable Audioなどの生成AIを利用する際には、「アクセストークン」の取...
AI音楽

Stable Audio Open入門:ローカルで使うテキスト→サウンド生成(Stability AI)

短いサウンドから世界は変わります。Stable Audio Openは、テキストを手がかりに44.1kHz・最大約47秒のステレオ音を生成できるStability AIのオープンウェイトモデルです。研究・検証に開かれつつ、現場のSFX(効果...
AI音声

Mac版Whisper比較ガイド:openai-whisper・faster-whisper・whisper.cpp、あなたに最適なのは?

MacでWhisperを使いたいけど、どれを選べばいいか迷っていませんか?OpenAI Whisperには主に3つの実装方式があります:openai-whisper(Python公式版)faster-whisper(高速・GPU対応版)wh...
AI音声

MacでWhisperを高速化する方法②:whisper.cpp編(ネイティブCLI・Apple Silicon最適)

Pythonを使わずにWhisperを動かしたいなら、最適解はwhisper.cppです。これはC/C++で書かれたネイティブ実装版のWhisperで、Apple Siliconでも高速に動作します。依存が少なく、CLIだけで即実行可能。軽...