技術部 | ページ 13

AudioGen入門：サンプル・Gradioデモ・設定まとめ

AudioGenはMetaが公開したテキストから効果音を生成するモデルで、短いSEを素早く作る用途に向いています。この記事では、最短ルートで「動かす」「理解する」「実務で使う」の流れをまとめます。AudioGenとは何かAudioGenはB...

2025.10.27

AI音楽

Meta社のAudioCraftは、ローカルでテキストから音楽や効果音を生成できるAIフレームワークです。実質商用利用NGのため、個人用途が主となりますが、ローカルでの音源生成の可能性を試すことができます。音楽生成ができるMusicGen、...

2025.10.26

AI音声AI音楽

はじめにローカル或いはオンプレでのLLM運用が注目される中、実行環境を実用レベルに仕上げるには、「どのモデルを選び」「どのようなコンテキスト長（文脈長）・その他パラメータを設定するか」が重要です。本稿では、モデル選定とコンテキスト長を中心と...

2025.10.25

基礎知識

Pythonで開発を始めると、ライブラリのバージョン違いや依存関係の衝突に悩まされることがあります。そんなときに役立つのが、Python標準の仮想環境ツール venv（ブイエンブ）です。この記事では、mac・Windows共通で使える最も...

2025.10.24

基礎知識

Pythonの環境構築で最も多いトラブルのひとつが「どのPythonを使っているのか分からない」問題です。特にAIの利用では、Python 3.9系など以前のバージョンが要求されるため、複数のPythonをインストールして使い分ける必要が...

2025.10.23

基礎知識

本記事では、Stable Audio Open を Windows（CUDA/CPU）および macOS（MPS）環境で検証・運用する過程で遭遇した問題と、その対応策・教訓を体系的にまとめます。🧩 主要な問題と対処法導入関連Python3....

2025.10.22

AI音声AI音楽

はじめにHugging Face（ハギングフェイス）は、AIモデルやデータセットを共有するための世界最大級のプラットフォームです。モデルをローカルで実行したり、Stable Audioなどの生成AIを利用する際には、「アクセストークン」の取...

2025.10.21

基礎知識

短いサウンドから世界は変わります。Stable Audio Openは、テキストを手がかりに44.1kHz・最大約47秒のステレオ音を生成できるStability AIのオープンウェイトモデルです。研究・検証に開かれつつ、現場のSFX（効果...

2025.10.20

AI音楽

MacでWhisperを使いたいけど、どれを選べばいいか迷っていませんか？OpenAI Whisperには主に3つの実装方式があります：openai-whisper（Python公式版）faster-whisper（高速・GPU対応版）wh...

2025.10.19

AI音声

Pythonを使わずにWhisperを動かしたいなら、最適解はwhisper.cppです。これはC/C++で書かれたネイティブ実装版のWhisperで、Apple Siliconでも高速に動作します。依存が少なく、CLIだけで即実行可能。軽...

2025.10.18

AI音声