構造部

基礎知識

ローカルLLMモデル選定:コンテキスト長の最適化からパラメータ調整まで

はじめにローカル或いはオンプレでのLLM運用が注目される中、実行環境を実用レベルに仕上げるには、「どのモデルを選び」「どのようなコンテキスト長(文脈長)・その他パラメータを設定するか」が重要です。本稿では、モデル選定とコンテキスト長を中心と...
基礎知識

venv入門:Python仮想環境でプロジェクトを安全に分ける方法

Pythonで開発を始めると、ライブラリのバージョン違いや依存関係の衝突に悩まされることがあります。そんなときに役立つのが、Python標準の仮想環境ツール venv(ブイエンブ) です。この記事では、mac・Windows共通で使える最も...
基礎知識

pyenv入門:Pythonバージョンを安全に切り替える基礎

Pythonの環境構築で最も多いトラブルのひとつが「どのPythonを使っているのか分からない」問題です。特にAIの利用では 、Python 3.9系など以前のバージョンが要求されるため、複数のPythonをインストールして使い分ける必要が...
AI音声

Stable Audio Open 検証・運用で遭遇した問題一覧(2025年10月現在)

本記事では、Stable Audio Open を Windows(CUDA/CPU)および macOS(MPS)環境で検証・運用する過程で遭遇した問題と、その対応策・教訓を体系的にまとめます。🧩 主要な問題と対処法導入関連Python3....
基礎知識

Hugging Faceのサインアップからアクセストークン取得までの完全ガイド

はじめにHugging Face(ハギングフェイス)は、AIモデルやデータセットを共有するための世界最大級のプラットフォームです。モデルをローカルで実行したり、Stable Audioなどの生成AIを利用する際には、「アクセストークン」の取...
AI音楽

Stable Audio Open入門:ローカルで使うテキスト→サウンド生成(Stability AI)

短いサウンドから世界は変わります。Stable Audio Openは、テキストを手がかりに44.1kHz・最大約47秒のステレオ音を生成できるStability AIのオープンウェイトモデルです。研究・検証に開かれつつ、現場のSFX(効果...
AI音声

Mac版Whisper比較ガイド:openai-whisper・faster-whisper・whisper.cpp、あなたに最適なのは?

MacでWhisperを使いたいけど、どれを選べばいいか迷っていませんか?OpenAI Whisperには主に3つの実装方式があります:openai-whisper(Python公式版)faster-whisper(高速・GPU対応版)wh...
AI音声

MacでWhisperを高速化する方法②:whisper.cpp編(ネイティブCLI・Apple Silicon最適)

Pythonを使わずにWhisperを動かしたいなら、最適解はwhisper.cppです。これはC/C++で書かれたネイティブ実装版のWhisperで、Apple Siliconでも高速に動作します。依存が少なく、CLIだけで即実行可能。軽...
AI音声

MacでWhisperを高速化する方法①:faster-whisper編(Python実装・Apple Silicon対応)

Mac (Apple Silicon対応) で faster-whisper を導入し、Whisper の文字起こしを最大3倍高速化する方法を解説します。
AI音声

MacでWhisperをインストールして音声認識を試す(ローカル実行・Apple Silicon対応)

Whisperとは(1分で把握)WhisperはOpenAIが提供する音声→テキストの汎用ASR(Automatic Speech Recognition)モデル。多言語対応・雑音耐性が高く、ローカルでも動作します。お手軽:Pythonパッ...