AI画像

AIテキスト

OpenCV × Ollama(VL)でカメラ画像を定点観測するPython実装例

前回は、OllamaでVL(Vision Language)に対応したモデルを導入し、UIから画像を解析する例を紹介しました。チャット画面を通じて画像を渡し、その内容を自然言語で説明させるところまでを確認しています。今回は一歩進めて、API...
AI画像

OllamaでローカルVLを試す|無料LLMで画像認識とAPI自動化の可能性

前回試したOCR機能ではテキストの抽出は可能ですが、画像そのものを理解することはできません。ChatGPTのようなクラウド型AIに画像を見せれば認識してくれますが、実は無料で動かせるローカルLLMでも画像認識(Vision Language...
AIテキスト

macOSのOCR機能とは?ショートカットアプリの自動化に組むこむ方法

少し前までは特別な操作が必要でしたが、今では画像からテキストをコピーできるのが当たり前になりました。例えば macOS では Vision フレームワークが提供されており、Finder や Safari などからOS標準機能としてOCRを利...
AIテキスト

生成AIショート動画自動生成チャレンジ: 音楽・画像を動画に統合したサンプル紹介

これまで紹介してきた手順を統合し、実際にショート動画のサンプルを制作してみます。生成AIを組み合わせた具体的な制作フローと、その作例をあわせて紹介します。ACE-StepでBGMを生成以前に紹介した ComfyUI + ACE-Step の...
AIテキスト

生成AIショート動画自動生成チャレンジ: Stability Matrix+Pythonで静止画から動画クリップを作る

前回までに、Stable Diffusion WebUI Forgeで静止画を生成し、Wan2.2を用いてI2Vによる短い動画クリップを作成するところまでを確認しました。今回は、この一連の処理をPythonからAPI経由で呼び出せる形に整理...
AIテキスト

生成AIショート動画自動生成チャレンジ: Stability MatrixでComfyUIとSD WebUIを準備

素材生成の準備が整ったので、今回は実験としてショート動画をどこまで自動生成できるかを試してみます。今回試す動画生成: ショート動画のベース動画の長さは1分とし、全体で1つのストーリーとして構成します。まず、ストーリーの雰囲気に合った音楽を生...
AIテキスト

生成AIショート動画自動生成チャレンジ: Stable Diffusion WebUI Forge導入とAPI利用

前回まで、生成AIによるショート動画の自動生成を目指し、I2Vを行うための WAN2.2 と ComfyUI の設定を進めました。今回は、I2Vの元となる画像の生成をStable Diffusionで行う準備を進めます。Stable Dif...
AI画像

InvokeAI をローカルに導入する方法

Stable Diffusion ベースの Web UI「InvokeAI」を Windows/Mac/Linux にローカルインストールして画像生成を始める手順を最新の出典リンク付きで丁寧に解説します。
AI画像

Stable Diffusion SD.Next 導入ガイド(Windows/Mac)

SD.NextをWindowsではStability Matrix、macOSでは公式手順で導入する方法を、迷いなく実行できるよう整理しました。
AI画像

Fooocusとは?手軽さ優先 SDXLベースの画像生成AI

Fooocusの特徴、開発状況、他UIとの違い、インストールの流れを整理し、どのような用途に向いているかを初心者にも分かりやすく解説します。