未分類

Google Antigravityを試す|AIエージェントとWebアプリ開発の可能性を試す

話題の Google Antigravity を試してみました。Antigravity は Visual Studio Code をベースにした開発環境ですが、より AI エージェント主導の開発を志向している点が特徴です。さらに、ブラウザを...
AIテキスト

ChatGPT Codex Mac版デスクトップアプリを試す|ローカル実行・トークン消費・課金の感触

2026年2月3日より、ChatGPT Codexのデスクトップ版が利用可能になりました。まずはMac版がリリースされており、公式サイトからダウンロードできます。本記事では、実際に触ってみた所感を簡単にまとめます。インストールはシンプルダウ...
AI音声

ACE-Step 1.5とは?1.0との違いを実測比較|軽量化・速度・音質の進化

2026年2月3日に、ACE-Step 1.5が発表されました。ACE-StepはText 2 Audioとして実用的な音楽生成AI。当サイトでもBGM生成ができるモデルとして度々取り上げています。詳しい紹介は下記などがよくまとまっています...
基礎知識

SearXNGをMacで構築する方法|DockerとJSON出力設定まで解説

ChatGPTなどのクラウド型AIでは、Web検索はほとんど意識することなく統合されています。最新情報を取得し、文脈に沿って要約してくれる体験は、すでに当たり前のものになりました。一方で、ローカルLLMはRAGによって手元の文書を検索・参照...
AIテキスト

OpenCV × Ollama(VL)でカメラ画像を定点観測するPython実装例

前回は、OllamaでVL(Vision Language)に対応したモデルを導入し、UIから画像を解析する例を紹介しました。チャット画面を通じて画像を渡し、その内容を自然言語で説明させるところまでを確認しています。今回は一歩進めて、API...
AI画像

OllamaでローカルVLを試す|無料LLMで画像認識とAPI自動化の可能性

前回試したOCR機能ではテキストの抽出は可能ですが、画像そのものを理解することはできません。ChatGPTのようなクラウド型AIに画像を見せれば認識してくれますが、実は無料で動かせるローカルLLMでも画像認識(Vision Language...
AIテキスト

macOSのOCR機能とは?ショートカットアプリの自動化に組むこむ方法

少し前までは特別な操作が必要でしたが、今では画像からテキストをコピーできるのが当たり前になりました。例えば macOS では Vision フレームワークが提供されており、Finder や Safari などからOS標準機能としてOCRを利...
AIテキスト

生成AIショート動画自動生成チャレンジ: 音楽・画像を動画に統合したサンプル紹介

これまで紹介してきた手順を統合し、実際にショート動画のサンプルを制作してみます。生成AIを組み合わせた具体的な制作フローと、その作例をあわせて紹介します。ACE-StepでBGMを生成以前に紹介した ComfyUI + ACE-Step の...
AIテキスト

生成AIショート動画自動生成チャレンジ: 動画クリップと音楽を統合してffmpegで動画生成

前回までに、ACE-Stepを用いた楽曲生成と、Stable Diffusion WebUI ForgeおよびWan2.2による動画クリップ生成の手順を確認しました。今回は、これらの素材を統合し、一本の動画として仕上げる処理を試します。ff...
AIテキスト

生成AIショート動画自動生成チャレンジ: Stability Matrix+Pythonで静止画から動画クリップを作る

前回までに、Stable Diffusion WebUI Forgeで静止画を生成し、Wan2.2を用いてI2Vによる短い動画クリップを作成するところまでを確認しました。今回は、この一連の処理をPythonからAPI経由で呼び出せる形に整理...