AIテキスト

AIテキスト

ChatGPT Codex Mac版デスクトップアプリを試す|ローカル実行・トークン消費・課金の感触

2026年2月3日より、ChatGPT Codexのデスクトップ版が利用可能になりました。まずはMac版がリリースされており、公式サイトからダウンロードできます。本記事では、実際に触ってみた所感を簡単にまとめます。インストールはシンプルダウ...
AIテキスト

嗜好化するToDo管理 — あとがき:開発環境の変遷とAIとの付き合い方

こんにちは、パレイド思想部です。連載20回とデモサイト公開で「嗜好化するToDo管理」は一区切りつきましたが、書き切れなかったことがあります。HigherSelfの開発中に経験した開発環境の変遷と、コードだけでなく記事執筆にAIを使った試行...
AIテキスト

ChatGPT・Geminiでのサムネイル自動生成の進化

前回の記事では、AIを活用したサムネイル自動生成を試行しました。ChatGPTやGeminiでは日本語の文字崩れや構造理解の難しさが課題となり、自然言語ベースの指示で微調整が難しい現状があります。AI技術の進化とともに解決が期待されています...
AIテキスト

WordPressへの自動差し込み:サムネイルの最適化方法

前回の記事では、AIを使ったアイキャッチ画像の自動生成を試しました。記事内容からプロンプトを生成し、Stable Diffusionで画像を作成するところまでは自動化できています。しかし、生成した画像をWordPressの記事に設定する作業...
AIテキスト

AIでサムネイル自動生成の実現方法

技術検証をしていると、「あとで記事にまとめよう」と思いながら、ついそのまま次の実験に進んでしまいます。AIを触っていると、作業の区切りが見えにくく、気づけば制作ばかり進んで記録が追いつかないことがよくあります。短期記憶が続いているうちに作業...
AIテキスト

ローカルLLMにWeb検索機能を実装する(Ollama+SearXNG構成)

前回、SearXNGを導入して検索結果をJSON出力できる準備を整えました。今回はLLMがSearXNGを通じて最新情報を取得する方法をPythonで実装してみます。OllamaのFunction CallingでWeb検索を呼び出すLLM...
AIテキスト

LLMでニュース本文の最適CSSセレクタ自動発見を試す【DOM解析×Ollama】

前回の記事では、VLモデルを用いたOCRによる本文抽出を試しました。簡易的な用途であれば十分に機能しますが、精度や処理速度には限界があります。そこで今回は、画像ではなくHTMLそのものに着目し、LLMを使ってDOM構造を解析するアプローチを...
AIテキスト

Ollama×VLモデルでニュース本文をOCR抽出する方法

前回はOllamaのVL対応モデルで画像解析を試しました。今回は一歩進めて、スクリーンショットから日本語OCRを行い、ニュース記事の本文抽出まで自動化します。ニュース記事の本文抽出は、HTML構造の違いや動的要素のせいで意外と壊れやすい問題...
AIテキスト

OpenCV × Ollama(VL)でカメラ画像を定点観測するPython実装例

前回は、OllamaでVL(Vision Language)に対応したモデルを導入し、UIから画像を解析する例を紹介しました。チャット画面を通じて画像を渡し、その内容を自然言語で説明させるところまでを確認しています。今回は一歩進めて、API...
AIテキスト

macOSのOCR機能とは?ショートカットアプリの自動化に組むこむ方法

少し前までは特別な操作が必要でしたが、今では画像からテキストをコピーできるのが当たり前になりました。例えば macOS では Vision フレームワークが提供されており、Finder や Safari などからOS標準機能としてOCRを利...