パレイド | ページ 15 | 虚空に紡がれた記憶の断片

pareido.jp初期フェーズ(2025年10月~12月)のAIまとめ

2025年10月より3ヶ月間、腰を据えてAIに関する知識と技術へのキャッチアップを続けてきました。知識がだいぶ深まった一方で、進化が早くてまだまだ追いつけないという、嬉しい悩みに翻弄されています。AIの力を借りて、一旦現状を棚卸しして、今後...

2026.01.06

思想部

前回の記事では、AIを活用したサムネイル自動生成を試行しました。ChatGPTやGeminiでは日本語の文字崩れや構造理解の難しさが課題となり、自然言語ベースの指示で微調整が難しい現状があります。AI技術の進化とともに解決が期待されています...

2026.01.05

AIテキストAI画像

前回の記事では、AIを使ったアイキャッチ画像の自動生成を試しました。記事内容からプロンプトを生成し、Stable Diffusionで画像を作成するところまでは自動化できています。しかし、生成した画像をWordPressの記事に設定する作業...

2026.01.04

AIテキストAI画像

技術検証をしていると、「あとで記事にまとめよう」と思いながら、ついそのまま次の実験に進んでしまいます。AIを触っていると、作業の区切りが見えにくく、気づけば制作ばかり進んで記録が追いつかないことがよくあります。短期記憶が続いているうちに作業...

2026.01.03

AIテキストAI画像未分類

前回、SearXNGを導入して検索結果をJSON出力できる準備を整えました。今回はLLMがSearXNGを通じて最新情報を取得する方法をPythonで実装してみます。OllamaのFunction CallingでWeb検索を呼び出すLLM...

2026.01.02

AIテキスト

ChatGPTなどのクラウド型AIでは、Web検索はほとんど意識することなく統合されています。最新情報を取得し、文脈に沿って要約してくれる体験は、すでに当たり前のものになりました。一方で、ローカルLLMはRAGによって手元の文書を検索・参照...

2026.01.01

基礎知識

前回の記事では、VLモデルを用いたOCRによる本文抽出を試しました。簡易的な用途であれば十分に機能しますが、精度や処理速度には限界があります。そこで今回は、画像ではなくHTMLそのものに着目し、LLMを使ってDOM構造を解析するアプローチを...

2025.12.31

AIテキスト

前回はOllamaのVL対応モデルで画像解析を試しました。今回は一歩進めて、スクリーンショットから日本語OCRを行い、ニュース記事の本文抽出まで自動化します。ニュース記事の本文抽出は、HTML構造の違いや動的要素のせいで意外と壊れやすい問題...

2025.12.30

AIテキストAI画像

前回は、OllamaでVL（Vision Language）に対応したモデルを導入し、UIから画像を解析する例を紹介しました。チャット画面を通じて画像を渡し、その内容を自然言語で説明させるところまでを確認しています。今回は一歩進めて、API...

2025.12.29

AIテキストAI画像

前回試したOCR機能ではテキストの抽出は可能ですが、画像そのものを理解することはできません。ChatGPTのようなクラウド型AIに画像を見せれば認識してくれますが、実は無料で動かせるローカルLLMでも画像認識（Vision Language...

2025.12.28

AI画像