AI音楽

技術部

Google Antigravityを試す|AIエージェントとWebアプリ開発の可能性を試す

話題の Google Antigravity を試してみました。Antigravity は Visual Studio Code をベースにした開発環境ですが、より AI エージェント主導の開発を志向している点が特徴です。さらに、ブラウザを...
AI音声

ACE-Step 1.5とは?1.0との違いを実測比較|軽量化・速度・音質の進化

2026年2月3日に、ACE-Step 1.5が発表されました。ACE-StepはText 2 Audioとして実用的な音楽生成AI。当サイトでもBGM生成ができるモデルとして度々取り上げています。詳しい紹介は下記などがよくまとまっています...
思想部

嗜好化するToDo管理(4) フロー状態を維持してToDoを記録したい

こんにちは。パレイド思想部です。ToDoは、いざリストを作ろうとしても、順序よく網羅的に頭の中から絞り出すのは意外と難しいものです。むしろ、別の仕事をしている最中や、シャワーを浴びているとき、あるいは寝る直前など、ふとした瞬間にアイディアが...
思想部

嗜好化するToDo管理(1) ToDo管理にAIを導入したい

こんにちは。パレイド思想部です。趣味に充てられる時間は、日によって大きく変わります。忙しい時期を抜けた頃には、何をやっていたのか思い出せなくなることもあります。仕事には締切や評価がありますが、趣味にはそれがありません。また、人に管理されるこ...
思想部

pareido.jp初期フェーズ(2025年10月~12月)のAIまとめ

2025年10月より3ヶ月間、腰を据えてAIに関する知識と技術へのキャッチアップを続けてきました。知識がだいぶ深まった一方で、進化が早くてまだまだ追いつけないという、嬉しい悩みに翻弄されています。AIの力を借りて、一旦現状を棚卸しして、今後...
AIテキスト

ChatGPT・Geminiでのサムネイル自動生成の進化

前回の記事では、AIを活用したサムネイル自動生成を試行しました。ChatGPTやGeminiでは日本語の文字崩れや構造理解の難しさが課題となり、自然言語ベースの指示で微調整が難しい現状があります。AI技術の進化とともに解決が期待されています...
AIテキスト

AIでサムネイル自動生成の実現方法

技術検証をしていると、「あとで記事にまとめよう」と思いながら、ついそのまま次の実験に進んでしまいます。AIを触っていると、作業の区切りが見えにくく、気づけば制作ばかり進んで記録が追いつかないことがよくあります。短期記憶が続いているうちに作業...
AIテキスト

Ollama×VLモデルでニュース本文をOCR抽出する方法

前回はOllamaのVL対応モデルで画像解析を試しました。今回は一歩進めて、スクリーンショットから日本語OCRを行い、ニュース記事の本文抽出まで自動化します。ニュース記事の本文抽出は、HTML構造の違いや動的要素のせいで意外と壊れやすい問題...
AIテキスト

OpenCV × Ollama(VL)でカメラ画像を定点観測するPython実装例

前回は、OllamaでVL(Vision Language)に対応したモデルを導入し、UIから画像を解析する例を紹介しました。チャット画面を通じて画像を渡し、その内容を自然言語で説明させるところまでを確認しています。今回は一歩進めて、API...
AIテキスト

生成AIショート動画自動生成チャレンジ: 音楽・画像を動画に統合したサンプル紹介

これまで紹介してきた手順を統合し、実際にショート動画のサンプルを制作してみます。生成AIを組み合わせた具体的な制作フローと、その作例をあわせて紹介します。ACE-StepでBGMを生成以前に紹介した ComfyUI + ACE-Step の...