LLM

技術部

世界初の1-bit LLM「Bonsai 8B」が登場|1.15GBでLlama 3.1超え、Macで動かしてみた

こんにちは、パレイド技術部です。Caltech 発の AI ラボ PrismML が、世界初の商用レベル 1-bit LLM「Bonsai 8B」 を Apache 2.0 ライセンスで公開しました。本記事はローカル LLM による自動執筆...
技術部

Google Gemma 4 が Apache 2.0 で公開|Qwen3.5 と何が違う?デスクトップ LLM 比較の次の一手

こんにちは、パレイド技術部です。Google がオープンソース LLM の新シリーズ Gemma 4 を Apache 2.0 ライセンスで公開しました。本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウ...
AIテキスト

Ollama MLX対応で Qwen3.5 を試す|35Bが27Bより速い?MoEの実力をベンチマーク

こんにちは、パレイド技術部です。Ollama が v0.19 で Apple MLX フレームワークに対応しました。M5 チップの GPU Neural Accelerator を活かして推論速度が大幅に向上するとのこと。特に推しているのが...
AIテキスト

バイブコーディングの限界と言語移行(1)|バイブコーディングが破綻するとき――10万行Pythonの壁と「AIに読めないコード」問題

こんにちは、パレイド思想部です。以前、バイブコーディングの実践例をいくつか連載しました。RSS の取得から X 投稿の自動化まで、「AIに雑に頼んでコードを書いてもらう」スタイルは確かに生産性が高く、初期開発では感動を覚えるほどです。しかし...
AIテキスト

AIでサムネイル自動生成の実現方法

技術検証をしていると、「あとで記事にまとめよう」と思いながら、ついそのまま次の実験に進んでしまいます。AIを触っていると、作業の区切りが見えにくく、気づけば制作ばかり進んで記録が追いつかないことがよくあります。短期記憶が続いているうちに作業...
AIテキスト

ローカルLLMにWeb検索機能を実装する(Ollama+SearXNG構成)

前回、SearXNGを導入して検索結果をJSON出力できる準備を整えました。今回はLLMがSearXNGを通じて最新情報を取得する方法をPythonで実装してみます。OllamaのFunction CallingでWeb検索を呼び出すLLM...
AIテキスト

LLMでニュース本文の最適CSSセレクタ自動発見を試す【DOM解析×Ollama】

前回の記事では、VLモデルを用いたOCRによる本文抽出を試しました。簡易的な用途であれば十分に機能しますが、精度や処理速度には限界があります。そこで今回は、画像ではなくHTMLそのものに着目し、LLMを使ってDOM構造を解析するアプローチを...
AIテキスト

Vibe coding実践例: RSSからX投稿コメント自動生成の実装

前回までの一連の取り組みで、RSSフィードからX投稿のコメント生成をLLMで自動化するコードをVibe codingで作成しました。今回は、これまでのコードをまとめ、RSSフィード取得からX投稿コメント生成部分までを掲載します。(X投稿部分...
AIテキスト

Vibe coding実践例:特有のリファクタリングの難しさ

前回まで、RSSフィードからX投稿のコメント生成をLLMで自動化する取り組みを進めてきました。規模が大きくなってきたため、コード管理の方針を立て、ドキュメントに基づいたコード分割と再構築を進めています。今回は、リファクタリング時に遭遇したC...
AIテキスト

Vibe coding実践例:継続的な拡張に備えるコード管理方針

RSS要約からX向けコメントを量産するとトーンがブレがちです。persona JSONと制約を先に固定し、Ollama(llama3.1:8b)で毎回同じ人格のコメントを出すための設計と実装の要点をまとめます。