GPU・グラフィックボード

GPU・グラフィックボード

RTX 4060 8GBでQwen3.6 35B MoEを動かす

Qwen3.6-35B-A3Bとは、Alibabaが2026年4月に公開したMoE型の大規模言語モデル。 海外のRedditコミュニティ(r/LocalLLaMA)で、RTX 4060 Laptop(VRAM 8GB)+RAM 96GBの構...
GPU・グラフィックボード

RTX 5080で最初に入れる7-8BローカルLLMはどれか

7-8BローカルLLMとは、パラメータ数70億〜80億級の中型言語モデルのこと。phi4-miniやllama3.2:3bでOllamaの動作確認は済んだ。次は少し大きい7-8Bクラスを試したい。ただ、Ollamaライブラリで「7B」「8B...
GPU・グラフィックボード

AI用PCの最低スペックガイド|RTX 5060 Ti+RAM 32GBで始めるローカルAI環境

2026年にローカルLLMを自宅で動かすなら、VRAM(GPUに搭載された専用メモリ)16GB以上のグラフィックボードが最低ライン。具体的にはRTX 5060 Ti 16GBを軸に組んだ場合、総額は約23.5万円からが現実的な出発点になる。...
ComfyUI

LTX 1をComfyUIで動かすノード構成の全体像|スクリーンショットで見る基本ワークフロー

LTX 1動画生成ComfyUIワークフローのノード構成を画面キャプチャ中心で解説。15ノードでLTX+RIFE VFI+H264出力まで組む手順、各ノードの役割と設定値、サンプラー・VAEデコード比較表、つまずきやすいポイントを実機検証ベースでまとめる。
GPU・グラフィックボード

翻訳用ローカルLLMをRTX 5080で実測

翻訳用ローカルLLMとは、PC上で動かす翻訳特化のオープンソース言語モデルである。結論から書きます。翻訳用途で「Gemma 3 4Bが最強」という海外評をそのまま信じるのは危険。当サイトの検証環境(RTX 5080 / i7-14700F ...
GPU・グラフィックボード

RTX 5080で動かすコーディング用ローカルLLM実測比較

コーディング用ローカルLLMとは、IDEから呼び出してコード補完や生成に使う自前推論の言語モデルのこと。RTX 5080で同じプロンプト・同じ量子化条件のもと、コード特化のcodestral:22bと汎用の14Bクラス2種(phi4:14b...
GPU・グラフィックボード

VRAM 16GB:RTX 5080 VRAM不足でLLMが起動しないエラーの解決法|原因と対処法を徹底解説

RTX 5080の16GB VRAMで実効14.8GB枠を超える32B Denseモデルが起動拒否される原因と対処を整理。SKIPPED_VRAMの正体、量子化Q3/Q4比較、MoE切替、CPUオフロード、デュアルGPUまで実測値で対応策を提示。
GPU・グラフィックボード

RTX 5080でMoEモデルだけ消費電力が1/4に落ちる|gemma4:26b・qwen3.5:35b-a3b実測

RTX 5080で14モデルを連続計測。密モデルは200〜300W帯、MoE構成のgemma4:26bとqwen3.5:35b-a3bだけがVRAM14.8GB満杯のまま47〜73Wまで低下。tokens/W効率比較と電気代年5万円差まで実測検証した。
GPU・グラフィックボード

llama.cpp b8755でSnapdragon Hexagon対応|Linux上のモバイル推論はどこまで現実的か

llama.cpp b8755とは、Snapdragon上のLinuxでHexagon DSPを扱えるよう拡張したリリースである。 「モバイル端末でローカルLLMを動かす」という話題が、この数ヶ月で急に現実味を帯びてきました。公開されたll...
GPU・グラフィックボード

Ollama 0.20.7×NVIDIAドライバ595.97でRTX 5080の推論速度が平均80%向上した件を検証

Ollama 0.20.7×NVIDIAドライバ595.97環境でのRTX 5080推論速度向上とは、当サイト計測で8モデル全てが+75〜86%跳ねた現象である。結論から言います。当サイトの検証環境(RTX 5080 / i7-14700F...