ローカルLLM

GPU・グラフィックボード

RTX 5080で最初に入れる7-8BローカルLLMはどれか

7-8BローカルLLMとは、パラメータ数70億〜80億級の中型言語モデルのこと。 phi4-miniやllama3.2:3bでOllamaの動作確認は済んだ。次は少し大きい7-8Bクラスを試したい。ただ、Ollamaライブラリで「7B」「8...
GPU・グラフィックボード

翻訳用ローカルLLMをRTX 5080で実測

翻訳用ローカルLLMとは、PC上で動かす翻訳特化のオープンソース言語モデルである。 結論から書きます。翻訳用途で「Gemma 3 4Bが最強」という海外評をそのまま信じるのは危険。当サイトの検証環境(RTX 5080 / i7-14700F...
GPU・グラフィックボード

RTX 5080で動かすコーディング用ローカルLLM実測比較

コーディング用ローカルLLMとは、IDEから呼び出してコード補完や生成に使う自前推論の言語モデルのこと。 RTX 5080で同じプロンプト・同じ量子化条件のもと、コード特化のcodestral:22bと汎用の14Bクラス2種(phi4:14...
GPU・グラフィックボード

llama.cpp b8755解説|SnapdragonのHexagon DSPでローカルLLMを動かす

llama.cpp b8755とは、Snapdragon上のLinuxでHexagon DSPを扱えるよう拡張したリリースである。 「モバイル端末でローカルLLMを動かす」という話題が、この数ヶ月で急に現実味を帯びてきました。公開されたll...
GPU・グラフィックボード

AI用ノートPCの選び方【2026年最新】|Claude Code・ローカルLLM・画像生成の3用途別スペック

2026年、AI用ノートPCに本当に必要なスペックは用途で決まる。クラウドAI(ChatGPTやClaude)を使うだけならGPU不要のRAM 16GBマシンで十分だし、ローカルでLLMを動かしたいならVRAM 12GB以上が現実的なライン...
GPU・グラフィックボード

llama.cppのGemma 4でRAMが枯渇する原因|VRAM余裕でもOOMする仕組みと回避策【2026年】

VRAM 32GBのGPUにモデルを載せた。VRAM使用量はまだ余裕がある。なのに数回プロンプトを送っただけでプロセスが強制終了される——原因はGPUではなく、システムRAMの枯渇だった。 海外のRedditコミュニティ(r/LocalLL...
GPU・グラフィックボード

DDR5-6000が14週ぶり5万円割れ|AI用PCメモリの買い時と必要容量ガイド

DDR5-6000の16GB×2枚組が49,980円——昨年12月以来、実に14週ぶりの5万円割れとなった。「メモリなんてどれも同じ」と思っている人もいるかもしれないが、AI用途ではその認識が命取りになる。ローカルLLMを動かすとき、GPU...
GPU・グラフィックボード

NPUとは?AI専用プロセッサの仕組みとGPU・CPUとの違いをわかりやすく解説

NPU(Neural Processing Unit)とは何か、CPU・GPUとの違いをAI用途の視点で解説。Copilot+ PCの40 TOPS要件や主要メーカーの公称値、NPU搭載PCが必要かの判断基準を用途別に整理します。
GPU・グラフィックボード

RTX Neural Texture CompressionでVRAM使用量80%削減|NVIDIAの新技術とAI活用

VRAM争奪戦に挑むNVIDIAのRTX Neural Texture Compression(NTC)を技術解説。テンソルコアでテクスチャを最大16倍以上に圧縮しVRAM使用量を約80%削減する仕組み、BC7との比較、RTX 50/40/30の対応状況、AIワークロードへの波及まで整理。
GPU・グラフィックボード

Snapdragon X2搭載ASUS Zenbook SORA 16のAI性能を分析|NPU 80TOPSの実力

GPUをRTX 5080に換装してローカルLLMを回している筆者からすると、「NPU 80TOPS」という数字はどうしても気になる存在だった。2026年4月8日に発売されたASUS Zenbook SORA 16は、クアルコムの最新プロセッ...