2026-06

PC構成

AIハードウェアはいつ買うべきか|クラウドAIとローカルLLMの天秤で考える

AIハードウェアはいつ買うべきか。価格を左右するのはクラウドAIの普及とローカルLLMの進化という2つの力です。2026年はメモリやSSDの価格に上昇圧力が続き、次世代のSUPERやRTX 60は公式発表がないなど判断材料が変わりました。価格が決まる仕組みから、今買う人と待つ人の条件を整理します。
GPU・グラフィックボード

VRAM 16GBでローカルLLMのコンテキスト長はどこまで伸ばせるか|KVキャッシュ量子化の実測

長文入力でつまずくとき、モデル本体とは別に、コンテキスト側のKVキャッシュがVRAMを食い尽くしているのが主因になっていることがある。前回、VRAM 16GBのGPUでGemma 4 12Bを動かす記事を書いた。モデル本体さえ16GBに収ま...
ロボット

Unitree G1:人型ロボット開発の国内現場ルポ|フィジカルAIの実装現場と日本の立ち位置

京都のスタートアップ・ハカルスの実機検証拠点『HACARUS Humanoid Lab』を現場ルポ。Unitree G1とNVIDIA Isaac Simで人型ロボット開発を支援。料金・4コース・導入手順をTECH+取材から整理します。
GPU・グラフィックボード

VRAM 16GBでGemma 4 12Bを動かす|RTX 5080/5060 Ti実測の速度・VRAMと16GB級LLMの選び方

Google が Gemma 4 12B を公開したのが 2026 年 6 月 3 日。エンコーダを持たない統合型のマルチモーダルモデルで、Google 自身が「16GB の VRAM またはユニファイドメモリを積んだノートで動く」サイズだ...
PC構成

Codex CLI 推奨スペック|GPU不要でも要注意なローカルサンドボックスとWindows・Node.js環境

Codex CLI に専用 GPU は不要(モデル推論はクラウド、コマンド実行は手元)。ローカル実行サンドボックス・承認モード・Windows 対応・Node.js・認証を公式情報で整理した推奨スペック/必要環境ガイド。
GPU・グラフィックボード

ローカルLLMの量子化はどれを選ぶか|Q4_K_M・Q8_0・FP16のVRAMと速度を実測比較

Ollama でモデルを探していると、同じモデル名でもタグがいくつも並んでいることに気づく。たとえば llama3.2:3b を引こうとすると、3b-instruct-q4_K_M や 3b-instruct-q8_0、3b-instruc...
GPU・グラフィックボード

デュアルGPUでローカルLLMを動かす|Ollama自動分散の実測と二枚目が遊ぶ落とし穴(RTX 5080+5060 Ti)

デュアルGPU(RTX 5080 + RTX 5060 Ti)で、16GBに載らない大型ローカルLLM(qwen3.5:35b-a3b 等)を動かした実測。Ollamaは設定なしで自動的に二枚へ分散し、筆者環境・Ollama 0.23.3・num_ctx=4096では100% GPUロードでqwen 約93・gemma 約109 tok/s を確認。OLLAMA_SCHED_SPREADは通常不要。複数serve競合で二枚目が遊ぶ落とし穴も解説する。