タグ

C++とMetaに関するmisshikiのブックマーク (1)

  • Llama.cpp で Llama 2 を試す|npaka

    「Llama.cpp」で「Llama 2」を試したので、まとめました。 ・macOS 13.4.1 ・Windows 11 前回 1. Llama.cpp「Llama.cpp」はC言語で記述されたLLMのランタイムです。「Llama.cpp」の主な目標は、MacBookで4bit量子化を使用してLLAMAモデルを実行することです。 特徴は、次のとおりです。 ・依存関係のないプレーンなC/C++実装 ・Appleシリコンファースト (ARM NEON、Accelerate、Metalを介して最適化) ・x86アーキテクチャのAVX、AVX2、AVX512のサポート ・Mixed F16/F32精度 ・4bit、5bit、8bit量子化サポート ・BLASでOpenBLAS/Apple BLAS/ARM Performance Lib/ATLAS/BLIS/Intel MKL/NVHPC/AC

    Llama.cpp で Llama 2 を試す|npaka
    misshiki
    misshiki 2023/07/20
    “「Llama.cpp」(llama-cpp-python)はC言語で記述されたLLMのランタイムです。高速推論が可能で、CPUでも動作します。”ローカルで実行方法までが紹介されている。簡単そう。
  • 1