.. _installation: 

安装
==============================

Linux
----------------------------------


CUDA 安装
~~~~~~~~~~~~~~~~~~~~~~~~~


CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型，它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。

首先，在 `https://developer.nvidia.com/cuda-gpus <https://developer.nvidia.com/cuda-gpus/>`_ 查看您的 GPU 是否支持CUDA


1. 保证当前 Linux 版本支持CUDA. 在命令行中输入 ``uname -m && cat /etc/*release``，应当看到类似的输出

.. code-block:: bash

    x86_64
    DISTRIB_ID=Ubuntu
    DISTRIB_RELEASE=22.04

2. 检查是否安装了 ``gcc`` . 在命令行中输入 ``gcc --version`` ，应当看到类似的输出

.. code-block:: bash

    gcc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0

3. 在以下网址（`https://developer.nvidia.com/cuda-gpus <https://developer.nvidia.com/cuda-12-2-0-download-archive/>`__）下载所需的 CUDA，这里推荐12.2版本，注意需要根据上述输出选择正确版本。

  .. image:: ../assets/image-20240610221819901.png

如果您之前安装过 CUDA(例如为12.1版本)，需要先使用 ``sudo /usr/local/cuda-12.1/bin/cuda-uninstaller`` 卸载。如果该命令无法运行，可以直接：

.. code-block:: bash

    sudo rm -r /usr/local/cuda-12.1/
    sudo apt clean && sudo apt autoclean

卸载完成后运行以下命令并根据提示继续安装：

.. code-block:: bash

    wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda_12.2.0_535.54.03_linux.run
    sudo sh cuda_12.2.0_535.54.03_linux.run

**注意**:在确定 CUDA 自带驱动版本与 GPU 是否兼容之前,建议取消 Driver 的安装。

.. image:: ../assets/image-20240610221924687.png	

完成后输入 ``nvcc -V`` 检查是否出现对应的版本号，若出现则安装完成。

.. image:: ../assets/image-20240610221942403.png

Windows
-----------------------

CUDA 安装
~~~~~~~~~~~~~~~~~~~~~~~
1. 打开 **设置** ，在 **关于** 中找到 **Windows 规格** 保证系统版本在以下列表中：

.. list-table::
   :widths: 50
   :header-rows: 1

   * - 支持版本号
   * - Microsoft Windows 11 21H2
   * - Microsoft Windows 11 22H2-SV2
   * - Microsoft Windows 11 23H2
   * - Microsoft Windows 10 21H2
   * - Microsoft Windows 10 22H2
   * - Microsoft Windows Server 2022


2. 选择对应的版本下载并根据提示安装。

.. image:: ../assets/image-20240610222000379.png

3. 打开 cmd 输入 ``nvcc -V`` ，若出现类似内容则安装成功。

.. image:: ../assets/image-20240610222014623.png

否则，检查系统环境变量，保证 CUDA 被正确导入。			

.. image:: ../assets/image-20240610222021868.png


LLaMA-Factory 安装
-------------------------------------

在安装 LLaMA-Factory 之前，请确保您安装了下列依赖:

运行以下指令以安装 LLaMA-Factory 及其依赖:

.. code-block:: bash

  git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
  cd LLaMA-Factory
  pip install -e .
  pip install -r requirements/metrics.txt

如果出现环境冲突，请尝试使用 ``pip install --no-deps -e .`` 解决

LLaMA-Factory 校验
-------------------------------

完成安装后，可以通过使用 ``llamafactory-cli version`` 来快速校验安装是否成功

如果您能成功看到类似下面的界面，就说明安装成功了。

.. image:: ../assets/image-20240611002529453.png

LLaMA-Factory 高级选项
---------------------------------

Windows
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


QLoRA
+++++++++++++++++++++++++++++++++

如果您想在 Windows 上启用量化 LoRA（QLoRA），请根据您的 CUDA 版本选择适当的 `bitsandbytes <https://github.com/jllllll/bitsandbytes-windows-webui/releases/tag/wheels/>`_ 发行版本。

.. code-block:: bash

    pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl

FlashAttention-2
++++++++++++++++++++++++++++++

如果您要在 Windows 平台上启用 FlashAttention-2，请根据您的 CUDA 版本选择适当的 `flash-attention <https://github.com/bdashore3/flash-attention/releases/>`_ 发行版本。


Extra Dependency
~~~~~~~~~~~~~~~~~~~~~~~~~

如果您有更多需求，请安装对应依赖。

.. list-table::
  :widths: 10 50
  :header-rows: 1

  * - 名称
    - 描述
  * - torch
    - 开源深度学习框架 PyTorch，广泛用于机器学习和人工智能研究中。
  * - torch-npu
    - PyTorch 的昇腾设备兼容包。
  * - metrics
    - 用于评估和监控机器学习模型性能。
  * - deepspeed
    - 提供了分布式训练所需的零冗余优化器。
  * - bitsandbytes
    - 用于大型语言模型量化。
  * - hqq
    - 用于大型语言模型量化。
  * - eetq
    - 用于大型语言模型量化。
  * - gptq
    - 用于加载 GPTQ 量化模型。
  * - awq
    - 用于加载 AWQ 量化模型。
  * - aqlm
    - 用于加载 AQLM 量化模型。
  * - vllm
    - 提供了高速并发的模型推理服务。
  * - galore
    - 提供了高效全参微调算法。
  * - badam
    - 提供了高效全参微调算法。
  * - qwen
    - 提供了加载 Qwen v1 模型所需的包。
  * - modelscope
    - 魔搭社区，提供了预训练模型和数据集的下载途径。
  * - swanlab
    - 开源训练跟踪工具 SwanLab，用于记录与可视化训练过程
  * - dev
    - 用于 LLaMA Factory 开发维护。