.. _installation:
安装
==============================
Linux
----------------------------------
CUDA 安装
~~~~~~~~~~~~~~~~~~~~~~~~~
CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型,它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。
首先,在 `https://developer.nvidia.com/cuda-gpus `_ 查看您的 GPU 是否支持CUDA
1. 保证当前 Linux 版本支持CUDA. 在命令行中输入 ``uname -m && cat /etc/*release``,应当看到类似的输出
.. code-block:: bash
x86_64
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=22.04
2. 检查是否安装了 ``gcc`` . 在命令行中输入 ``gcc --version`` ,应当看到类似的输出
.. code-block:: bash
gcc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
3. 在以下网址(`https://developer.nvidia.com/cuda-gpus `__)下载所需的 CUDA,这里推荐12.2版本,注意需要根据上述输出选择正确版本。
.. image:: ../assets/image-20240610221819901.png
如果您之前安装过 CUDA(例如为12.1版本),需要先使用 ``sudo /usr/local/cuda-12.1/bin/cuda-uninstaller`` 卸载。如果该命令无法运行,可以直接:
.. code-block:: bash
sudo rm -r /usr/local/cuda-12.1/
sudo apt clean && sudo apt autoclean
卸载完成后运行以下命令并根据提示继续安装:
.. code-block:: bash
wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda_12.2.0_535.54.03_linux.run
sudo sh cuda_12.2.0_535.54.03_linux.run
**注意**:在确定 CUDA 自带驱动版本与 GPU 是否兼容之前,建议取消 Driver 的安装。
.. image:: ../assets/image-20240610221924687.png
完成后输入 ``nvcc -V`` 检查是否出现对应的版本号,若出现则安装完成。
.. image:: ../assets/image-20240610221942403.png
Windows
-----------------------
CUDA 安装
~~~~~~~~~~~~~~~~~~~~~~~
1. 打开 **设置** ,在 **关于** 中找到 **Windows 规格** 保证系统版本在以下列表中:
.. list-table::
:widths: 50
:header-rows: 1
* - 支持版本号
* - Microsoft Windows 11 21H2
* - Microsoft Windows 11 22H2-SV2
* - Microsoft Windows 11 23H2
* - Microsoft Windows 10 21H2
* - Microsoft Windows 10 22H2
* - Microsoft Windows Server 2022
2. 选择对应的版本下载并根据提示安装。
.. image:: ../assets/image-20240610222000379.png
3. 打开 cmd 输入 ``nvcc -V`` ,若出现类似内容则安装成功。
.. image:: ../assets/image-20240610222014623.png
否则,检查系统环境变量,保证 CUDA 被正确导入。
.. image:: ../assets/image-20240610222021868.png
LLaMA-Factory 安装
-------------------------------------
在安装 LLaMA-Factory 之前,请确保您安装了下列依赖:
运行以下指令以安装 LLaMA-Factory 及其依赖:
.. code-block:: bash
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .
pip install -r requirements/metrics.txt
如果出现环境冲突,请尝试使用 ``pip install --no-deps -e .`` 解决
LLaMA-Factory 校验
-------------------------------
完成安装后,可以通过使用 ``llamafactory-cli version`` 来快速校验安装是否成功
如果您能成功看到类似下面的界面,就说明安装成功了。
.. image:: ../assets/image-20240611002529453.png
LLaMA-Factory 高级选项
---------------------------------
Windows
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
QLoRA
+++++++++++++++++++++++++++++++++
如果您想在 Windows 上启用量化 LoRA(QLoRA),请根据您的 CUDA 版本选择适当的 `bitsandbytes `_ 发行版本。
.. code-block:: bash
pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl
FlashAttention-2
++++++++++++++++++++++++++++++
如果您要在 Windows 平台上启用 FlashAttention-2,请根据您的 CUDA 版本选择适当的 `flash-attention `_ 发行版本。
Extra Dependency
~~~~~~~~~~~~~~~~~~~~~~~~~
如果您有更多需求,请安装对应依赖。
.. list-table::
:widths: 10 50
:header-rows: 1
* - 名称
- 描述
* - torch
- 开源深度学习框架 PyTorch,广泛用于机器学习和人工智能研究中。
* - torch-npu
- PyTorch 的昇腾设备兼容包。
* - metrics
- 用于评估和监控机器学习模型性能。
* - deepspeed
- 提供了分布式训练所需的零冗余优化器。
* - bitsandbytes
- 用于大型语言模型量化。
* - hqq
- 用于大型语言模型量化。
* - eetq
- 用于大型语言模型量化。
* - gptq
- 用于加载 GPTQ 量化模型。
* - awq
- 用于加载 AWQ 量化模型。
* - aqlm
- 用于加载 AQLM 量化模型。
* - vllm
- 提供了高速并发的模型推理服务。
* - galore
- 提供了高效全参微调算法。
* - badam
- 提供了高效全参微调算法。
* - qwen
- 提供了加载 Qwen v1 模型所需的包。
* - modelscope
- 魔搭社区,提供了预训练模型和数据集的下载途径。
* - swanlab
- 开源训练跟踪工具 SwanLab,用于记录与可视化训练过程
* - dev
- 用于 LLaMA Factory 开发维护。