本地docker部署libretranslate翻译模型并采用CUDA加速

一、Libretanslate基本介绍

Libretanslate 是一个开源的，基于AI驱动的翻译软件，官方网站提供了在线的翻译功能，并且可以申请 api 密钥去调用 api 将翻译能力嵌入到我们自己的程序或者软件中。当然，官方的github有详细的本地部署教程，如果有能力建议根据官方的 README 部署，本文是对可能遇到的一些问题的补充。本文采用的是 docker 部署，当然官方提供了直接通过 pip 包部署，读者可以根据自己的需求选择。效果图如下：

libretranslate翻译效果

二. docker 与 nvidia docker 支持的前置条件

首先需要保证你的本地系统已经安装的 docker 环境，建议采用国内的源安装，比如清华源、阿里源等。同时建议配置docker镜像源防止由于网络问题无法拉取镜像。这里不提供安装配置命令，建议读者自行搜索相关资料。
使用 nvidia 的 docker 加速，需要读者本地拥有 nvidia 的显卡，并安装了显卡驱动。如果没有 nvidia 的显卡支持，可以跳过这一部分，进行 cpu 版本的本地部署。
首先要在自己的电脑上安装 nvidia docker 支持，参考的官方地址。根据你的 linux 发行版复制粘贴命令就行了，debian 发行版的安装命令如下：

# 添加 apt 源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | \
sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg && \
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 更新源
sudo apt-get update

# 安装nvidia-container-toolkit
sudo apt-get install -y nvidia-container-toolkit

然后对 docker 进行配置：

sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

三、docker版本的libretranslate的本地部署

接下来我们进行部署。首先，我们需要在 github 上下载源码：

git clone git@github.com:LibreTranslate/LibreTranslate.git

1. cpu版本libretranslate的部署

cpu 版本部署非常简单，在源码根路径下执行下面的命令

docker compose -f docker-compose.yml up -d --build

这个命令会根据 docker/Dockerfile 文件构建 libretranslate 镜像并部署在本地的 5000 端口。- -build 代表重新构建镜像。第一次构建好镜像后下一次可以把 - -build命令去掉，每次创建容器都会从网络上下载指定的翻译模型，因此 5000 端口并不能立即访问，可以通过 docker stats 查看容器的网络 IO 状态判断翻译模型是否下载完毕。

2. GPU版本libretranslate的部署

部署gpu版本的 libretranslate 命令与上面相同，只是将 yml 文件为 docker-compose.cuda.yml。在部署之前，最好修改 docker/cuda.Dockerfile 文件将 cuda 的相关环境变量导出，大概在文件末尾的位置添加下面几行：

# Depending on your cuda install you may need to uncomment this line to allow the container to access the cuda libraries
# See: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions
# ENV LD_LIBRARY_PATH=/usr/local/cuda/lib:/usr/local/cuda/lib64
ENV LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
ENV PATH=$PATH:/usr/local/cuda/bin
ENV CUDA_HOME=/usr/local/cuda

然后通过 docker compose -f docker-compose.cuda.yml up -d --build进行构建并部署即可。同样的，构建成功 docker 会启动在本地 5000 端口，每次创建容器都会从网络上下载指定的翻译模型。

四、可能遇到的问题

1. 构建镜像时apt和pip下载太慢

apt 和 pip 默认的官方源在国内访问不太稳定，可以在执行 apt install和 pip install之前更换镜像源为国内源，需要在对应的 Dockerfile中修改：

# 更换apt源为清华源
RUN sed -i 's/archive.ubuntu.com/mirrors.tuna.tsinghua.edu.cn/g'  /etc/apt/sources.list

#更换pip源为清华源，应该添加在Dockerfile中pip下载之后的位置
RUN pip3 config set global.index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

# cpu版本中Dockerfile采用了venv
RUN ./venv/bin/pip config set global.index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

2. (URLError(ConnectionRefusedError(111, ‘Connection refused’)),)在 docker 日志中大量出现，无法下载翻译模型

Libretranslate 是基于 argos-translate 这个开源翻译模型开发的项目，内部仍然调用的是 argos-translate，argos-tanslate 下载一个 index.json 文件，然后根据你指定的需要支持的语言从 index.json 中获取下载路径。index.json 默认下载到 ~/.local/cache/argos-translate 翻译模型默认下载保存到当前路径下 db/session 下。我出现的问题是从 docker 内部是无法正常下载index.json的，但是主机是可以正常下载的，因此我采用的方法是手动下载 index.json 并将其放到 Libretranslate 源码根目录下，然后在我要构建的 Dockerfile 末尾修改为：

# 将主机当前目录的index.json放到容器的/root/.local/cache/argos-translate/下
RUN mkdir -p /root/.local/cache/argos-translate/
RUN mv ./index.json /root/.local/cache/argos-translate/

EXPOSE 5000
# 原本的--host * 不知道为什么我会报错，这里改成 0.0.0.0就没有报错了
# 这里我只需要中英互译就可以了
ENTRYPOINT ["libretranslate", "--host", "0.0.0.0", "--load-only"，"zh,en"]

这是参考的解决方案的链接，这里提供我保存的index.json文件

3. 启用 cuda 加速后进行翻译出现内部错误

建议先进入 docker 内部使用 python执行 torch.cuda.is_available() 查看 CUDA 是否成功支持。
这里我的问题是我的 nvidia 驱动版本是 debian12 默认下载的535, CUDA 版本最高支持到 12.2, 而且我本地的 CUDA 环境是 11.8。Libretranslate默认构建镜像的 CUDA 版本是 12.4, 版本过高导致 torch 调用硬件失败。解决的方法是将 Libretranslate 构建时采用的基础镜像从 FROM nvidia/cuda:12.4.1-devel-ubuntu20.04 更换为 FROM nvidia/cuda:12.2.0-devel-ubuntu20.04。注意一定要是 12 版本以上的，我之前采用与本地相同的 11.8 启动仍然失败了，torch.cuda.is_available() 的返回值是 True，但是运行时会出现动态链接库找不到的问题，当前这个版本好像默认要求 CUDA 版本大于 12。

参考文献

LibreTranslate的github
翻译模型下载失败参考解决方案

一、Libretanslate基本介绍#

二. docker 与 nvidia docker 支持的前置条件#

三、docker版本的libretranslate的本地部署#

1. cpu版本libretranslate的部署#

2. GPU版本libretranslate的部署#

四、可能遇到的问题#

1. 构建镜像时apt和pip下载太慢#

2. (URLError(ConnectionRefusedError(111, ‘Connection refused’)),)在 docker 日志中大量出现，无法下载翻译模型#

3. 启用 cuda 加速后进行翻译出现内部错误#

参考文献#