Skip to content

Latest commit

 

History

History
53 lines (42 loc) · 1.97 KB

troubleshooting.md

File metadata and controls

53 lines (42 loc) · 1.97 KB

Fluid问题诊断

您可能会在部署、开发Fluid的过程中遇到各种问题,而查看日志可以协助我们定位问题原因。但在分布式环境下,Fluid底层的分布式缓存引擎(Runtime)运行在不同主机的容器上,手动收集这些容器的日志效率低下。 因此,Fluid提供了shell脚本,帮助使用者快速收集Fluid系统和Runtime容器的日志信息。

如何使用脚本收集日志

  1. 下载诊断脚本 针对不同的 Runtime,Fluid 提供了不同的诊断脚本,但使用方式是一致的。您可以下载您使用的 Runtime 诊断脚本:

    # Alluxio:
    wget https://raw.githubusercontent.com/fluid-cloudnative/fluid/master/tools/diagnose-fluid-alluxio.sh
    # JuiceFS:
    wget https://raw.githubusercontent.com/fluid-cloudnative/fluid/master/tools/diagnose-fluid-juicefs.sh
    # GooseFS:
    wget https://raw.githubusercontent.com/fluid-cloudnative/fluid/master/tools/diagnose-fluid-goosefs.sh
    # JindoFS:
    wget https://raw.githubusercontent.com/fluid-cloudnative/fluid/master/tools/diagnose-fluid-jindo.sh
  2. 确保shell脚本有运行权限,以 diagnose-fluid-alluxio.sh 为例:

    $ chmod a+x diagnose-fluid-alluxio.sh
  3. 查看帮助信息

    $ ./diagnose-fluid-alluxio.sh
    Usage:
        ./diagnose-fluid-alluxio.sh COMMAND [OPTIONS]
    COMMAND:
        help
            Display this help message.
        collect
            Collect pods logs of controller and runtime.
    OPTIONS:
        -r, --name name
            Set the name of runtime.
        -n, --namespace name
            Set the namespace of runtime.
  4. 收集日志

    运行diagnose-fluid-alluxio.sh--name指定了Runtime的name,--namespace指定了Runtime的namespace

    $ ./diagnose-fluid-alluxio.sh collect --name cifar10 --namespace default

    shell脚本会将收集的日志信息打包到执行路径下的一个压缩包里。