[fix] libc10_cuda.so: undefined symbol: cudaMemPoolSetAttribute, version libcudart.so.11.0

这里写自定义目录标题

问题描述

conda clone一个环境后, import torch的时候报错:
torch/lib/libc10_cuda.so: undefined symbol: cudaMemPoolSetAttribute, version libcudart.so.11.0

解决办法

首先找到libcudart.so.11.0的位置, 发现在ENV/lib/libcudart.so.11.0里,
在这里插入图片描述

和原始环境的so文件不一致, so连接在clone的时候出错了
在这里插入图片描述

修改回去就可以,

unlink libcudart.so.11.0
ln -s libcudart.so.11.8.89 libcudart.so.11.0

同理对libcusparse.so.11也修改下连接

unlink libcusparse.so.11
ln -s libcusparse.so.11.7.5.86 libcusparse.so.11

之后就能import torch了