[fix] libc10_cuda.so: undefined symbol: cudaMemPoolSetAttribute, version libcudart.so.11.0
问题描述
conda clone一个环境后, import torch的时候报错:
torch/lib/libc10_cuda.so: undefined symbol: cudaMemPoolSetAttribute, version libcudart.so.11.0
解决办法
首先找到libcudart.so.11.0的位置, 发现在ENV/lib/libcudart.so.11.0里,
和原始环境的so文件不一致, so连接在clone的时候出错了
修改回去就可以,
unlink libcudart.so.11.0
ln -s libcudart.so.11.8.89 libcudart.so.11.0
同理对libcusparse.so.11也修改下连接
unlink libcusparse.so.11
ln -s libcusparse.so.11.7.5.86 libcusparse.so.11
之后就能import torch了