本地自己手写一个CUDA算子,一般至少需要两个文件和一个nvcc的环境,最好是在安装完成MindSpore的GPU版本之后,再尝试CUDA算子的引入。具体MindSpore的安装方法,可以参考
MindSpore官网,这里不做赘述。我这里使用的环境是10.1版本的nvcc: