Ascend C 算子开发遇到的问题及解决方法

摘要:在学习Ascend C算子开发进阶课程的时候,进行Ascend C自定义算子工程、算子调用等实验,在开发环境中遇到了一些问题,在这里记录一下。

首先如果在启智社区CANN版本为6.3 ,要进行Ascend C算子开发,需要更新CANN版本。
在CANN社区根据你的架构,比如我的为CPU架构位aarch64,所以下载Ascend-cann-toolkit_7.0.RC1.alpha003_linux-aarch64.run 到本文目录下,下载好之后,运行以下命令赋权并安装:

chmod +x Ascend-cann-toolkit_7.0.RC1.alpha003_linux-aarch64.run
./Ascend-cann-toolkit_7.0.RC1.alpha003_linux-aarch64.run --full

安装成功会显示如下:

image.png

说明CANN安装到了/home/ma-user/Ascend目录下。大家根据自己的实际路径写就好了

安装好之后配置环境变量:

source /home/ma-user/Ascend/ascend-toolkit/set_env.sh
export PATH=/home/ma-user/work/cmake-3.26.4-linux-aarch64/bin:$PATH
export ASCEND_HOME_DIR=/home/ma-user/Ascend/ascend-toolkit/latest

下面就可以运行代码了


一、fatel error:register/tilingdata_base.h:No such file or directory

报错找不到头文件:

image.png

这个错误是在进行自定义算子工程实验时的编译算子工程出现的,也就是在samples/operator/AddCustomSample/FrameworkLaunch/AddCustom 目录下执行 ./build.sh出现。

起初我的解决方法是设置环境变量,但是还是会报错,会报其他头文件的错误,所以治标不治本。后面看了一个大佬的经验帖子,发现是我的CANN软件包安装后的实际路径写错了,在samples/operator/AddCustomSample/FrameworkLaunch/AddCustom/CMakePresets.json 这个文件中,应该把ASCEND_CANN_PACKAGE_PATH为CANN软件包安装后的实际路径,我的CANN安装在/usr/local/Ascend 下,所以我的路径地址应该为:/usr/local/Ascend/ascend-toolkit/latest,具体可以参考如下:

image.png

这样就不会再报头文件错误了。

二、build ops lib error: /usr/bin/ld: cannot find -lexe_graph

/usr/bin/ld: cannot find -lregister
/usr/bin/ld: cannot find -ltiling_api
collect2: error: ld returned 1 exit status

image.png

这个错误应该和前面的一样,也是因为CANN路径没有设置正确。解决方案看上面

三、CMake Error at CMakeLists.txt:1 (cmake_minimum_required):CMake 3.16.0 or higher is required. You are running version 3.12.1

image.png

如果是在启智社区使用的mindspore2.0.0_cann6.3_notebook镜像,估计就会报这个错误,因为cmake版本太低了,所以需要更新cmake。

wget https://github.com/Kitware/CMake/releases/download/v3.26.4/cmake-3.26.4-linux-aarch64.tar.gz
tar -xf cmake-3.26.4-linux-aarch64.tar.gz
export PATH=/home/ma-user/work/cmake-3.26.4-linux-aarch64/bin:$PATH

/home/ma-user/work/cmake-3.26.4-linux-aarch64/bin 这个目录是你下载的cmake压缩包解压之后的目录,然后就执行以上两步就可以更新完cmake了,我之前更新的时候也踩了很多坑,我是把安装报下载下来,然后还是用bootstrap命令,make,make install等。但是还是没有这两行代码快且有效。
image.png

四、ERROR: acl executable run failed! please check your project!

image.png

报错原因应该是因为我在启智社区调式的镜像环境有问题,需要源码安装python3.7.5

下载python3.7.5并解压、安装

wget https://canncamp202302.obs.cn-north-4.myhuaweicloud.com/Python-3.7.5.tgz
tar -zxvf Python-3.7.5.tgz
cd Python-3.7.5
./configure --prefix=/usr/local/python3.7.5 --enable-loadable-sqlite-extensions --enable-shared
make
make install

设置环境变量

export PATH=/usr/local/python3.7.5/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/python3.7.5/lib:$LD_LIBRARY_PATH

安装依赖

pip3 install -i https://repo.huaweicloud.com/repository/pypi/simple/  --upgrade pip
pip3 install -i https://repo.huaweicloud.com/repository/pypi/simple/ attrs numpy decorator sympy cffi pyyaml pathlib2 psutil protobuf==3.19.0 scipy requests absl-py wheel typing_extensions

这里安装Python的命令会有点多,跟着步骤一步步执行就好了。

安装好之后,就可以正常进行Ascend C自定义算子工程和算子调用了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/207524.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

fastadmin列表头部加按钮,点击弹出窗口提交数据保存

index.html <a href="{:url(pattern/piliangadd)}" class="btn btn-success btn-piliangadd btn-dialog {:$auth->check(pattern/piliangadd)?:hide}" title="批量添加" ><i class="fa fa-plus"></i> 批量添加…

ThreadPoolExecutor线程池内部处理浅析

我们知道如果程序中并发的线程数量很多&#xff0c;并且每个线程都是执行一个时间很短的任务就结束时&#xff0c;会因为频繁创建线程而大大降低系统的效率&#xff0c;因此出现了线程池的使用方式&#xff0c;它可以提前创建好线程来执行任务。本文主要通过java的ThreadPoolEx…

Python自动化办公:PDF文件的分割与合并

我们平时办公中&#xff0c;可能需要对pdf进行合并或者分割&#xff0c;但奈何没有可以白嫖的工具&#xff0c;此时python就是一个万能工具库。 其中PyPDF2是一个用于处理PDF文件的Python库&#xff0c;它提供了分割和合并PDF文件的功能。 在本篇博客中&#xff0c;我们将详细…

Sass 语法详细介绍

文章目录 前言SASS缩进语法SASS的语法差异多线选择器注释import Mixin指令已弃用的语法后言 前言 hello world欢迎来到前端的新世界 &#x1f61c;当前文章系列专栏&#xff1a;Sass和Less &#x1f431;‍&#x1f453;博主在前端领域还有很多知识和技术需要掌握&#xff0c;正…

VR全景对旅游业有什么帮助,如何助力旅游业实现新的旅游形式

引言&#xff1a; 旅游业是一个充满机遇的行业&#xff0c;而虚拟现实&#xff08;VR&#xff09;全景技术正逐渐改变着旅游业的面貌&#xff0c;通过提供身临其境的体验&#xff0c;VR全景成为了旅游业的新宠&#xff0c;将旅游带入了一个全新的数字化时代。 一、打破地域限制…

C陷阱与缺陷——第6章 预处理器

在严格意义上的编译过程开始之前&#xff0c;C语言预处理器首先对程序代码做了必要的转换处理。预处理器的主要作用是&#xff1a; 我们有时需要将某个特定数量在程序中出现的所有实例统统加以修改大多数C语言实现在函数调用时都会带来重大的系统开销 1. 不能忽视宏定义中的空…

Elasticsearch:为现代搜索工作流程和生成式人工智能应用程序铺平道路

作者&#xff1a;Matt Riley Elastic 的创新投资支持开放的生态系统和更简单的开发者体验。 在本博客中&#xff0c;我们希望分享 Elastic 为简化你构建 AI 应用程序的体验而进行的投资。 我们知道&#xff0c;开发人员必须在当今快速发展的人工智能环境中保持灵活性。 然而&a…

xilinx系列FPGA基于VIVADO的pin delay列表生成说明

目录 1 概述2 示例平台3 操作说明4 注意事项 xilinx系列FPGA基于VIVADO的pin delay列表生成说明 1 概述 本文用于讲诉xilinx系列FPGA基于VIVADO的pin delay列表生成说明&#xff0c;以及一些注意事项&#xff0c;为FPGA设计人员探明道路。 Pin delay 即FPGA内部die到pin的延时…

爱芯元智AX650N部署yolov8s 自定义模型

爱芯元智AX650N部署yolov8s 自定义模型 本博客将向你展示零基础一步步的部署好自己的yolov8s模型&#xff08;博主展示的是自己训练的手写数字识别模型&#xff09;&#xff0c;本博客教你从训练模型到转化成利于Pulsar2 工具量化部署到开发板上 训练自己的YOLOv8s模型 准备自…

机器视觉新功能上线:同步训练多个模型,智造的脚步又加快了!

“AI视觉”的应用&#xff0c;为当下诸多企业的生产智能化打开了新的想象空间。其中&#xff0c;深度学习作为AI视觉的核心技术&#xff0c;在实际应用中往往需要经历一个耗时较长的阶段——深度学习神经网络模型训练。其目的是通过使用已标注的数据集来训练模型&#xff0c;使…

Inference with C# BERT NLP Deep Learning and ONNX Runtime

目录 效果 测试一 测试二 测试三 模型信息 项目 代码 下载 Inference with C# BERT NLP Deep Learning and ONNX Runtime 效果 测试一 Context &#xff1a;Bob is walking through the woods collecting blueberries and strawberries to make a pie. Question …

传统算法:使用 Pygame 实现插入排序

使用 Pygame 模块实现了插入排序的动画演示。首先,它生成一个包含随机整数的数组,并通过 Pygame 在屏幕上绘制这个数组的条形图。接着,通过插入排序算法对数组进行排序,动画效果可视化每一步的排序过程。在排序的过程中,程序将当前元素插入到已排序的部分,通过适度的延迟…

每日一练2023.12.1——输出GPLT【PTA】

题目链接&#xff1a;L1-023 输出GPLT 题目要求&#xff1a; 给定一个长度不超过10000的、仅由英文字母构成的字符串。请将字符重新调整顺序&#xff0c;按GPLTGPLT....这样的顺序输出&#xff0c;并忽略其它字符。当然&#xff0c;四种字符&#xff08;不区分大小写&#x…

《opencv实用探索·七》一文看懂图像卷积运算

1、图像卷积使用场景 图像卷积是图像处理中的一种常用的算法&#xff0c;它是一种基本的滤波技术&#xff0c;通过卷积核&#xff08;也称为滤波器&#xff09;对图像进行操作&#xff0c;使用场景如下&#xff1a; 模糊&#xff08;Blur&#xff09;&#xff1a; 使用加权平…

C++入门篇(零) C++入门篇概述

目录 一、C概述 1. 什么是C 2. C的发展史 3. C的工作领域 4. C关键字(C98) 二、C入门篇导论 一、C概述 1. 什么是C C是基于C语言而产生的计算机程序设计语言&#xff0c;支持多重编程模式&#xff0c;包括过程化程序设计、数据抽象、面向对象程序设计、泛型程序设计和设计模式…

Maven无法拉取依赖/构建失败操作步骤(基本都能解决)

首先检查配置文件&#xff0c;确认配置文件没有问题(也可以直接用同事的配置文件(记得修改文件里的本地仓库地址)) 1.file->Invalidate Caches清除缓存重启(简单粗暴&#xff0c;但最有效) 2.刷新maven以及mvn clean&#xff0c;多刷几次&#xff0c;看看还有没有报红的依赖…

Python 中 AttributeError: Int object Has No Attribute 错误

int 数据类型是最基本和最原始的数据类型之一&#xff0c;它不仅在 Python 中&#xff0c;而且在其他几种编程语言中都用于存储和表示整数。 只要没有小数点&#xff0c;int 数据类型就可以存储任何正整数或负整数。 本篇文章重点介绍并提供了一种解决方案&#xff0c;以应对我…

基于Netty的网络调用实现

作为一个分布式消息队列&#xff0c;通信的质量至关重要。基于TCP协议和Socket实现一个高效、稳定的通信程序并不容易&#xff0c;有很多大大小小的“坑”等待着经验不足的开发者。RocketMQ选择不重复发明轮子&#xff0c;基于Netty库来实现底层的通信功能。 1 Netty介绍 Net…

TCP报文解析

1.端口号 标记同一台计算机上的不同进程 源端口&#xff1a;占2个字节&#xff0c;源端口和IP的作用是标记报文的返回地址。 目的端口&#xff1a;占2个字节&#xff0c;指明接收方计算机上的应用程序接口。 TCP报头中的源端口号和目的端口号同IP报头中的源IP和目的IP唯一确定一…

马蹄集第34周

1.战神的对称谜题 不知道为什么超时&#xff01; def main():s input()result 0for i in range(len(s)):l i - 1r i 1while l > 0 and r < len(s) and s[l] s[r]:result max(result, r - l 1)l - 1r 1l ir i 1while l > 0 and r < len(s) and s[l] s…