微信扫码
添加专属顾问
我要投稿
探索RK3576开发板的AI对话功能,体验嵌入式AI的魅力! 核心内容: 1. RK3576开发板升级过程及DDR配置优化 2. Deepseek AI对话模型部署与量化问题处理 3. 基于NPU的模型转换与运行效率提升
前些时间299元入手买了一个鲁班猫3开发板,2+0配置的3576开发板。看到最近deepseek比较火,我查了一下根据以下公式计算,跑1.5B的大模型至少需要0.9GB的DDR空间。看到这里,大佬们应该知道我要干啥了,但是那是后续的事,今天打算先把前奏搞定,那就是升级这只猫的配置。
为了把嵌入式工程师能自己动手的绝不购买的原则,我选择从别的板子上拆了片4GB的LPDDR4X。我查看了一下鲁班猫3的原理图,它板载的DDR是国产兼容LPDDR4和LPDDR4X的颗粒,查看原理图和PCB位号发现默认的VDDQ1是0.6V,默认LPDDR4X模式。
颗粒的数据手册中的电压描述。
猫的原理图中DDR部分电路。
电源部分控制上电的电路细节如图,这里做了一个兼容设计,贴Q9不贴R110就是LPDDR4,贴R110不贴Q9就是LPDDR4X。
拿出钢网刮锡植球,183度低温锡膏,350度中风,吹啊吹我的骄傲放纵....
这个板子DDR布局离排针太近啦,拆焊时候注意别排针搞化啦,原出厂是高温锡,400度3档,啊吹~啊,吹~啊,镊子一碰哎嘿,有动静了夹起,完美。烙铁350度,放点助焊剂,哎嘿,拖的平平的。
植好球的芯片放上,我们是低温锡,350度够了,我是风儿,你是沙,飘飘洒洒,就焊上啦。开机完美,鲁班猫3顺利从哈基米进化成Tom了,从2+0进化到4+128的配置了。
硬件搞定,下一个目标,跑起来基于npu的deepseek。此处参考鲁班猫rkllm教程。
Git clone 一下RK官方的airockchip仓库,再安装一下conda,按照教程先配置一下PC的工具环境,鉴于只有4GB内存,我考虑先来个deepseek 1.5B吧。下载一下模型,用官方脚本量化。看看这些有趣的量化问题和量化时我PC的资源占用。通过这些问题微调模型。
然后修改NPU的模型参数,开始模型转换,转换成rkllm文件,直接scp发到板子上。
板端用make一下demo的源码,然后运行一下demo,加载上rkllm的模型。跑起来了,效率蛮不错的,刷刷刷的,有了NPU的加持,CPU也被解放出来啦,可以做更多的事情了。简单写个Rust生成斐波那契数列,各种问题都能考虑到,真的神奇。在这样小一个芯片上,以如此的速度跑起来这样神奇的功能,仿佛机器真的有了生命。
RK3576是目前体验嵌入式AI大模型性价比最优之选,成功部署之后,来个对话,太好玩了,甚至比和女朋友约会还有趣。大家如果感兴趣,可以一起来试试。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-27
企业当前适合引入大模型驱动的智能运维吗?
2025-05-26
AI 硬件产品怎么做?——儿童智能硬件
2025-05-24
微软CEO:不卷大模型,微软要造AI时代的通用工具箱
2025-05-24
我们是否应该用 Lite-GPU 构建 AI 集群?
2025-05-24
Kubernetes为Mastercard的AI工作台提供安全创新能力
2025-05-22
Genspark:AI Agent 赛道的差异化突围者 | AI 智能体
2025-05-22
微软发布多智能体 Web 操作系统!让 AI 成为真正“可控、协同、透明”的网页执行助手!
2025-05-21
Spring AI Alibaba 发布企业级 MCP 分布式部署方案
2024-03-30
2024-05-09
2024-07-23
2024-07-07
2025-02-12
2024-07-01
2024-06-24
2024-10-20
2024-06-23
2024-12-29
2025-05-27
2025-05-24
2025-05-17
2025-05-14
2025-05-12
2025-05-09
2025-04-30
2025-04-26