在深度学习模型的部署(即模型推理)阶段,为了在算力和能耗均受限的边缘或终端设备实现低延迟和高效能的模型推理,现有的优化技术主要可以分为模型压缩、模型分割、模型提前退出、模型选择、边缘缓存、输入过滤、面向应用优化等7种。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 面向边缘智能的模型推理优化技术简介
在深度学习模型的部署(即模型推理)阶段,为了在算力和能耗均受限的边缘或终端设备实现低延迟和高效能的模型推理,现有的优化技术主要可以分为模型压缩、模型分割、模型提前退出、模型选择、边缘缓存、输入过滤、面向应用优化等7种。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 面向边缘智能的模型推理优化技术简介