目录
协同推理
模型切分算法
任务调度算法
优化目标
协同推理
协同推理算法涉及模型切分算法和任务调度算法,它们的主要优化目标包括性能、动态环境中推理延迟的鲁棒性和能耗等。以下是对这两类算法及其优化目标的详细阐述:
模型切分算法
模型切分算法旨在将复杂的深度学习模型划分为多个部分,以便在多个设备上并行处理,从而加速推理过程并减少计算成本。这些算法通常会考虑模型的结构、设备的计算能力、网络带宽和延迟等因素。
- DeepThings:将神经网络的卷积层切分为互不重叠的部分来实现并行化的CNN协同推理。然而,它的模型切分策略主要适合链式CNN,而不适合GoogleNet和ResNet等块状