随着VLSI技术的进步,已经有可能通过增加额外的硬件资源来增强通用和专用处理器的性能。为提高传统Von Neumann机的吞吐量,可以增加额外的硬件资源以充分利用指令级并行性的优势。目前已经形成的用于支持指令级并行的技术包括超级流水线、超标量结构、数据流处理器以及超长指令字结构。由于软件开发成本螺旋式上升,大量的努力集中在针对高级编程语言的基于编译器的自动优化领域。
超级流水线技术已被用于一些处理器以提高吞吐能力,例如IntelPentium Pro。超级流水线是通过增加流水级来获得的,这样可以得到非常短的机器周期,因而允许很高的发射速率。尽管指令以很高的速率被连续发射,它们的最终完成仍需要很多周期,即当一个指令被启动时,多个先前的指令可能正在不同的流水级中被执行着。超级流水线的缺点在于增加了等待时间(指令从被发射到被完成所需的时间),同时使得清空流水线的代价变得更高。从硬件角度看,增加流水线寄存器需要大蚩额外的硬件资源。为了使流水线对程序员和(或)编译器透明,处理器必须跟踪分配给指令且仍在流水线上行进的资源。如果发生资源冲突,流水线将延迟,而“气泡”将被引入流水线中。一般由编译器或程序员来排列指令以避免可能发生的流水线延迟。
从商用角度看,尝试在数字信号处理器中支持并行需要借助昂贵的多处理器通信或多个独立编程的ALU。不幸的是,这些解决方案都伴随着高昂的价格,并受到I/O引脚数的限制。最新的高端DSPftP结合了一个RISC处理器和多个独立程序控制的ALU。这些AI'U已针对信号或图像处理运算进行了优化,同时针对不同速度、成本和功耗需求的市场对器件进行了特殊的优化。这里还要强调一点,即为单处理器开发的DSP算法未必能很好地移植到多处理器环境中。