首先，TensorFlow中集成的算子在设计过程中已经针对底层硬件架构进行了充分的优化；同时，针对生成的计算图，TensorFlow提供了一系列的优化操作，提升了计算图的运行效率；并且TensorFlow调度器可以根据网络结构的特点，并行运行没有数据依赖的节点，异步发射满足依赖关系的多个节点而不同步等待每个节点的中间结果。

2021-12-03发表智能计算系统19 分钟读完 (大约2918个字)

《智能计算系统》第六章

第六章深度学习处理器原理

6.1 深度学习处理器概述

6.1.1 深度学习处理器的意义

随着神经网络算法的发展，神经网络从只有输入和输出层的感知机，发展到有一个隐层的多层感知机，再到深度神经网络。在这个过程中，伴随着神经网络的层数、神经元数量、突触数量的不断增长，传统芯片CPU、GPU已经难以满足神经网络不断增长的速度和能效需求。由此诞生了深度学习处理器。

2021-12-03发表智能计算系统11 分钟读完 (大约1614个字)

《智能计算系统》第七章

第七章深度学习处理器架构

为了满足智能终端的实际应用需求，DLP-S在DLP的基础上对控制部件、运算部件和存储部件进行了优化，在降低功耗的同时提升了性能。

7.1 单核深度学习处理器

DLP-S在DLP的基础上进行了优化，主要体现在如下四个方面：

（1）在控制模块中设计了多发射队列，使得没有依赖关系的指令可以并行发射，从而支持指令级并行。

（2）在向量运算单元中添加更多的运算操作组合，提高性能和灵活性。

（3）在矩阵运算单元中采用低位宽的运算器，并且支持稀疏数据，减少运算能耗。

（4）在存储模块中采用TLB和LLC减少了访存的延迟。

2021-12-03发表智能计算系统27 分钟读完 (大约4075个字)

《智能计算系统》第八章

第八章智能编程语言

8.1 为什么需要智能编程语言

传统编程语言和智能计算系统存在三方面的鸿沟：一是语义鸿沟，传统编程语言无法高效地描述高层智能计算语义，导致开发智能应用程序效率低下；二是硬件鸿沟，传统编程语言难以高效地抽象智能计算硬件特性，导致最终生成的代码的执行效率较低；三是平台鸿沟，智能计算硬件平台种类繁多并且在不断增长，传统编程语言难以实现跨平台可移植，针对特定平台优化的程序难以实现在不同平台上的高效执行。

《智能计算系统》第一章

第一章概述

1.1 人工智能

1.1.1 什么是人工智能

《智能计算系统》第二章

第2章神经网络基础

2.1 从机器学习到神经网络

2.1.1 基本概念

《智能计算系统》第三章

第三章深度学习

3.1 卷积神经网络

《智能计算系统》第四章

第四章编程框架的使用

4.1 TensorFlow编程模型及基本用法

《智能计算系统》第五章

第五章编程框架机理

5.1 TensorFlow设计原则

5.1.1 高性能

《智能计算系统》第六章

第六章深度学习处理器原理

6.1 深度学习处理器概述

6.1.1 深度学习处理器的意义

《智能计算系统》第七章

第七章深度学习处理器架构

7.1 单核深度学习处理器

《智能计算系统》第八章

第八章智能编程语言

8.1 为什么需要智能编程语言

链接

分类

最新文章

归档

标签

Your browser is out-of-date!

第一章 概述

1.1 人工智能

1.1.1 什么是人工智能

第2章 神经网络基础

2.1 从机器学习到神经网络

2.1.1 基本概念

第三章 深度学习

3.1 卷积神经网络

第四章 编程框架的使用

4.1 TensorFlow编程模型及基本用法

第五章 编程框架机理

5.1 TensorFlow设计原则

5.1.1 高性能

第六章 深度学习处理器原理

6.1 深度学习处理器概述

6.1.1 深度学习处理器的意义

第七章 深度学习处理器架构

7.1 单核深度学习处理器

第八章 智能编程语言

8.1 为什么需要智能编程语言

链接

分类

最新文章

归档

标签

Your browser is out-of-date!

第一章概述

第2章神经网络基础

第三章深度学习

第四章编程框架的使用

第五章编程框架机理

第六章深度学习处理器原理

第七章深度学习处理器架构

第八章智能编程语言