CUDA学习（三）-低调大师

CUDA学习（三）

2018-02-04 720

内存层次结构：
CUDA线程可能会在执行期间从多个内存空间访问数据，如图所示。每个线程都有专用本地内存(local menory)。每个线程块都具有共享内存(shared memory)，该块的所有线程都可见，并且具有与该块相同的生命周期。所有线程都可以访问相同的全局内存(global memory)。

所有线程还有两个额外的只读内存空间：常量和纹理内存空间。全局，常量和纹理内存空间针对不同的内存使用进行了优化。对于某些特定的数据格式，纹理内存也提供了不同的寻址模式以及数据过滤功能。
全局，常量和纹理内存空间在同一应用程序的内核启动时保持不变
异构编程(Heterogeneous Programming):
这里设GPU设备为Device，CPU设备为Host，如图所示，kernel函数在Device上运行，其余C语言程序依然上CPU上运行。

CUDA编程模型还假定主机和设备都在DRAM中分别维护它们自己的独立存储空间，分别称为主机存储器和设备存储器。因此，程序通过调用CUDA运行库来管理内核可见的全局，常量和纹理内存空间（在编程接口中描述）。这包括设备内存分配和重新分配以及主机和设备内存之间的数据传输。
统一内存提供托管内存来桥接主机和设备内存空间。托管内存可以从系统中的所有CPU和GPU作为具有共同地址空间的单一连贯内存映像访问。这种功能使得设备内存的超额申请成为可能，并且通过消除在主机和设备上显式镜像数据的需要，可以大大简化移植应用程序的任务。
计算能力：
设备的计算能力由版本号表示，有时也称为“SM版本”。该版本号标识GPU硬件支持的特征，并由运行时的应用程序使用以确定当前GPU上哪些硬件特征和指令可用。
计算能力包括主版本号X和次版本号Y，用X.Y表示。
主版本号相同的设备具有相同的核心架构。基于Volta体系结构的设备主要版本为7，基于Pascal体系结构的设备为6，基于Maxwell体系结构的设备为5，基于开普勒体系结构的设备为3，基于费米体系结构的设备为2，和基于特斯拉架构的设备为1.
次要版本号对应于核心架构的渐进式改进，可能包括新功能。
支持CUDA的GPU列出了所有支持CUDA的设备及其计算能力。计算能力给出了每种计算能力的技术规格。
特斯拉和费米架构分别在CUDA7.0和CUDA9.0不被支持。

微信关注我们

原文链接：https://yq.aliyun.com/articles/434015

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

CCIX、OpenCAPI和Gen-Z：三种新的内存互连技术

在《SNIA持久化内存峰会：虚拟机、数据库、SDS进展曝光》一文中，我给大家分享了SNIA Persistent Memory Summit 2018的会议资料，而后来官网又补充上3份文档。其中有一个我觉得不错，标题为《New Interconnects》。下载地址：https://www.snia.org/sites/default/files/PM-Summit/2018/presentations/13_PMSummit_18_interconnects_UPDATED.pdf 扩展阅读《Gen-Z互连(上)：Intel缺席的内存中心架构》《Gen-Z互连(下)：第一步25-100GB/s、PCI-SIG的反应》

2018-02-05

781

海能达DS-6210 集群系统采用半分布式的系统架构，各单元模块化设计理念，支持多级故障弱化模式，有效提高产品的可靠性和效率。系统关键设备部件采用冗余备份机制，如基站控制器采用冗余热备份、集群主控信道备份，网元之间的链路备份等。支持SNMP远程网管和操作维护功能，便于设备维护和远端管理。网管系统采用C/S结构，保证系统具有良好的组网能力和扩充性。网管系统可以集中管理各系统网元，界面友好，功能全面，支持远程升级和平滑扩容。网络灵活性高，对机房要求低。基于全IP架构，设备可以灵活布置在网络的各个位置，方便增删网络节点。能够支持多种传输承载方式（IP、E1）和组网拓扑类型（树型、星型等）。小编通过DS-6211 系统硬件、MSO 硬件、基站硬件、天馈射频系统、网络设备等详细的介绍，便于大家了解DS-6211中控和基站硬件系统、掌握网络设备、掌握天馈射频硬件等设备的功能： DMR数字对讲机的技术优势： DS-6211 系统概述 DS-6211 系统硬件概述 MSO 硬件介绍基站硬件天馈系统：网络设备：

2018-02-06

717

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

CUDA学习（三）

CCIX、OpenCAPI和Gen-Z：三种新的内存互连技术

【对讲机的那点事】图说海能达DS-6210 集群系统

相关文章

发表评论

资源下载

腾讯云软件源

Spring

Rocky Linux

Sublime Text

欢迎您来访！