高效利用GPU怎能不会CUDA?英伟达官方的基础课程来了
过去十年深度神经网络已成为最重要的机器学习模型之一,创造了从自然语言处理到计算机视觉、计算神经科学等许多领域的 SOTA 实现。
深度神经网络的特征注定其产生的计算量是巨大的,但也会产生大量高度并行化的工作,特别适合多核和众核处理器。深度学习领域的新研究思路往往是结合原生框架 operator 来实现的,一般编写专门的 GPU 内核可以解决过程中的性能损失问题,但也确实具有更高的挑战性。可以说,深度神经网络的计算潜力与 GPU 编程困难之间存在着一道鸿沟。
2007 年,英伟达发布了 CUDA 的初始版本,CUDA 平台是一个软件层,使用者可以直接访问 GPU 的虚拟指令集和并行计算单元,用于执行计算内核。近年来,主流深度学习框架几乎都是基于 CUDA 进行加速,英伟达也一直在完善 CUDA 工具包,但对于一般的开发者来说,CUDA 还是「不那么容易上手」。
为了帮助广大开发者深入了解和快速上手 CUDA编程,英伟达联合机器之心推出「CUDA编程实践」三期线上分享,通过英伟达专家的理论解读和实战经验分享,向读者展示如何使用 CUDA 快速完成图像处理、光线追踪、卷积操作等任务。
「CUDA编程实践」三期分享安排如下:
本次系列分享嘉宾是 NVIDIA 企业级开发者社区经理、高级讲师何琨,他拥有多年的 GPU 和人工智能开发经验。自 2017 年加入 NVIDIA 开发者社区以来,完成过上百场培训,帮助上万个开发者了解人工智能和 GPU 编程开发。在计算机视觉,高性能计算领域完成过多个独立项目。并且,在机器人和无人机领域,有过丰富的研发经验。对于图像识别,目标的检测与跟踪完成过多种解决方案。曾经参与 GPU 版气象模式 GRAPES,是其主要研发者。
9月9日20:00-21:30
CUDA编程基础——利用CUDA加速图像处理
NVIDIA CUDA Toolkit 提供了一个开发环境,用于创建高性能 GPU 加速应用程序。通过CUDA Toolkit可以在 GPU 加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和 HPC 超级计算机上开发、优化和部署应用程序。
CUDA 编程模型已经广泛地应用于在计算机视觉领域,对图像的预处理已经成为很多领域必不可少的一步。本节课程将会以图像处理为实例来介绍如何利用 CUDA 加速应用程序。
第一期课程针对需要进行 HPC 和 AI 开发者,将详细介绍以下内容:
GPU硬件结构CUDA 编程模型
CUDA 线程层次
CUDA 存储单元
利用CUDA进行图像处理
实例:利用CUDA加速Sobel 边缘检测
直播时间:9月9日 20:00-21:30
直播间地址:https://jmq.h5.xeknow.com/s/3d286J(点击阅读原文直达)
报名方式:进入直播间——移动端点击底部「观看直播」、PC端点击「立即学习」——填写报名表单后即可进入直播间观看。
直播交流群:识别下方二维码加入交流群。
如群已超出人数限制,请添加其他小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「CUDA」即可加入。
点击阅读原文,立即报名。阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线