算丰学院在线课程分为:BM16系列开发板、CV18系列开发板、机器视觉、大语言模型、编译器和职业技能认证。开发板课程主要讲解了Milk-v Duo、少林派、华山派和SE5等开发板的部署与使用;机器视觉课程囊括了多媒体编程的理论和实践方法,以及开发板课程中的实战部分;编译器课程针对TPU-MLIR进行了系统和全面的介绍,包括理论知识、环境搭建和编程接口;认证课程提供了运维工程师所需要具备的知识,您可以根据自身情况选择合适的课程开始学习。
深度神经网络模型可以快速训练和测试,然后由行业部署,在现实世界中有效地执行任务。在小型、低功耗的深度学习边缘计算平台上部署这样的系统受到业界的高度青睐。本课程采用实践驱动的方法,引导你直观地学习、实践和掌握深度神经网络的知识和技术。
SOPHON深度学习微服务器SE5是采用SOPHON自主研发的第三代TPU处理器BM1684的高性能、低功耗边缘计算产品。INT8运算能力高达17.6 TOPS,支持32路全高清视频硬件解码和2路编码。本课程将快速引导您了解SE5服务器的强大功能。通过本课程,您可以了解深度学习的基础知识并掌握其基本应用。
课程的特点
1. 一站式服务
在SE5应用程序中遇到的所有常见问题都可以在这里找到。
2. 系统的教学
它包括设置环境、开发应用程序、转换模型和部署产品,以及拥有镜像的实际环境等所有内容。
3. 完整的材料
本课程包括视频教程、文档指南、代码脚本和其他综合材料。
4. 免费的云开发资源
在线免费申请使用SE5-16微服务器云测试空间
TPU-MLIR是一种专用于处理器的TPU编译器。该编译器项目提供了一个完整的工具链,可以将来自不同深度学习框架(PyTorch, ONNX, TFLite和Caffe)的各种预训练神经网络模型转换为高效的模型文件(bmodel/cvimodel),以便在SOPHON TPU上运行。通过量化到不同精度的bmodel/cvimodel,优化了模型在sophon计算TPU上的加速和性能。这使得可以将与对象检测、语义分割和对象跟踪相关的各种模型部署到底层硬件上以实现加速。
本课程主要分为三个部分:
本课程旨在通过实际演示,全面、直观地展示TPU- mlir编译器的使用方法,使学生能够快速理解各种深度学习模型算法的转换和量化,以及它们在SOPHGO计算处理器TPU上的部署测试。目前,TPU-MLIR的使用已应用于由SOPHGO开发的最新一代深度学习处理器BM168X和CV18XX,并辅以处理器的高性能ARM内核和相应的SDK,用于快速部署深度学习算法。
本课程在模型移植和部署方面的优势:
1. 支持多种深度学习框架
目前支持的框架包括PyTorch、ONNX、TFLite和Caffe。来自其他框架的模型需要转换为ONNX模型。有关将其他深度学习架构的网络模型转换为ONNX的指导,请参考ONNX官方网站:https://github.com/onnx/tutorials。
2. 用户友好的操作
通过开发手册和相关部署案例了解TPU-MLIR的原理和操作步骤,可以从头开始进行模型部署。熟悉Linux命令和模型编译量化命令对于动手实践是足够的。
3. 简化量化部署步骤
模型转换需要在SOPHGO提供的docker中执行,主要包括两个步骤:使用model_transform.py将原始模型转换为MLIR文件,使用model_deploy.py将MLIR文件转换为bmodel格式。bmodel是可以在SOPHGO TPU硬件上加速的模型文件格式。
4. 适应多种架构和硬件模式
量化的bmodel模型可以在PCIe和SOC模式下运行在TPU上进行性能测试。
5. 全面的文档
丰富的教学视频,包括详细的理论解释和实际操作,以及充足的指导和标准化的代码脚本,在课程中开放源代码,供所有用户学习。
SOPHON-SDK Development Guide | https://doc.sophgo.com/sdk-docs/v23.05.01/docs_latest_release/docs/SOPHONSDK_doc/en/html/index.html |
TPU-MLIR Quick Start Manual | https://doc.sophgo.com/sdk-docs/v23.05.01/docs_latest_release/docs/tpu-mlir/quick_start/en/html/index.html |
Example model repository | https://github.com/sophon-ai-algo/examples |
TPU-MLIR Official Repository | https://github.com/sophgo/tpu-mlir |
SOPHON-SDK Development Manual | https://doc.sophgo.com/sdk-docs/v23.05.01/docs_latest_release/docs/sophon-sail/docs/en/html/ |
多媒体,通常理解为“multi”和“media”的结合,是指文本、声音、图像、视频等媒体形式的整合。近年来,4K超高清、VR、全息投影、5G直播等新兴多媒体应用和服务层出不穷。
智能多媒体
深度学习是基于多媒体技术,如图像处理和识别、音频处理和语音识别等。本课程基于BM1684深度学习处理器,其峰值性能为17.6 TOPS INT8和2.2 TFTOPS FP32,支持32路高清硬件解码。它展示了处理器的核心能力:计算能力+多媒体处理能力。
智能多媒体关键技术与指标
关键技术包括编解码技术、图像处理技术和媒体通信技术。关键指标包括解码通道的数量、帧速率、分辨率、图像处理接口的丰富程度、延迟和协议支持。
本课程将着重介绍图像处理技术、编解码技术、媒体通信技术三个方面的内容。通过理论与实践相结合,使学生了解智能多媒体的相关理论,快速掌握基本的实践方法。
相关GitHub链接
sophgo_ffmpeg: https://github.com/sophgo/sophon_ffmpeg
sophgo_opencv: https://github.com/sophgo/sophon_opencv