平台描述
人工智能人才紧缺,供需比仅为1:10,但面向众多学生的人工智能实验却难以开展。对此,AIRack人工智能实验平台提供了基于Docker容器集群技术开发的多人在线实验环境。平台基于深度学习计算集群,支持主流深度学习框架,方便快速部署训练环境,同时支持多人在线实验,并配套实验手册,同步解决人工智能实验配置难度大、实验入门难、缺乏实验数据等难题,可用于深度学习模型训练等教学、实践应用。


平台特性
在线实验应用
 
一键部署深度学习计算环境,快速启动训练任务
 
支持多个人工智能实验在线训练
 
动态分配GPU资源,实现资源的合理共享
 
实时监控与掌握CPU/GPU资源使用情况及运行状态
 
提供人工智能配套资源下载服务
 

实验高效可靠
 
基于Docker容器技术,可瞬间创建随时运行的实验环境
 
使用几台机器即可虚拟出大量实验集群,并配套GPU,满足实验室规模使用需求
 
  采用Kubernetes容器编排架构管理集群,用户实验集群隔离、互不干扰
 
 
 
软硬件高规格
 
硬件采用GPU+CPU混合架构,实现对数据的高性能并行处理
 
CPU选用英特尔E5-2600系列至强处理器,搭配英伟达多系列GPU
 
最大可提供每秒176万亿次的单精度计算能力
 
预装CentOS和Ubuntu操作系统,集成Caffe、TensorFlow、PyTorch、Keras等主流深度学习框架
 

一站式服务
 
人工智能实验平台从实验环境、教材PPT、实验手册、实验数据、技术支持等多方面为人工智能课程提供一站式服务,大幅度降低人工智能课程学习门槛,满足课程设计、课程上机实验、实习实训、科研训练等多方面需求。

1.前沿教材PPT
 
平台提供由清华大学博士、中国信息协会大数据分会副会长刘鹏教授主编的《深度学习》配套PPT。内容涉及人脑神经系统与深度学习、深度学习主流模型以及深度学习在图像、语音、文本中的应用等丰富内容。
 
 

 
 
此外,还有10本正在筹备的书籍,也可为高校开展人工智能教学实验提供相关帮助。
 
 

 
2.专业的实验
 
配套包括116个人工智能相关的实验,主要分别为四个模块,每个模块具体内容如下:
 
①基础实验:Linux基础实验,python基础实验,基本工具使用
 
  ②机器学习实验:常用机器学习Python库,机器学习算法实验 
 
 
③深度学习基础实验:图像处理,Caffe基础使用,TensorFlow基础使用,Keras基础使用,PyTorch基础使用。
④深度学习算法实验:基础实验,进阶实验
 

 
3.丰富的数据
 
提供实验代码以及MNIST、CIFAR-10、ImageNet、CASIA WebFace、Pascal VOC、Sift Flow等训练数据集
 
实验数据做打包处理,为用户提供便捷、可靠的人工智能和深度学习应用
 

平台框架
AIRack人工智能实验平台整体设计基于Docker容器集群技术,可一键创建随时运行的实验环境:
1.Kubernetes是Google开源的容器集群管理系统,提供应用部署、维护、扩展机制等功能,利用Kubernetes能方便地管理跨机器运行容器化的应用。
2.实验时,系统预先针对人工智能实验内容构建好一系列基于CentOS7或Ubuntu的特定容器镜像,通过Docker在集群主机内构建容器,为每个使用平台的用户开辟隔离的实验环境。

平台配置
管理服务器配置参数:
| 产品型号 | 详细配置 | 单位 | 数量 | 
| CPU | Xeon E5-2620 V4 | 颗 | 2 | 
| 内存 | 32GB 内存 | 根 | 3 | 
| SSD | 480GB SSD固态硬盘 | 块 | 2 | 
| 硬盘 | 240G固态硬盘 | 块 | 1 | 
| 企业硬盘 | 4TB 7.2K RPM 企业硬盘 | 块 | 1 | 
处理服务器配置参数:
| 产品型号 | 详细配置 | 单位 | 数量 | 
| CPU | Xeon E5-2650 V4 | 颗 | 2 | 
| 内存 | 32GB 内存 | 根 | 8 | 
| SSD | 480GB SSD固态硬盘 | 块 | 2 | 
| 硬盘 | 240G固态硬盘 | 块 | 1 | 
| GPU | GeForce RTX 2080 | 块 | 8 | 
支持同时上机人数与服务器数量:
| 上机人数 | 服务器数量 | 
| 8人 | 1(管理服务器)+1(处理服务器) | 
| 24人 | 1(管理服务器)+3(处理服务器) | 
| 48人 | 1(管理服务器)+6(处理服务器) | 
| 72人 | 1(管理服务器)+9(处理服务器) | 
 
			
