DeepLearning 深度学习平台全新升级 支持多产品系列 & 新合约计费模式

为了提高用户使用体验和提供更多的优惠,青云QingCloud 深度学习平台全新升级,推出入门版、基础版、企业版三种版本,在离线训练、临时测试、算法验证以及 AI 框架学习等场景中较适于按需付费模式,而在生产环境稳定训练需求和在线训练等场景中使用包月、包年模式成本更低,为用户提供更加全面和灵活的成本管理支持。具体新增功能如下:立即使用→

 

入门版

 

  搭载第二代英特尔®至强®可扩展处理器,通过 DL Boosting 的 VNNI 技术及 Intel 优化的深度学习框架( TensorFlow、Caffe、PyTorch 等),在图像分类、图像目标检测、自然语言处理、推荐系统及强化学习等深度学习的性能大幅提升。

入门版预装英特尔针对 CPU 优化过的 Caffe ( Intel 1.1 ) 、TensorFlow ( 1.12.0 )、Keras ( 2.2.4 )、PyTorch ( 1.1.0 ) 最新深度学习框架。

 

基础版

 

搭载 AMD GPU,在提供云主机灵活性的同时,提供优秀的性能体验和超高的性价比,在深度学习训练、推理等方面都能表现出优秀的计算优势。AMD GPU 对主流深度学习框架的支持给用户提供了更具性价比的选择。

AMD GPU 目前支持的深度学习框架有 TensorFlow , Pytorch , Caffe , 并将支持 MXNet。基础版预装了 TensorFlow 1.14.0、Keras 2.2.4,PyTorch 1.2.0 最新深度学习框架。

 

企业版

 

搭载 NVIDIA GPU,在提供云主机弹性特性的同时,提供极致的性能体验,能够为用户提供超高的计算能力,在深度学习训练、推理等方面都能表现出强大的计算优势。

企业版预装 Caffe ( BVLC 1.0 )、TensorFlow ( 1.12.0 )、Keras ( 2.2.4 ) 、PyTorch ( 1.1.0 )  最新深度学习框架。

 

 

 

 

 

QingMR 支持NeonSAN、支持 BigDL深度学习框架

青云 QingCloud 大数据相关服务将会统一在 QingMR 下。 QingMR 目前已经集成了:分布式文件系统 HDFS、集群资源管理系统 YARN、数据处理框架 Hadoop MapReduceSpark、数据仓库工具 Hive 、极速海量数据 OLAP 分析引擎 Kylin,为更好的满足用户对大数据产品更多的需求,本次对核心组件进行了版本升级,新增对基于 Spark 的分布式深度学习框架 BigDL 的支持,具体更新如下::

QingMR 2.0 – Core立即使用→

  • Hadoop 版本升级到 2.9.2 ;
  • Spark 版本升级到 2.2.3 ;
  • Hive 版本升级到 2.3.5 ;
  • 新增 Hadoop, Spark 和 Hive 对 lzo 压缩的支持;
  • 新增对基于 Spark 的分布式深度学习框架 BigDL 的支持;
  • 新增 NeonSAN 超高性能大容量存储的支持,单节点最高容量可达 50 TB。
  • 新增 Spark 作为 Hive 的默认执行引擎即 Hive on Spark,同时支持用户切换到传统的 MapReduce 引擎。
  • 新增多个 Hive 调优配置参数。
  • 新增 Hive 通过 beeline 执行 HQL 使用指南。
  • 新增 HiveServer2 WEB UI 使用指南。

RabbitMQ on QingCloud 支持 Region 多可用区部署

为帮助用户便捷地构建高可用的业务架构,青云对 AppCenter上 RabbitMQ 进行了升级,用户可以在 Region 内实现跨可用区部署,实现系统架构的多可用区部署,构建多活及灾备业务架构。本次更新包括如下:

RabbitMQ on QingCloud:立即使用→
  • 新增 Region 跨区部署功能,实现同城多活,增强业务容灾能力;
  • 修复 VIP 偶尔丢失的问题;

Kafka On QingCloud 支持节点和磁盘容量自动伸缩 & RabbitMQ 稳定性优化

为更好的满足用户对 Kafka & RabbitMQ 的需求,本次更新如下:

Kafka on QingCloud 立即使用→

  • Kafka 支持自动伸缩框架实现根据规则自动扩容磁盘和新增节点功能;
RabbitMQ on QingCloud 立即使用→
  • 修复 hipe compile 启动时间过长导致健康检查脚本不断重启服务的问题;
  • 修复关闭集群再开启后延迟队列插件失效的问题;

Redis & ZooKeeper & RocketMQ on QingCloud 支持 Region 多可用区部署

为帮助用户便捷地构建高可用的业务架构,青云对 AppCenter上 Redis & ZooKeeper 进行了升级,用户可以在 Region 内实现跨可用区部署,实现系统架构的多可用区部署,构建多活及灾备业务架构。本次更新包括如下:

Redis Cluster on QingCloud:立即使用→

 

  • 版本升级为 Redis Cluster v5.0.3;
  • 新增 Region 跨区部署功能,实现同城多活,增强业务容灾能力;
  • 修改正节点实时状态信息,监控状态更加精准;
  • 修复 Redis 内存使用率显示不准确问题;
  • 修复 FLUSHALL、FLUSHDB 命令的使用导致升级后的 Redis 无法启动的问题;

Redis Standalone on QingCloud:立即使用→

  • 版本升级为 Redis v5.0.3;
  • 新增 Region 跨区部署功能,实现同城多活,增强业务容灾能力;
  • 新增 2 节点部署模式;
  • 新增 2 节点支持主从切换功能;
  • 新增实时查看节点的主从关系功能;

ZooKeeper on QingCloud:立即使用→

  • 新增 Region 跨区部署功能,实现同城多活,增强业务容灾能力;

RocketMQ on QingCloud:立即使用→

  • 新增 Region 跨区部署功能,实现同城多活,增强业务容灾能力;

分布式消息及流数据平台 RocketMQ on QingCloud 上线

RocketMQ on QingCloud 是一个基于 Apache 2.0 协议开源的分布式消息和流数据平台,具有低延时、高吞吐、可审计、水平扩展等优点。立即使用→

 

RocketMQ on QingCloud的主要功能:

 

  • 基于RocketMQ 4.3.1版本;
  • 多种部署方式:单Master、多Master,单Master多Slave、多Master多Slave 等多种部署方式,满足广大用户的不同需求;
  • 支持 Region 跨区部署功能,实现同城多活,增强业务容灾能力;
  • 支持健康检查,宕机自动修复;
  • 支持横向与纵向在线伸缩;
  • 可通过网页控制台对集群进行可视化管理;查询消息

MySQL Plus 新增在线迁移功能并支持 10T 大容量存储

为了能够让用户更方便的将数据迁移到 MySQL Plus 并且满足用户对于大容量的需求,MySQL Plus提供了在线迁移服务,同时新增加了对于企业级分布式SAN——NeonSAN 的支持,此次更新包含新增功能如下:

MySQL PLus立即使用→

  • 新增支持 NeonSAN,支持大容量数据存储,MySQL Plus 目前支持最大存储可达10 TB;
  • 新增在线迁移服务,用户仅需提供 MySQL 数据源相关连接信息即可平滑迁移到MySQL Plus, MySQL Plus 1.4.4 – MySQL-5.7.20-18 以及以上版本可以支持在线迁移服务

AppCenter 2.0 支持应用滚动升级等新功能

青云 AppCenter 是一个使企业应用快速云化标准平台, AppCenter 主要是针对于复杂的、多节点甚至多角色节点部署的企业应用而提供的生命周期管理服务。

为更好的满足用户及应用提供商对AppCenter框架的需求, 此次升级新增加以下功能:

  • 支持 App 滚动升级,应用开发商通过调整 App 的配置文件,修改  upgrading_policy:sequential,重新发布新版本,实现 App 不停服升级功能;
  • 允许包年包月计费的应用纵向扩容,并根据所选择的配置,重新按包年包月模式计费,具体配置如下:扩容后

DeepLearning 深度学习平台发布容器版及 CPU 优化版,新增 GPU 状态监控

自 QingCloud DeepLearning 推出以来,吸引了很多用户。深度学习框架本身都在比较快的更新,例如 TensorFlow 基本每个月都会有版本更新。除了深度学习框架自身的版本及其 CPU/GPU 版的区分外,CUDA 及 cuDNN 也区分不同版本,再加上 Python 的不同版本,使得配置深度学习开发及部署环境异常复杂。

为了解决上述问题并满足用户以后在 Kubernetes 上运行深度学习应用的需求,青云QingCloud 推出 DeepLearning 深度学习平台容器版,并为非容器版提供了更多版本框架的安装包。CPU 在深度学习任务中也能发挥重要作用,联合英特尔发布的 CPU 优化版,为一些深度学习应用的长期部署提供了价廉物美的解决方案。据测试,英特尔优化版的 TensorFlow,在 16 核 Broadwell 平台上,ResNet 50 的推理速度可达 40 imgs/s,能够满足轻量级模型的训练和推理需求。

 GPU 是深度学习的重要资源,之前版本只能监控到 CPU 和内存的状态,用户运行 GPU 任务时,无法方便查看 GPU 的使用状态,新版本中 GPU 状态(核心和显存使用状况)可以在监控界面直接查看。此次更新包含以下版本功能升级:立即使用→

1.2 GPU 容器基础版/容器高级版

  • 宿主机中预装 NVIDIA Driver(387.26), CUDA(9.1), nvidia-docker2, Docker(18.03.1-ce);
  • 宿主机中预置包含 TensorFlow(1.8.0), Keras(2.2.0), PyTorch(0.4.1), Caffe(BVLC 1.0) 框架的 Docker 镜像;
  • 提供适用于青云云平台的5个深度学习框架的镜像仓库:DeepLearning, TensorFlow, Keras, PyTorch, Caffe; 每个仓库包含多个不同 Python 版本,不同 CUDA 及 cuDNN 版本的 docker 镜像;
  • 增加 GPU 监控功能,随时掌握 GPU 使用状况;
  • 内置 GPU 容器版的 Deep Learning 测试Demo;

1.2 CPU 容器版

  • 宿主机中预装 Docker(18.03.1-ce);
  • 宿主机中预置包含 TensorFlow(1.8.0), Keras(2.2.0), PyTorch(0.4.1), Caffe(BVLC 1.0) 框架的 Docker 镜像;
  • 提供适用于青云云平台的5个深度学习框架的镜像仓库:DeepLearning, TensorFlow, Keras, PyTorch, Caffe; 每个仓库包含多个不同 Python 版本,不同 CUDA 及 cuDNN 版本的 docker 镜像;
  • 内置 CPU 容器版的 Deep Learning 测试Demo;

 

AppCenter DeepLearning 深度学习版本升级并增加GPU监控功能

自青云推出Deep Learning以来,吸引了很多用户,之前版本只能监控到CPU和内存,为了满足用户对于GPU状态监控的需求,同时能让用户使用最新的功能,此次更新包含以下版本功能升级:立即使用→

1.2 GPU 基础版/高级版

  • 预装 CUDA 8.0/9.1 和 cuDNN 7.1.3;
  • 搭载了 Caffe(BVLC),TensorFlow(1.6.0/1.8.0),Keras(2.2.0),PyTorch(0.3.1/0.4.0) 等深度学习框架;
  • 提供TensorFlow多版本wheel安装包;
  • 增加GPU监控功能,随时掌握GPU使用状况;

1.2 CPU版

  • 搭载了 Caffe(BVLC Intel® Distribution),TensorFlow(1.8.0),Keras(2.2.0),PyTorch(0.3.1) 等深度学习框架;
  • 提供TensorFlow多版本wheel安装包;