从 Stack Overflow 的报告可以看出,基于云的开发平台,已经成为了各厂商的必争之地。虽然本地化开发目前还很普遍,但是云开发也有一些显著的好处。比如说在传统的软件开发方法中,开发者一般是在自己的电脑上进行开发和测试,然后在物理机或云上运行,但一些 CPU 和内存密集型的任务,在某些情况下编译或测试可能非常耗时且占用大量资源。然而大多数工程师的电脑有 CPU 和内存的限制,编译会浪费大量时间。开发环境上云之后,云服务就足以解决存储、计算资源上的弹性需求,云上按需计费也能节省边际成本。
另一方面,云服务厂商在机器学习的工具库上,提供了非常好的深度和广度,来满足用户的不同需求。机器学习本身是一个“Right tools for the right job”的事情,需要根据具体的业务和场景,选择最合适的工具。亚马逊云科技采取开放包容的工具选择策略,让云端可以和客户的整个环境做到良好的集成。
在底层计算层也是如此,无论是 AI 芯片还是计算实例,云厂商也可以让用户根据不同的应用场景,根据自己的实际需求自由选择各种 GPU 实例、ARM 实例、机器学习专用推理芯片。
在上层 AI 服务层面,开发者可以根据自身需求,在云上有选择的使用各种 AI/ML 服务,比如文本分析、代码检查、聊天机器人、需求预测、文档分析、企业搜索、反欺诈、图像视频分析、个性化推荐、实时翻译、文本语言转换、转录,等等。为自己的系统应用补充所需要的智能化组件,通过简单的 API 调用即刻补足智能拼图缺失的一角。
2020 年, SageMaker Studio 正式发布,这是亚马逊云科技创建的一个全集成的 ML 开发环境——也是业界首创。它统一了 ML 开发所需的所有工具,将数百种机器学习功能,包含训练好的模型、设置好的容器镜像,都集成到基于 Web 的开发环境 Amazon SageMaker Studio 中。
开发人员可以通过单个窗格管理整个 ML 工作流,在可视化界面中编写代码、跟踪实验、可视化数据,以及针对 ML 工作流进行调试和监控,不需要切换来切换去,从而极大地提高了开发效率。
这种集成并简化后的开发环境对机器学习初学者也特别友好。以 Stack Overflow 报告最受开发者喜爱的 Hugging Face Transformers 为例,其官方网站默认使用 Amazon SageMaker 来训练和部署模型,提供了相应的入门指导。Hugging Face 提供的深度学习容器(DLC)与 SageMaker 结合,可以让开发者跳过从头开始构建和优化训练环境的复杂过程,立即开始训练模型。在亚马逊云服务上,免费注册账户,然后用 Huggingface Sagemaker,只需简单几行代码就可以开始训练并部署 Hugging Face Transformers 模型。