国际数据公司(IDC)最新发布的《中国人工智能软件及应用(2019下半年)跟踪》报告中显示,中国机器学习开发平台市场2019年市场规模达2.05亿美元。受此次疫情影响,IDC下调了2020-2021年的市场规模,因此也影响了未来5年的整体市场增长率,预计2018-2024年复合增长率达38.6%。
机器学习开发平台研究范围
人工智能应用均是采用机器学习、深度学习建模开发而成的系统。本次IDC追踪的机器学习开发平台,定位面向开发者、数据科学家、业务分析师的PaaS平台,不包含已经完成开发的诸如人脸识别、语音助理、对话式客服等软件。机器学习开发平台的部署,包括数据获取、数据准备、模型训练、应用程序集成、模型运维、生产监控以及有明确KPI的业务治理过程。在这个过程中,由框架、算法模型、开发语言等各种工具赋能,由数据科学家、业务分析师、数据架构师和专业人员协作,基于数据建模,不断的进行概念验证,将好的模型部署到生产环境,协作以管理模型运维的全生命周期。
市场发展驱动力
算力不断提升:受益于加速计算技术的不断突破,机器学习、深度学习模型训练和推理速度持续提升,加快了AI应用产业化的进程。2020年GTC、英伟达更是发布了将算力再度提升数十倍的安培架构的A100 GPU。Intel 华为昇腾系列,Xilinx Alveo系列、寒武纪等也在特定领域为AI负载提供加速能力。算力突破将持续推动AI产业快速落地。
算法模型创新:在经典机器学习、CNN、RNN等神经网络的大分类下,厂商都在不断的推出面向应用场景优化的各种模型。
开源技术发展:包括主流开源框架Tensorflow,Pytorch,飞桨Paddle,推理框架MNN, TNN, Mace, Openvino等等,也包括上文提到的算法模型,开源发展使得技术推广应用更加便捷、高效。
厂商市场投入:不管是创企,还是大型互联网公司、IT巨头,在机器学习、深度学习领域积极投入资金、研发力量,致力于在机器学习这一人工智能的基础关键技术上有所突破,同时也在致力于降低机器学习开发门槛,让传统企业受益于人工智能。
驱动力足够,但市场发展的瓶颈也同样存在:数据资源就绪度,数据质量,能用来建模的数据量;有能力进行模型开发、模型优化的数据科学家;建模人员与行业专家对业务理解上的鸿沟;行业企业内部人员对机器学习、AI项目的配合程度;为机器学习、AI定位到合适的应用场景等等。
主流厂商介绍
本次是IDC第一次正式发布机器学习开发平台市场份额研究报告,本期收录了排名前三的厂商市场份额,同时也推荐了当前市场规模不明显,但值得关注的厂商。从市场格局的角度,部分厂商聚焦在金融反欺诈、智能营销场景,部分厂商聚焦在销量预测、智慧供应链、个性化营销、产品推荐系统,部分厂商聚焦在泛工业领域的设备预测性维护、工业质检巡检类应用。在应用较为落地的领域,会存在价格战等竞争,在较新的应用场景中,则更多的是同步探索的阶段。从产品层面,当前的差异化在于端到端开发工具的完备性,提供模型的丰富程度,对云服务的支持,开发过程可视化程度,平台产品的灵活性、易用性,以及产品整体的成熟度。
第四范式:作为市场份额领先的AI平台提供商,第四范式积极探索迁移学习,打造AI PaaS平台“Sage Platform”以及AI软件定义的基础架构SageOne产品,打通从数据、算法到算力的AI产业化全流程,助力企业实现业务增长、提升开发效率、缩减算力成本。
美林数据:作为国内领先的数据分析与AI厂商,该公司在算法研究、行业应用实践、落地实施方法论层面拥有独到见解与优势。TempoAI在产品架构、功能体系、用户体验等方面经受过多行业客户、多业务场景的应用验证,其敏捷、稳定、易用的特性深受客户好评。
九章云极:作为一个中立的软件提供商,九章云极对DataCanvas数据科学平台有清晰的定位:“开放、兼容、纯软件平台”。目前,DataCanvas数据科学平台可以在各类主流硬件和技术架构上支持高性能算力调度和优化,提升企业AI转型效率,服务全行业应用场景。
阿里云:阿里云PAI发布于2016年9月,2018年1月正式商业化。PAI平台的优势一方面在于重视机器学习系统级优化,另一方面在特征工程提取、模型训练等各个环节提供了丰富组件。
百度:百度机器学习产品组合在提供丰富算法模型能力的基础上,也十分注重迁移学习能力、小样本模型训练能力,以及端到端模型应用能力,为各行业不同技术、数据基础的用户提供了针对性的产品,包括BML,EasyDL,AI Studio,飞桨Paddle。
华为云:Modelarts定位企业级AI开发平台,提供流程式AI开发模式,将行业AI开发经验模板化,通过简单的工作流编排即可快速实现AI服务上线。
腾讯云:智能钛机器学习平台于2020年正式商业化,在此之前,已在金融行业、互联网行业等积累诸多私有化部署实践。
AWS:在AWS将机器学习产品正式中国发布之前,其机器学习产品Amazon Sagemaker已经在全球市场具有较高的影响力。2020年4月,Amazon Sagemaker正式落地中国,目前已在互联网、制造、医疗等领域推广。
微软Azure:AML已于2020年正式落地中国,目前也在加大推广力度和开发者培育,致力于赋能中国企业智能化转型。
SAS:SAS Viya提供了丰富完善的数据收集、数据准备、模型管理以及可视化工具,集成R、Python和Jupyter Notebooks等开源语言和工具,具备将AI应用投入生产并大规模运行的能力。
机器学习/AI创企:探智立方——Darwin ML平台定位自动化机器学习平台,使人工智能团队更专注于业务问题的解决方案,将人工智能最大化赋能于业务场景。氪信科技——基于非或然引擎以及特征引擎的智能应用深入客户的业务场景,尤其是在智能风控以及智能交易监测场景,可直接为客户提供具有针对性的模型以及服务,助力业务智能决策。星云Clustar——致力于为银行、保险等金融行业提供AI模型训练加速能力以及基于机器学习的智能应用服务。
展望未来趋势
应用场景:金融反欺诈,工业质检,设备预测性维护,智能投顾,量化投资,跨行业应用—销售预测,供应链预测,推荐系统。
产品趋势:AutoML,智能数据标注,图算法,可解释性,界面可视化,易用性、灵活性的持续提升。
市场机会:对于还没有成熟的AI软件产品的领域,机器学习、深度学习开发平台将有广泛的市场空间。
展望未来,IDC中国助理研究总监卢言霞表示,即使受疫情影响,机器学习开发平台市场仍表现出较高的市场增长潜力和应用潜力。要充分挖掘这一潜力,需要做到为开发人员提供培训和可以快速启动的工具,提供一定的可用于训练的数据集(可能来自内部也可能是第三方),快速入门的样例/模板,咨询服务,业务专家、数据科学家、咨询合作伙伴等利益相关者的共同参与和协同,持续创新和原型设计直到达到可以规模化使用。”
- 大模型与生成式人工智能将带来三大变革 – 2023年7月10日
- 《全球数字经济白皮书》发布 – 2023年7月5日
- 国际数据空间协会(IDSA)中国能力中心正式成立 – 2023年7月5日