阿⾥云机器学习PAI团队


阿⾥云机器学习PAI团队
PAI起初是一个定位于服务阿里集团的机器学习平台,致力于让AI技术更加高效、简洁、标准的被公司内部开发
者使用。对集团内,PAI服务了淘宝、支付宝、高德等部门的业务。随着PAI的算法的不断积累,2015年底
PAI作为天池大赛的官方比赛平台在阿里云正式上线,也成为了国内最早的云端机器学习平台之一。随着PAI在
阿里云的业务的不断发展,2018年PAI平台正式商业化,目前已经在公有云积累了数万的企业客户以及个人开
发者,是目前国内领先的云端机器学习平台之一。

PAI平台提供:PAI-STUDIO(可视化建模和分布式训练)、PAI-DSW(notebook交互式AI研发)、PAIAutoLearning(自动化建模)、PAI-EAS(在线预测服务)四套服务,每个服务既可单独使用,也可相互打通
。用户可以从数据上传、数据预处理、特征工程、模型训练、模型评估,到最终的模型发布到离线或者在线环
境,一站式完成建模,有效的提升开发效率。在数据预处理方面,PAI跟阿里云DataWorks(一站式大数据智
能云研发平台)也是无缝打通的,支持SQL、UDF、UDAF、MR等多种数据处理开发方式,灵活性较高。在
PAI平台上训练模型,生成的模型可以通过EAS部署到线上环境,整个实验流程支持周期性调度,可以发布到
DataWorks与其它上下游任务节点打通依赖关系,另外调度任务区分生产环境以及开发环境,可以做到数据安
全隔离。
一站式的机器学习平台意味着只要训练数据准备好(存放到OSS或MaxCompute中),用户就不需要额外的迁
移工作,所有的建模工作都可以通过PAI来实现。

PAI-Studio拖拽式建模平台,器学习的真正门槛来自于对底层算法原理的理解,以及复杂的计算机实现。为了
解决这种问题,PAI平台将200余种经典算法进行封装,让用户可以通过拖拽的方式搭建机器学习实验。

AI市场:数据智能技术商城

PAI平台内置了数加生态市场,用户可以基于PAI-Studio的自定义算法功能开发算法并在市场开店和上架,实
现产品和生态的融合。
用户可以将数加智能市场看作大数据与AI领域的“淘宝”交易平台。市场旨在促进大数据与AI技术产品的开发
创新与应用:一方面,帮助更多的开发者基于Dataworks和PAI去开发应用,并且将应用售卖给更多用户;另一
方面,帮助更多有业务需求的客户,在市场中找到解决自己问题的答案。
数加智能市场的商品类目包括大数据领域的解决方案、人工智能领域的图像识别及文本识别等应用API、机器学
习封装算法等,并在不断扩展中。

阿里云机器学习平台已经包含了Tensorflow、Caffe、MXNet这三款主流的机器学习框架,底层提供M40型号
的GPU卡进行训练。