首页 科技创业正文

数据清洗耗费AI公司95%的精力,第四范式推AI操作系统

admin 科技创业 2020-08-21 06:45:41 3 0

原标题:数据清洗耗费AI公司95%的精力,第四范式推AI操作系统

产业变革时代,AI操作系统成全球竞争焦点。

8月20日,人工智能技术与服务商第四范式发布了企业级AI操作系统Sage AIOS。回顾互联网发展历史,操作系统对于技术的应用和普及发挥了关键作用,如同PC时代的Windows,移动互联网时代的安卓和IOS,每一项前沿技术最终都需要操作系统作为支撑平台,AI技术同样如此。

反观当下AI技术日渐应用于各行各业,但技术与产业之间的沟壑也开始显现。

首先数据治理问题最为突出。“数据治理占AI工作全流程95%的时间,即使花费这么多的时间,数据效果和数据质量两大难题,一直困扰着AI业务效果的提升。”第四范式创始人兼CEO戴文渊向包括第一财经在内的媒体表示。数据治理难度大一个很重要的原因就是数据的格式标准不统一,不同业务场景对于数据的要求也不尽相同。

AI落地的另一大阻力是门槛过高,科学家资源尤为稀缺。据戴文渊介绍,目前AI领域每一年新增的科学家数量是千万级别,但每一年新增场景却是百万级别,这导致科学家供给完全无法满足AI应用需求,不少科学家的精力耗费在低价值工作上。

此外业务价值不佳以及算力成本负担重,也是AI落地过程中最常见的问题。据Gartner预测,2022年平均每个企业在AI算力上的支出会是18年的4倍,总体市场支出将超过50亿美元。在算力高昂成本的背后,实际上是算力的巨大浪费——企业数据中心对AI负载进行针对性优化,算力平均使用率依然达不到60%。

“这些问题归根结底是因为缺少基于规范和标准的基础设施,AI实现规模化落地需要从底层系统出发,来设计和构建更标准化的AI产品。”戴文渊表示。正是在这一大背景下,第四范式推出了从算力、操作系统、生产平台到业务系统的AI产品矩阵。

从底层来定义数据标准并不容易,据第四范式AIOS产品负责人黄缨宁介绍,要定义数据至少需要三类know how(技术诀窍):业务、IT和AI的know how。包括不同业务场景中的模型需要什么样的数据,对应的数据需要从什么IT系统上去调取,以及如何将这些数据处理为AI 可用的数据“投喂”到AI系统中。

值得关注的是,疫情的到来正在给AI商业化进程按下“加速键”。据戴文渊透露,以往金融业务占据第四范式营收的90%,今年已经下降至50%,新零售和制造业增速迅猛。“消费互联网和工业互联网引爆的数据增长,促使一个个经济体开始发生巨大变化。”第四范式总裁裴沵思说道。

近一年AI独角兽公司上市消息不断传出,此前一位投资人曾向记者透露第四范式在考虑科创板。对此戴文渊回应,公司正在积极考虑科创板的窗口和机会。对于繁荣和泡沫并存的AI产业而言,IPO是否是AI独角兽们的最优选择?戴文渊认为要考虑两点:首先上市是否能够促进业务发展,尤其对于toB公司而言,上市后公司的影响力和公信力是否有助于业务拓展。第二上市后在融资上是否有更大的便利性,科创板开放灵活的创新机制,给AI公司创造了很好的机会。

第一财经广告合作, 请点击这里

此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者 返回,科技大学

    邱智丽

评论