引领数据领域AI工程化落地,为什么会是云测数据?(4)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
在这种做法下,数据安全的提升是显而易见的。
最直观的,由于云测数据所提供这套体系让数据存储、数据标注、数据传递等有统一的管理,数据的流转等不需要经过人力环节(人力主要负责工单而不是数据本身的流转,比如不用人力递送数据硬盘),这使得AI开发的数据环节大大降低了对人的依赖,减少了失误等风险发生的可能性。
更进一步看,在平台工具、安全模块之外,面向AI工程化的数据服务的机遇只属于有行业经验的企业,也促成后者能够进行更多业务合作的探索,人员和项目管理模块就是如此。
有关数据的AI开发工作除了技术性的内容,还离不开AI人力相关的管理,离不开项目管理,而云测数据基于其过去在数据方面的人才、项目管理经验,在解决方案中也提供有匹配人员管理与项目管理的一套并行的体系作为支撑,包括招聘体系、业绩培训体系、领域知识培训体系、项目管理体系、责任安全体系、绩效职级管理体系等,其本质是以认知资源的共享换取商业价值,典型如,云测数据更了解数据标注人才的需要、更知道从哪里可以找到特定的人才、如何培育人才、更知道怎么管理项目。
当然,围绕数据、作为一种根本上的To B服务,尽管有先天优势,但云测数据面向AI工程化的数据解决方案的落地,还需要考虑对不同AI开发企业的适配,毕竟AI工程化是系统工程,牵扯面往往较广。
这方面,通过API集成屏蔽不同企业的差异、做到广泛适配是解决之道,还可以看到,云测数据的解决方案中就在平台工具模块中设置了标准协议接口、数据价值可视化、数据处理工作台、数据权限管理等,来让不同企业的管理体系都能快速进行对接。
AI“工业化大生产”来临,数据领域的AI工程化与大模型率先汇流
AI工程化其价值和机遇不仅在于AI开发过程,其对大模型的促进作用也不容忽视。
从更宏观的视野看,AI工程化的趋势与当下AI领域的热点大模型一样,都是在推动AI“工业化大生产”(高效率的批量化AI落地,而不是作坊式的一个个生产),只不过一个从开发全过程出发,一个从模型本身出发。
二者碰撞到一起并非只是一种巧合,AI工程化与大模型也在实现着协同。
一方面,这体现在大模型开发本身,也即“预训练”阶段的工程化。
例如,知名NLP领域的大模型GPT-3其模型复杂度非常高,仅模型参数就高达1750亿个,训练数据量达到45TB,训练出的模型有700GB大小。
99科技网:http://www.99it.com.cn
