毫无疑问,人工智能已经成为新一轮科技革命和产业变革的核心驱动力,正在对世界经济、社会进步和人类生活产生极其深刻的影响。人工智能经过几十年的沉淀,终于在近几年迎来爆发期,改变生活的同时也带给我们关于未来无尽的想象。
基于目前行业主流的深度学习算法模式,无论是智能手机的人脸识别,还是智能音箱的语音唤醒,无论是自动驾驶应用的路况识别,还是火遍抖音、快手的表情动作识别,人工智能应用落地的一大前提都是——标注好的大量数据集。
年以前,人工智能行业普遍采用的是企业自建标注团队、自己开发工具的方式完成数据采集标注。这样做的好处是可以直接对接采集标注人员,任务需求了解更到位,也不用担心数据外泄。在需求较少且不紧迫的方式下能够基本满足企业需求,但是其弊端也相当明显:自建团队无法满足高数量级采集标注需求,自营团队、开发标注系统来做这种密集型劳动也极大提高了新应用开发成本。
需求决定供给。龙猫数据不是第一个看到AI数据服务这片蓝海的人,却是第一个用互联网思维——众包模式解决数据需求的人,这和他们团队的互联网基因有很大关系。公司CEO昝智曾先后担任豌豆荚商业产品负责人、百度联盟产品经理,离职后联合原豌豆荚游戏频道技术负责人姚毅创办龙猫数据,流量入口公司的经验让他们拥有良好的互联网产品思维和粉丝运营技巧,采用众包模式——将客户需求分发给众多团队和个人来解决AI数据服务行业痛点的方式大获成功。
龙猫数据CEO昝智
“保守估计,我们的方式可以为客户节省下30%-60%的数据支出成本”,在一次采访中昝智曾表示,“我们不是行业的搅局者,我们是通过我们的方式真真正正把成本压缩了下来,我们从来不搞恶意低价竞争。”龙猫数据之后,新成立的数据服务公司大都采用这一高效高性价比的模式,行业里也很难再见到从事AI开发的公司建立自己标注团队的情况。
亚马逊的蝴蝶扇动翅膀带来了始料未及的影响,由于人员素质要求低、工作轻松简单,大量三四五线人工开始加入数据采集标注大军,从河北到贵州,从山西到重庆,专职或兼职从事过AI数据采集标注的人员超千万,一股轰轰烈烈的采集标注之风开始猛烈刮起来。
新方式也无疑为开创者龙猫数据带来诸多益处,年,公司合同额整体翻了5倍,服务百度、工商银行、字节跳动、京东、腾讯、小米、快手等大中型客户超家,平台用户超万,在龙猫数据注册的专业渠道团队超0个,初步确立了AI数据服务领域领导地位,这对于从年底才开始转型做AI数据服务的他们来说,无疑是巨大的成功。
对于具有互联网思维的人来说,变革只有开始,没有结束。“唯一的不变就是改变”,从年开始,AI创业就已经走下高堂,向更传统、更广阔的领域下沉,医疗、安防、工业制造甚至畜牧养殖,各行各业都开始出现AI创业风潮,其实这也越来越接近AI本质——AI是一项技术,可以对各行各业赋能的技术,如果把它束之高阁,只用于自动驾驶、机器人等“高端领域”,反而脱离了技术初衷。
新的转变意味着新的机遇,新的机遇都是从新的问题开始的。AI应用的赛道上生面孔越来越多,很多初创企业和团队对于数据有更多样化的需求,在传统的AI数据服务过程中,数据定制化一直是行业普遍采取的做法:由数据需求方提出需求,剩下的所有步骤都交由数据服务公司完成。这无疑增加了需要多种类、小批量数据的中小公司、初创企业的试错成本,如果能够打造一个大一统的平台,让客户直面用户,客户可以轻松发布任务,用户使用平台工具进行采集标注,不仅将极大提升AI数据需求方使用体验,也将使AI数据服务方更专注技术开发,打造更好的采集、标注体验。
基于此,龙猫数据重磅推出数据采集标注开放平台。
龙猫数据开放平台是完全开放化的,任何进入开放平台的客户,只要注册,就能够使用整套数据采集标注系统,也能够调用其中百万级的专业采标人员。平台上实现了全面的通用型标注工具免费使用,包括超像素分割语义处理系统、ASR智能语音标注系统、NLP自然语言处理系统等,可实现语音波形图展示、无缝时间戳选取,图像与自然语言精准标注,满足各种数据类型需求。
简单来说,开放平台就是搭建了一个针对供需双方的发布需求和提供服务的开放的第三方平台,可以最大限度地节省企业的时间成本和开发成本,同时提高工作效率。相比传统定制模式,平台可以为客户实现实时响应需求,万注册用户,0个以上的专业团队随时待命。借助咨询顾问全程跟踪,可以为企业快速配置个性化任务流。在开放平台上,企业直接发布任务,对需求理解更透彻,数据质量更高;直接对接采集、标注用户,省去中间环节,企业甚至可以自主定价,又一次为企业减少成本支出30%以上。
开放平台降低了人工智能的入行门槛,保证了数据需求方的任务能够获得更多样从业者的