数据量堪比10个世界级图书馆 VIPKID为孩子打造学习乐园
近日,在线少儿教育平台VIPKID宣布,其年新增课程数据量达到10PB,高峰时期并发课程量达到2.3万节。这不仅反映了VIPKID课堂背后的高水平运维能力,也意味着在数据积累方面,VIPKID已经走在行业前列。那么,10PB(1PB=1024TB)数据量是什么概念呢?如果把这些数据拷贝进硬盘,需要5120块容量为2TB的硬盘,如果每个硬盘厚度为2cm,摞起来则相当于一栋102.4米高的大楼;10PB也相当于10个世纪顶级图书馆的数字资源总量(2015年),或者人类有史以来所有印刷材料数据总量(200PB)的二十分之一。小学员在上VIPKID课程数据对于互联网企业的重要性不言而喻。马云曾在演讲中提到,未来的时代将是DT的时代,DT就是Data Technology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键。以谷歌开发的人工智能程序阿尔法狗为例,与围棋世界冠军、职业九段棋手李世石对战之前,谷歌就为其输入了3000万步人类围棋大师的走法数据,并让其自我对弈3000万局,这些海量的数据帮助阿尔法狗积累了人类难以达到的围棋经验,从而击败了人类围棋世界冠军。当前,VIPKID拥有超过30万付费用户和4万多名北美外教,这也为智能课堂的建立和持续优化提供了重要的数据来源。庞大的用户数据使得VIPKID能深入了解学生的学习习惯,提升个性化推荐的准确度与效率,不断为学生迭代个性化的学习路径,保证了孩子学习效果的真实呈现。从数据深度上来看,VIPKID的课程数据不仅包括孩子与外教的在线课堂互动视频、自主研发的在线课件,也包含VIPKID通过人脸识别、语音语义识别等在线教学技术,对学生和老师的上课行为深度挖掘后产生的庞大数据量。也就是说,在VIPKID平台上,一节课的数据不仅包括孩子和老师的上课视频,也包括系统分析得出的学生和老师的行为数据,这些数据还将在后续的课堂中形成学习报告,为老师教学和孩子学习提供重要参考。“这些数据可以更直观地呈现每个孩子的学习情况,为学生个性化学习路径的建立打下了坚实的基础”,VIPKID技术副总裁张燕静表示,将孩子的每一堂课、每一个学习行为记录下来,再加以分析,最终的目标是为每个孩子提供个性化的成长参考,成为他们在未来学习中弥补弱势,发挥优势的依据,真正实现大规模个性化教育。今年年初,VIPKID已针对每个用户发布了“爱学成绩单”,成绩单不仅有每个孩子在2017年的精彩上课视频,还分析了每个学员在过去一年中的学习行为,包括上课节次、分钟数、奖励获得、绘本阅读、学会的单词数量及一起上过课的北美外教等数据,有家长认为,“所有的这些数据,都是孩子在成长路上不可或缺的一个个‘脚印’。”
数据量堪比10个世界级图书馆 VIPKID为孩子打造学习乐园