当前位置:K88软件开发文章中心编程资讯编程资讯18 → 文章内容

所见即所得,以 OCR 起家的「拍照取字」最终要瞄准人工智能市场

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-2-16 20:47:06

原标题:所见即所得,以 OCR 起家的「拍照取字」最终要瞄准人工智能市场猫起来科技创始人曹天明是一个“骨子里就爱折腾的人”,从360出来后一直在找寻创业方向。首先做猫粮,非刚需不说频次竟也不高;后来改换方向做一款出行类 APP,两三个月后项目也戛然而止。直到去年5月份,曹天明去国外旅游散心时,因为语言不通的问题平添了许多苦恼,“不知道路标、牌标上说的是啥,要有一款产品能把上面的文字拍下来并搞清楚就好了。”于是“拍照取字”这款产品就这样诞生了。其实从字面就很能理解这款产品是干什么的了,看见书本、路标、牌标、纸质文件上的字,拍照并扫描后即可把其转化成可以在电脑、手机、平板上编辑的文字。用官方一点的话来讲,“把非计算机语言的文字,利用光学技术转化成计算机语言。”除了将日常生活中的字体转化成可以编辑的文本外,拍照取字还加入了“笔记”、“翻译”和“团队协作”功能。“笔记”功能好理解,用户将各种生活场景中的字体取到电脑中后,可在 APP 中顺便加以分类整理,形成一个简单的闭环。翻译也不难理解。用户取得文字后,在拍照取字 APP 内就可翻译成107种国家的语言。产品主要针对的用户群体是学生人群和商务人士。学生的作业、笔记、错题本,经扫描后可转化为线上文本,方便后续的归纳整理;商务人士在扫描、传输文件时,只需使用该款 APP 转录到线上再开展后续操作即可。此外,某用户若想把书中内容分享给朋友。也可使用此款应用扫描并录入相应文本信息,并标注出重点信息再做相应分享。当数据量足够大时,“拍照取字”也会添加相应的人工智能属性。比如扫描快递单,去掉无用繁杂的信息后,可自动识别出用户的联系方式及相应地址;扫描财务票据时,也可从无序信息中提取出有价值的内容。要做人工智能的“眼睛”在曹天明看来,好的产品在战略上要分为“两步走”。首先要让用户“用爽”,获取足够的粘性。第二部,以 OCR 作为起点后,拍照取字要给人工智能提供足够的数据供其练习,并从 B 端企业收费。我们这里可以想想用户在哪些场景下会使用扫描功能。要么是和工作、生活相关的,要么是当下立刻有用的或自己感兴趣的,这其中有很多数据可以拿来挖掘、学习,做一些深度分析,并和一些电商平台展开合作。“拍照取字”后续会从这方面着手。与竞品的区别、OCR 的用户教育还处在萌芽期“由于 OCR 所使用的都是开源代码,底层技术其实都是一样的。真正拉开差距的,是 CEO 后续对产品用户人群的定位及商业战略的思考,大家拼的是产品而非技术。”曹天明如是说道。目前 OCR 扫描方面做的比较大的企业有汉王和扫描全能王,前者是上市公司而后者则已积攒了一批可观的用户数量。汉王主要是跟政府、企业合作来盈利。而拍照取字后续也在思考通过平台上积攒的用户数据变现,比如切向幼教市场。而目前 OCR 扫描技术所碰到的最大难题绝非技术,就是用户的市场教育,“很多人并不知道有这样的产品存在。”所以如何推广是团队要解决的问题。而目前拍照取字还是专注于产品的研发,并没有将资金投入推广,“就是将这款产品放到 APP Store 上,让用户自行下载。”目前,“拍照取字”的收入来自于APP下载的付费,1元下载一次。整个产品用户有14万,iOS上13万,日增900,日活2000,次日留存率32%,一周留存率6%,用户平均使用时长3分51秒。CEO 曹天明曾任360市场总监。具有多年相关行业工作经验;联合创始人兼CTO卞琪2011年毕业于北京大学。先后任职于腾讯、优酷、科大讯飞,担任高级工程师、高级技术经理、研发负责人等职位。项目曾在2017年12月份获得新进创投、巨人网络120万元的天使轮融资。

所见即所得,以 OCR 起家的「拍照取字」最终要瞄准人工智能市场