识别|百度大脑OCR技术加持白描App:让AI成为视障者的眼睛

现实中 , 你可以轻松无障碍的阅读各类平面印刷文字以及身边的一切 , 或许你未曾想过 , 视障人群该怎么办呢?
【识别|百度大脑OCR技术加持白描App:让AI成为视障者的眼睛】统计数据显示 , 中国大约有1700万的视障群体 , 相当于每100个人中就有超过1位是视障人士 。 但我们在日常生活中却很少见到他们 , 那是因为视障群体在日常生活中会有诸多不便 , 出门对他们而言危机四伏 。 AI有可能成为他们的“眼睛”吗?
成为他们的眼睛:白描App与视障群体的故事
如果手机上只能有一款App , 你会选择哪一款?视障人士安之坚定地给出了答案——白描 。 因为白描App让视力不佳的他用另一种方式“看”清世界 , 文字不再遥不可及 。 他用白描“看”过优美的诗篇 , “听”过动人的乐章 , 甚至在独自上楼看不清所在楼层时 , 白描也准确地将答案告诉了他 , 将他从窘境中解救出来 。 一个App让曾经望“字”兴叹的他更加勇敢的走出家门 , 参与丰富多彩的生活 。
“白描是我的眼 。 ”同为视障人士的小杰从不吝啬对白描的夸赞 , 甚至直言白描是视障伙伴赖以生存的工具 。 白描帮助他解决了生活的难题 , 从各类电器、数码产品、药品说明书到各种洗漱用品包装都可以识别 , 他还可以给可爱的小侄女讲绘本故事 。 如果没有白描 , 这种事情是他难以想象的 。

识别|百度大脑OCR技术加持白描App:让AI成为视障者的眼睛
文章图片

白描是如何做到被视障群体视若珍宝的呢?白描App是一款简洁高效的OCR文字识别软件 , 不仅简单好用 , 而且设计美观 , 可以轻松实现“拍照-识别文字-朗读结果”一系列流程 。 同时 , 白描适配了手机无障碍辅助功能 , 视障者可以在手机上非常轻松地操作 。

识别|百度大脑OCR技术加持白描App:让AI成为视障者的眼睛
文章图片

“白描”这个词本意是一种文学写作手法 , 鲁迅先生曾把这种手法概括成十二个字 , 即“有真意 , 去粉饰 , 少做作 , 勿卖弄” 。 白描App的开发者陶新乐正是这样的一个人 , 他观察到了不同人群的实际需求 , 用虚拟世界的代码满足了现实世界有需求的人 , 让他们的生活变得更加美好、便捷 。
白描App开发者的心路历程:切入不同场景、优化产品细节
你或许很难想象 , 作为一名个人开发者的陶新乐 , 他最早开发白描App是为了女朋友 。 陶新乐的女友热爱阅读 , 经常做读书笔记 。 为了减轻抄录压力 , 她尝试使用了当时市面上的各类文字识别软件 , 但她发现:有的软件操作流程繁琐 , 有的费用高昂 , 有的则识别不准确……看到女朋友痛苦不已 , 陶新乐当下决定亲自做个体验好、效果佳的OCR文字识别工具给女朋友使用 , 并且很快付诸了行动 。 这或许就是开发者独有的浪漫 。
然而 , 一款App的开发过程是充满未知与挑战的 。 在当时的条件下 , 开发一款具有OCR功能的软件 , 面临的一个巨大挑战是:如何让文字识别的又快又准 。 因此 , 他调研了市面上提供此服务的厂商 , 并对不同厂商的产品进行了对比 , 尝试识别不同场景的图片 , 找出识别效果最好的那个 。 于是他发现 , 百度大脑AI开放平台的OCR技术能力和使用体验都是最好的 , 尤其是识别准确度更领先于其他厂商 , 所以在2017年他就毫不犹豫的选择了百度OCR技术 , 并一直使用至今 。
但是优秀的底层技术并不意味着全部 , 百度大脑OCR已提供近60项技术能力 , 好的技术也需要应用于匹配的场景才能发挥更大的价值 。
于是 , 陶新乐首先对白描的使用场景做了细分研究 , 比如:学生上课拍PPT提取文字记笔记、企业员工把纸质合同扫描成电子版并且制作PDF、把纸质表格转成Excel电子版、翻译图片上的文字、老师拍摄并识别试题后对试题再加工、律师用来提取纸质文书上的文字等等 。 特别的是 , 视障人群特殊的使用需求 , 他都有关注和调研 。