印度人要做“语音版 Quora”,怎么让它听懂印度的众多方言?
目前 Google Assistant 支持的32种语言中,包括9种印度官方语言,而这些印度本地公司想做更多。
编者按:本文作者 Vishal Krishna,原文标题:Indian Languages need a voice online. Here's how homegrown startups are giving them one.
在13亿印度人中,真正会说英语的人不到1亿,不管你参考的是哪份报告。
印度的大多数网站和应用还必须使用英语操作,但现在变化正在发生——所有的数字和在线产品/服务都在向印度本地的语言过渡。这种变化吸引了新的用户,但是本土语言的使用还面临一个重要挑战。
这个挑战就是语音。
图片来源:YourStory
不仅是印度,全世界的初创公司和开发人员都在大力投资语音技术。语音技术省掉了用户打字的麻烦,能打开全新的用户市场——包括那些还不懂 ABC 的小孩子,以及不太会用手机键盘的老年人等等。
搜索巨头 Google 目前支持9种印度语言,而 Amazon 也在构建基于语音技术的各种功能。
而印度需要的不仅仅是语言支持和语音技术。像人们常说的“内容为王”,对一种语言进行精确识别需要足够的数据来训练,而印度有多达17种官方语言(编者校:印度宪法认定的官方语言有22种)和数百种被认可的方言。如果想打动印度的消费者,对这些不同语言的语音识别是必经之路,尽管这并不容易。
为了弥合这一缺口,几家初创公司正在帮印度人打造使用本地语言的搜索工具,毕竟每个人都希望为自己的问题搜索到明确的答案。这项工作的难点是:印度缺少使用本地语言的内容,或者说数据。
班加罗尔的 Vokal 就是这样一家公司。Vokal 由 Aprameya Radhakrishna 和 Mayank Bidawatka 创立。用户可以在该平台上使用印度本土语言提问,然后会有其他用户用同样的语言做出解答。简言之,Vokal 就好比印度版的 Quora,不过 Quora 是纯文字问答平台,而 Vokal 则是纯语音问答。
“语音是未来。印度的农村居民会更喜欢用语音搜索来寻找感兴趣的内容。目前,如果你不会英语,你就很难在各大平台上搜索和获取信息。”Aprameya 说。他补充说,Vokal 花费了大量时间来训练机器学习算法,使其能理解各种提问并显示相关回答。
YourStory 尝试了 Vokal 的埃纳德语和泰卢固语语音搜索,用它查找了烹饪、农作、旅行和健康生活指导等方面的内容。和任何初创公司一样,Vokal 还需要一些时间才能获得足够的用户和用户使用数据,进而优化其 AI 搜索引擎,达到99%的准确率,但它已经走出了第一步。投资者显然也是这么看的, Vokal 成立才不到一年半,就已经从 Kalaari Capital、Accel Partners、顺为资本和 Blume Venture 等投资机构获得了大约700万美元的融资。
图片来源:YourStory
除 Vokal 外,一些其他的创业公司也在开发基于语音的技术 。Reverie Techonologies 几年前就成功推出了用于手机的印地语输入法,这种本地化的输入法广受欢迎。最近该公司被 Reliance Industries 以19亿卢比(约2772万美元)高价收购。收购背后的原因正是 Reverie 正在开发的、支持本地语言的语音银行服务工具。
Reverie 开发的所有产品和功能的使用场景都是基于具体设备的(包括手机、平板、机顶盒、以及游戏和 App 的开发工具)。另外,Reverie 还与高通、沃达丰和三星等公司合作,帮助它们提高旗下电子设备处理语言的能力。
印度有许多初创公司都在对语音技术进行探索,但其功能各有不同。比如 Gnani.AI,这家公司一直专注于 B2B 业务,但现在它正计划为农户推出 B2C 服务,让他们能够用本地语言咨询有关农作物的问题。
更有意思的是,Gnani.AI 还在尝试用手机进行语音翻译和信息读取。也就是用户可以将一段语音消息转换为文字,然后将其分享给 WhatsApp 上的好友。假如有一名用户会说埃纳德语,但却不会写,那他/她只要对着 Gnani 的平台讲话,就能将语音转换为埃纳德语文字。
除了官方语言,Gnani 平台也可以将方言转换为文字内容。目前,Gnani 的主要使用语言是埃纳德语,但未来肯定会扩充更多语言。
“我们还在对产品进行测试,完善算法,以求输出最准确的(翻译)结果。”Gnani.AI 的联合创始人 Ganesh Gopalan 表示。
重量级企业玩家中,想要占据语音和地方语言市场的也不止收购了 Reverie 的 Reliance Industries 一家。去年,Flipkart 收购了 Liv.AI,Flipkart 的首席执行官 Kalyan Krishnamurthy 表示,Liv.AI 可以使用支持当地语言的语音技术来完成交易、进行付款、提供客户服务以及与卖家互动。Liv.ai 由 Subodh Kumar、Sanjeev Kumar 和 Kishore Mundra 三人联合创办,该公司将来会帮助 Flipkart 以本地语言与顾客交流,不管是通过语音还是文字。
Vernacular.ai 则代表了语音应用的另一种可能。Vernacular 想建立一个可以应对印度不同语言的自动化呼叫中心。目前它可以自动化对几家宾馆和餐厅的预约,客人只需说出自己的需求就可进行预约,而不用在线上等着和客服交流。
根据一篇《语音识别市场》的报告,语音技术市场预计将从2018年的75亿美元增长到2024年的215亿美元,复合年增长率为19.18%。对语音识别市场强劲增长的预期有很多原因,包括其在医疗保健类应用方面的潜力、手机银行类应用中不断增长的对语音认证需求、多功能设备和智能音箱的快速普及,以及在AI帮助下不断提高的语音识别的准确性。
该报告补充说,微观语言学、教育和自动驾驶等领域都可能为语音识别公司创造巨大的增长机会。
在印度,随着使用移动流量的用户指数级增长,本地语言的使用需求会越来越大,有太多的场景会需要用到本地语言。现在行业内的所有的努力——不仅包括 Google 和 Amazon 等巨头的努力,也包括本地初创公司的努力——都是未来市场所必需的。希望很快印度人能够以本地语言搜索信息并获得本地化的答案。
编辑:奥利