副标题#e#
【IT新闻频道】周末下午,手机上的一条视频引起了我的关注,视频并不长,但恰恰是这条短短16秒的新华社新闻播报,却成功地引发了我的浓厚兴趣。
这是一位AI虚拟女主播,其播报新闻时生动的面部表情几乎可以以假乱真。
作为科技互联网圈的一份子,AI虚拟主播对于笔者而言并非第一次见到,甚至自己在制作一些视频号的时候也在有意识地启用AI语音合成技术。比如在需要用特殊的方言配音以增加情趣时,便更是AI配音祭出拿手好戏的时刻。
不过,手机里的这位AI女主播在新闻播报时表情配合得天衣无缝,不禁让我慨叹如今AI技术发展速度如此之快,其表情、眼神、嘴型、发音无一不精准到位,毫无违和感,这远远超出了我此前的预期。
和第一位击败人类职业围棋选手的AlphaGo一样,未来的AI虚拟主播完全可以完成24小时的持续新闻播报,这对真人主播带来了不小的职业挑战。大量新闻机构的人力成本、时间成本甚至纠错成本都将因此而大大节省。如今通过语音合成、模型建立及训练,已然可以克隆出这样一位不知疲倦的“真人主播”。
除了上述这位由科大讯飞推出的AI虚拟女主播,韩国和日本此前也推出过水平不一的AI虚拟主播。
不知不觉间,AI在人类生活中应用已经渗透到我们自己的身边。
作为讯飞的一位老用户,笔者此前对讯飞的印象更多还停留在每日都会用到的讯飞输入法上,而今天那位AI虚拟女主播对我的触动则让我对它的品牌认知做了一次全面的刷新。
科大讯飞的“毕业季”
在刚刚过去的6月9日这一天,科大讯飞度过了自己的“22岁生日”。
1999年6月,在安徽合肥的一间出租房中,年轻的刘庆峰与他的中科大同学以手中仅有的300万元资金,注册成立了今天科大讯飞的前身。刘庆峰也由此成为中国第一家由在校大学生创业建立的上市公司董事长。
刘庆峰与早期的团队在一起
当年,中国的智能语音技术全部掌握在IBM、微软等科技巨头手里。把握住时代机遇的科大讯飞在2010年10月22日发布了以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台,为开发者提供一站式人工智能解决方案。
2010年10月28日正式发布的讯飞输入法也成为第一个中文语音输入法,它在时间上领先于此后才陆续出现的谷歌中文输入法、QQ输入法和搜狗输入法。
2017年,讯飞开放平台成为中国首批4家国家级人工智能创新平台之一。目前,该平台已开放415项平台能力,聚集超过230多万开发者团队,总应用数超过112万,累计覆盖终端设备数32亿+,AI大学学员总量达到51.6万,以科大讯飞为中心的人工智能产业生态体系正在持续构建。
这一年,科大讯飞18岁。
2018年至2020年,科大讯飞在智能语音领域获得近10项国际AI赛事冠军。
2020年12月,国际数据公司(IDC)发布《中国人工智能软件及应用(2020上半年)跟踪》报告,2020年上半年,国内语音语义应用市场规模达6.45亿美元,科大讯飞则占据当期中国语音语义应用市场份额第一名的宝座。
业内曾将中国互联网的发展分为三个阶段:第一个阶段是PC互联网时代,也有人称之为娱乐互联网时代。第二个阶段是移动互联网时代,也称消费互联网和应用互联网时代。第三个阶段是产业互联网时代,也有人将之称为万物互联的人工智能时代。
从1999年到2021年,22岁的科大讯飞,幸运跨越了中国互联网发展的三个阶段。
科大讯飞推出的虚拟主播营销形象
在以消费互联网特色为主的前两个阶段中,互联网产品面临的考验是用户体验是否顺畅和产品界面是否美观,如果满足这一要求,创业者便会获得更多的成功机会。而在进入产业互联网阶段之后,行业投资人更多会更冷静地通过行业价值链条来判断自己的投资决策,这时候,互联网产品的市场爆发性也远远低于消费互联网阶段。
不过,成熟的行业市场同样给予了创业者慷慨的机遇和回报。根据权威调研机构IDC早前预测数据,到2024年,包括软件、硬件和服务全球人工智能市场规模将增加到5543亿美元,五年复合年增长率为17.5%。创业者们与资本的距离似乎更近了。
2021年,被业内人士视为人工智能产业大年。
这一年,科大讯飞进入了“毕业季”。
在此情势之下,科大讯飞又该如何把握机遇?
摆在面前的“斯芬克斯之谜”
科大讯飞长期需要面对的一个“斯芬克斯之谜”,便是如何对B端市场和C端市场进行取舍和平衡的问题。
“斯芬克斯之谜”是一个来自古希腊神话的传说,天后赫拉派斯芬克斯在忒拜城附近的悬崖上,拦住过往的路人,用缪斯所传授的一个谜语考问他们,猜不中者就会被它吃掉。这个谜语是:“什么动物早晨用四条腿走路,中午用两条腿走路,晚上用三条腿走路?腿最多的时候,也正是他走路最慢,体力最弱的时候。”
最后,俄狄浦斯成功地猜中了正确答案,谜底是“人”。斯芬克斯因此羞愧万分,跳崖而死。
“斯芬克斯之谜”其实暗指的就是人在不同年龄段“用几条腿走路”的问题,而22岁的讯飞也面临着同样的问题,在企业自身的不同生命周期里,究竟需要多管齐下、两条腿走路,还是专注一端、从一而终?
科大讯飞起家于企业级市场,早些年在消费级市场默默无闻。
曾经在很长一段时间内,科大讯飞的C端产品代表就是讯飞输入法。
不过,如今的讯飞已经翻开了自己手中硬币的另一面。
#p#副标题#e##p#分页标题#e#
除了以企业级产业技术继续赋能教育、医疗、汽车、手机行业的同时,近年来,科大讯飞以每年十几款的速度向消费级市场推出更新迭代或完全创新的智能硬件产品,以讯飞翻译笔、智能录音笔、讯飞智能办公本等为代表的数十款硬件产品迅速完成抢滩登陆的动作。
“科大讯飞真的需要亲自开拓C端市场吗?”有人不禁产生这样的顾虑。
对于很多从B端市场起家的企业而言,从2B市场向2C市场的转型过程中很可能暗藏着巨大的风险。无论是这家企业的创始人、企业中层还是普通员工,如果仍然按照自己在2B行业习惯的行事风格为消费级市场提供产品和服务,往往会挂一漏万,事倍功半。
行业中并不缺少这样的失败案例。
同是在语音识别技术领域,Nuance当年曾以全球最大语音识别技术公司的身份,为苹果、亚马逊、三星、诺基亚等品牌提供专业水准的语音技术解决方案。
但随着行业技术门槛的不断降低,Nuance先后遭遇了市值暴跌、客户流失等困境。在此过程中,Nuance也曾经尝试过从技术提供商转型为解决方案提供商,甚至在C端市场推出语音助手产品,但最终由于自己缺乏消费级产品基因,Nuance始终未能获得C端用户的芳心,市场持续滑坡,并最终在今年4月被微软并购。
而在成功案例中,从B端市场成功拓展到C端市场的成功先例,华为算是楷模。
刘庆峰:预见未来的最好方式就是创造未来。
对于消费级市场,科大讯飞董事长刘庆峰有着自己的想法,他认为,人工智能技术必须要有“看得见摸得着”的真实应用案例作为依托。因此,科大讯飞一直没有放弃对C端市场的把控和耕耘,在2016年底还为此成立了消费者事业部,专心主攻C端市场。
科大讯飞智能录音笔H1/SR502
“从2018年开始,科大讯飞有一个非常重要的变化,那就是2B+2C双轮驱动战略的扎实推进”,刘庆峰说。
目前,科大讯飞在C端市场用户数量最多的产品仍然是讯飞输入法。然而在B端市场,目前公司主营收入占比最高的则来自教育行业,该比例甚至要占三成以上,这与科大讯飞多年在教育行业的深耕有关。
科大讯飞的创新体系分为三大环节,首个环节面向未来一至三年的产品研发,由各个业务线、产品部门负责。第二个环节偏重未来三至五年的应用研发,由讯飞研究院负责。第三个环节坚持走以企业为主体、产学研合作的创新道路,面向未来五到十年甚至更远的前瞻性探索。
讯飞智能办公本X2
而在资源投入上,科大讯飞以市场导向分配“弹药”,遵循“721研发投入模式”。科大讯飞总裁吴晓如曾做出以下表示:“上市以后,我们每年拿出20%以上的营收投入到研发中,其中70%的资源投入当前的主导产品,20%投入战略新产品,10%投入探索型的、不追求一定要有回报的方向,它可以很自由地探索未来。”
由此,科大讯飞形成“三位一体”的闭环创新体系,从基础研究到核心技术研究,再到前瞻技术研发,推动科大创新技术“车轮”持续向前。
目前,科大讯飞已牵头成立了长三角人工智能产业链联盟,推动长三角人工智能产业的融合发展。联盟成员已经扩容至60家单位,包括人工智能骨干企业、高校、科研平台、行业协会、社会机构、智库组织等相关单位,覆盖产业链的各个环节。
数据显示,今年一季度,科大讯飞营收达25.01亿元,实现净利润为1.39亿元。
在4月20日的盘后业绩沟通会上,刘庆峰再次提到“千亿目标”。他表示,千亿收入目标的动力来源来自于科大讯飞主要赛道的内生式增长,三分之一来源于教育,三分之一来源于医疗、便利便捷服务等数字生活领域,还会有三分之一来自于消费类产品。
刘庆峰明确表示将在核心赛道迅速形成不可替代的竞争优势,“要学习华为这样的公司,力出一孔,形成饱和攻击”。
科大讯飞很多推向C端市场的产品和技术也来自B端市场。同时兼顾企业级市场和消费级市场、“两条腿走路”的双战略贯穿了科大讯飞的整个市场脉络。
智慧生活彰显人文关怀
摆在人工智能企业面前的一大要务,往往体现在智慧生活和人文关怀方面,科大讯飞也不例外。
据中国互联网络信息中心发布的第47次《中国互联网络发展状况统计报告》数据显示,截至2020年12月,我国已有近2.6亿“银发网民”(50岁以上),中老年群体已经成为我国新增网民的主要来源。
#p#副标题#e#
5月21日,在第三届科技无障碍发展大会现场,讯飞输入法总经理程坤向公众系统分享了讯飞输入法在适老改造方面的实践,他希望老人群体可以借助讯飞的技术更为方便地融入社会生活,享受一次由互联网新技术为之带来的新体验。
其实早在今年春节期间,科大讯飞就借助自己推出的讯飞输入法“长辈模式”而刷屏互联网。针对老年人输入特点,讯飞输入法贴心内置“长辈模式”,拥有高识别率的手写输入,支持叠写连写,手写单字还有注音提示。
为方便老年人使用语音输入,讯飞输入法默认长文本语音输入适应老年人的语速,并且支持23种方言语音输入,此外,还加入了语音播报,可对输入文字一键朗读,更为快捷。
而在B端市场,讯飞同样兼顾了社会情怀。
讯飞医疗可以通过“人机耦合”的方式,让机器代替医生承担更多的简单问诊和病例筛选事务性工作,让医生把更多的时间用来接待和医治需要专业救治的患者。
比如,在新冠肺炎疫情爆发初期,科大讯飞智医助理电话机器人紧急驰援武汉,仅仅花费6个小时就完成了对武汉100万居民的筛查随访。
#p#分页标题#e#
随后,科大讯飞还在全国范围内义务支持开展疫情排查,驰援海外地区的疫情防控。2020年全年期间,智医助理电话机器人呼出与新冠肺炎疫情相关的电话2058万人次,针对重点人群电话随访794万人次,短信4824万人次,累计服务7676万人次。
“如果没有人工智能,仅摸排这项工作,就需要人力工作数月。时间就是生命,一台机器人能够代替成百上千个基层工作人员,这就是科技的力量”,刘庆峰说。
预见未来,创造未来
在刚刚结束的“618消费狂欢节”期间,科大讯飞成绩亮眼,C端产品全线爆发,整体销售额同比增长108%再创新高。
其中,在京东、天猫双平台中,录音笔品类、电纸书品类及单品国内品牌销售额连续三年荣获冠军,翻译机品类及单品销售额连续五年位居第一,智能语音鼠标品类如今也是第三年摘得魁首。此外,AI+学习产品销售额同比增长706%,讯飞智能学习机和扫描词典笔获得了用户的青睐。
在人工智能领域,科大讯飞大多数时候扮演的是赋能者的角色。
今年5月21日,中央全面深化改革委员会第十九次会议指出,“义务教育最突出的问题之一是中小学生负担太重,短视化、功利化问题没有根本解决”。而类似讯飞推出的智慧教育产品的亮相,无疑将是解决这一问题的有效途径之一。
“题海战术”是很多学生学习的方法,但正确的“题海战术”应当是先加深自己对知识的理解、运用,再通过有针对性的做题进行知识的查漏,而不是选择“全覆盖式的做题”。
科大讯飞的“因材施教”模式旨在通过强化学校教育主阵地的价值,辅助师生回归学校,在有限的时间内做好教学,释放孩子的时间,让孩子从填鸭式培训变成借助智能学习机自主学习。
在这一点上,讯飞智能学习机X2 Pro无愧于“新一代人工智能学习机”的称号。它内置有AI专题互动课功能,可以通过AI互动答题的方式让孩子实现边学边测。该功能内涵盖有大量一线名师策划的高频考试专题课,能实时检测学生学习情况,动态调整他们的学习路径。在课后,学习机还可以针对每个学生的现有学习情况,提供个性化作业,这就相当于帮助学生将不同的学习情况分层,有助于他们进行针对性学习。
通过科大讯飞的“因材施教”模式,孩子习题训练量减少了,做作业的时间也就相对减少了。多出来的时间,让孩子能够有时间去玩耍、去探索,培养自己的好奇心和求知欲。
对此,刘庆峰表示,“在教育上,我们的系统能否满足价值创造的本质,关键要看能否在校园主阵地真正做到因材施教为师生减负”。
讯飞扫描词典笔
6月9日是科大讯飞的22周年司庆日,这一天,刘庆峰面向全体员工发布了一封公开信。
他在信中提到,科大讯飞在今年年初提出了“十亿用户、千亿收入、万亿生态”的十四五奋斗目标,其中系统性创新和战略根据地是科大讯飞未来五年最重要的成长路径,也是支撑业绩高速增长最核心的两个引擎。“预见未来的最好方式就是创造未来。”
从优秀到卓越
美国人吉姆·柯林斯在《从优秀到卓越》一书中做出这样的论述:技术本身从来不是走向卓越或衰落的首要的、根本的原因。根本不存在单一明确的行动、宏伟的计划、一劳永逸的创新,也绝对不存在侥幸的突破和从天而降的奇迹。
#p#副标题#e#
一家卓越公司的诞生依靠的只能是不断向相同方向,一圈又一圈地推动那只最终帮助实现跨越卓越鸿沟的巨大飞轮。
“国内产业发展将从过去的人口红利期过渡为人才红利期,最终进入人工智能的应用红利阶段。”刘庆峰表示,人机共存时代到来,人机共存更加和谐、自然。人机交互将更加以人为本,但人工智能的红利兑现绝不代表人工智能将替代人类。
“我相信未来一定是属于掌握了人工智能的新人类。用人工智能建设美好世界需要社会各界全方位的协同,这是一个伟大的历史进程,需要我们共同携手”,刘庆峰说。
讯飞不但是创新者,也是勇于破局者。
进化之路上的科大讯飞,即将再次腾飞。(曾宪勇)