着眼AI未来,践行产教融合直播回顾(产教融合生态)
190
2022-08-16
AI云时代大幕开启,华为全栈AI产品线将迎春天
最近笔者在接受《证券日报》有关人工智能产业发展的采访时(http://m.zqrb.cn/stock/hangyeyanjiu/2020-10-28/A1603816650302.html),专门提到华为以Atlas平台、ModelArts等AI产品正在推动我国AI产业朝着数字经济的基础平台转型,不断向社会释放巨大技术红利。
在目前众多AI实际落地的案例中, AI助理审判员是比较具有代表性的一个,据统计我国一家区级法院平均每年受理案件在6000件左右,人工录入动辄上千字的判决书,对于全国12万法官来说,意味着白加黑、五加二的劳动强度。不过现在的AI语音技术可以在无需纸笔和键盘的情况下“出口成章”,这样的AI助理审判员在1.5万个法庭全面启用后,为办案工作繁重的法官们减轻了不少压力。
AI智能语音系统结合对庭审和办公应用场景的定制,可以在咨询、立案、庭审、判决等四个环节中为法官提供帮助。
而这样的应用背后,其实也揭示了AI与云计算深度结合朝着基础平台方转型,并且由感知智能向认知全面升级的趋势。
近日IDC详细调研了国内主要云厂商的AI云服务能力,涵盖人脸人体、图像视频、智能语音、对话式AI、NLP、机器学习等六大主要AI领域。并发布了《中国AI云服务市场半年度研究报告》,根据IDC的预测, 2020年中国人工智能市场规模将会突破五十亿人民币,已经形成一个不可忽略的细分市场,尤其是在疫情影响下各行业上云意愿明显加强,而且这也将使智能外呼、对话机器人等交互式AI迎来一波发展机会。
认知智能全面升级
在2019华为全联接大会上,Atlas 900 AI训练群再次强势来袭。Atlas 900 AI集群基于昇腾910 AI处理器搭建,通过华为通信库和作业调度平台,整合HCCS、 PCIe 4.0和100G RoCE三种高速接口,充分释放昇腾910 AI处理器的强大性能。Atlas900在20万颗星星里找到一颗有类似特征的星体只需要10秒,而在之前这个任务是需要科学家半年的时间才能完成。在实地测试当中,Atlas 900速度比处于第二位的平台快了五分之一,用华为副董事长胡厚崑的话说“这就好比是在一场短跑里,第1名跑完了全程,然后上了个厕所再回来时第二名才终于气喘吁吁的到达。”
今年9月,华为ModelArts2.0正式对外发布,其理念是打造一站式的开发平台,支撑用户从数据到应用的全流程开发过程,包含数据处理、模型训练、模型管理、部署等操作,并且提供AI市场功能,能够在市场内与其他开发者分享模型、API和数据集。
ModelArts主要优势就是开放,并且预置多种模型,而且支持零代码开发,简单操作训练出自己的模型。用户完全可以不写一行代码,完成如车辆识别的模型训练,可以说上手体验相当不错。
Atlas框架和ModelArts等相关产品的耦合,为业界利用AI算力提供了极大的便利性,也反应出人工智能正在从感知智能到认知智能演进方向。这种演进的关键突破口就是跨过深度学习去做研究。由于深度学习只能处理单一模态的数据,深度学习模型下的智能机器只能够照章办事,缺乏灵活性,认知智能就是要找到多模态信息之间的关系,这样的升级使得多模态成为完成由感知到认知这一跨越的必然途径。
如果将数据比作这个数字时代的石油,那么华为等大厂,丰富的业务场景与庞大的用户基数,就为其AI团队提供了世界上最大的原油储存基地,这些都为前沿的AI研究成果提供了令整个业界都非常羡慕的绝佳“训练场”,而拥有了这样高的训练水平。
正如前文所述IDC将报告的重点放在了智能语音、对话式AI、NLP等方面,这些场景的背后是智能语音、机器翻译及对话、多模信息等领域的支持,先带大家来解读一下这个几领域的基本情况:
文本生成:这个领域之所以会抱得大名,主要还是因为《权力的游戏》第八季崩盘,在一片“烂尾结局”的评价声中落下帷幕。而随后,便有极客用 OpenAI 提出的 GPT-2 文本生成模型进行了实践。模型学习的是《冰与火之歌》原著,最终输出了一个大结局,结果得到很多网友的好评,这也让人们不禁惊呼,原来AI还能写小说。
智能语音:这是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。 智能语音技术的研究是以语音识别技术为开端,最早可以追溯到20世纪50年代。随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。
多模态特征提取与翻译:目前尤其是90后,在对话当中经常使用表情图、动态图等方式来表达情感,而将这些非语言信息的语义提取并翻译出来,就是多模态提取的任务了。比如今年KDD Cup的一道赛题就是“多模态商品推荐”, 其中多模态商品推荐指的是关联融合视频、图片、文本等多模态用户数据,并结合用户的购买习惯、浏览序列等多维信息进行建模学习,精准理解用户的检索需求,推荐并返回用户真正关心、感兴趣的产品图片或视频。
对话系统与无感交互:其实笔者在经历异地恋的时候也曾经做过一款基于Windows Mobile MSN的对话机器人(https://blog.csdn.net/BEYONDMA/article/details/99690305),不过现在微信基于海量对话信息制作的聊天机器人,已经真假难辩了。而对话系统与文本生成最大的不同之处在于,对话系统一般只生成短句,语义群较少,而文本生成系统则恰恰相反。
而无感交互的终极奥义恰恰在于它要比用户更懂用户。比如前段时间笔者经常熬夜加班,结果打开淘宝会发现总给我推荐防脱洗发水,当然目前已经推荐枸杞了。不过这其实也说明认知智能的终极发展就是让用户在使用过程中对于“人工智能”不断淡化,甚至无感化。现在用户使用人工智能时还会明显感受到它的存在,比如你打开电视还需要说“我要看**的电视剧”,还要对手机说“给**打电话”,而真正实现认知智能之后,将会让你觉得你的这些交互行为变为多余,比如你回到家,人工智能系统会根据你的步态,推荐一个适合你当下身体状况的食谱,等你吃完饭下楼去超市的时候,你的手机会建议补充一些牛奶,因为你刚刚已经把家里最一袋牛奶喝掉了。相信读到这里读者也就会明白,化有形于无形,就是用户交互的最终奥义。
从笔者一个AI云服务的用户角度上看,其实人工智能由感知到认知的升级,就是对于客户个性化与定制化需求,进行快速响应的过程,比如金融行业的呼叫中心需要分析客户的语气,以快速处理投诉类案例;出行类APP遇到客户说出某些关键词时,则需要立刻与110联动报警。在面对各行业个性化定制需求日益增长的情况下,华为走在了业界前列,尤其是在满足用户定制化需求方面可谓做到了极致。最近在朋友圈刷屏的得到总裁罗振宇《如何说服一个人》的分享,更是将他们是如何被华为说服的过程展示的淋漓尽致,让业界相信华为不是要从客户身上赚钱,更是要与客户共同发展,共创价值。
“云上AI”是实现AI普惠的最好方式。云的出现,让诞生60多年的语音技术从少数人掌握的高端工具变成了人人可用的“平民技术”。而AI的认知化升级,也更好地为生态赋能。
虽然短期来看,在AI领域,主流趋势仍是私有化部署。但云服务、混合云的浪潮也将带动AI云服务市场的快速增长。随着技术的升级,未来3-5年,今天用户已经部署的AI产品,也有可能被新一代更智能的产品替代。让我们做好准备迎接新一代认知AI云产品的到来。
发表评论
暂时没有评论,来抢沙发吧~