「AI ProCon 2019」

2019 AI开发者大会(AI ProCon 2019)是由中国IT社区CSDN主办的AI技术与产业年度盛会。多年经验淬炼,如今蓄势待发:2019年9月6-7日,大会将有近百位中美顶尖AI专家、知名企业代表以及千余名AI开发者齐聚北京,进行技术解读和产业论证。我们不空谈口号,只谈技术,诚挚邀请AI业内人士一起共铸人工智能新篇章!

图文直播
  • 17:25

    【自然语言处理论坛】下午的第四个演讲由XLNet作者,睿科伦智能联合创始人杨植麟带来,他的演讲议题是《自然语言理解模型XLNet》。

    对于NLP落地的思考和实践,他把NLP分为四大技术阶段:传统技术、预训练、+AutoML和Human in the loop。他还说道,NLP的本质是把非结构化的数据结构化,从而产生智能。在杨植麟看来,NLP可以分为四个市场阶段:存量的文本非结构数据、存量的全渠道非结构化数据、增量的全渠道非结构化数据、线上线下融合&人机结合,未来,NLP市场化一可以向模化量产的方向前进,二是除了文本本身,我们更当关注全渠道市场,以更好地实现落地。

  • 17:10

    【自然语言处理论坛】接下来,新浪微博机器学习团队AI Lab负责人张俊林带来了题为《Bert和Transformer到底学到了什么?》的演讲。

    他首先介绍了BERT的基本原理、流程、优点、缺点、改进点,BERT与Transfomer之间的关系,以及BERT到底比之前的RNN、CNN等传统方法多学到的知识。就此他得出了一些关于Transformer和BERT到底学了什么的结论,如第一层编码层主要学习自然语言表层特征,中层学编码句法信息,高层学到编码语义特征。

    他表示,目前关于BERT的研究还不够细致,还需要做更深入的探索,相信未来会出现更多、更好的研究和成果。

  • 17:03

    【机器学习论坛】杭州灵西机器人首席科学家王灿的议题是《3D机器人视觉在工业自动化和仓储物流领域的应用》。王灿介绍了3D视觉、人工智能和工业机器人的结合而成的“3D机器人视觉”技术,3D机器人视觉让工业机器人等自动化装置能以更高精度、更快速度执行更复杂的工作,是产业自动化升级乃至将自动化技术推向更多产业领域必不可少的一环。

  • 17:00

    【自然语言处理论坛】最后一位分享的嘉宾是科大讯飞 AI 研究院资深研究员崔一鸣,他的主题演讲是《基于深度学习的机器阅读理解》,本议题聚焦基于深度学习的机器阅读理解技术,重点介绍近期在自然语言处理领域非常热门的基于预训练的深度学习方法及其在机器阅读理解领域中的应用,并同步介绍相关中文信息处理的研究发展。

    机器阅读理解(Machine Reading Comprehension)是让机器阅读并理解给定的文本并且能够回答与文本相关的问题,是目前自然语言处理领域最受关注的任务之一,也是认知智能中的典型任务。

    崔一鸣表示机器在某些数据上已超过“人类水平”,但绝非代表机器已经具备足够的理解能力,机器在依靠“匹配”等简单模式的阅读理解任务中表现优异,但涉及多句推理的情况,机器并不能够给出满意的结果。未来发展中,我们需要设计更加精妙的预训练方法以及预训练模型的压缩。需要关注跨语言方法,通过“借力”的方式提升稀缺资源语种的系统性能。最后,探求“可解释”的阅读理解,为用户提供更为可靠的人工智能技术。

  • 16:40

    【计算机视觉论坛】Google研发产品经理杨民光分享了Google的开源跨平台多媒体机器学习模型应用框架MediaPipe。

    MediaPipe是一个针对机器学习工程师和研发人员的多媒体机器学习落地框架,用来帮助建立感知流水线。这个框架从2012年就开始研发,在谷歌内部用来做视频和音频方面的落地场景,比如YouTube,YouTube每分钟上传两三千个小时的视频,Google要用机器模型看这个视频是否有黄色和暴力,处理视频正是MediaPipe。

  • 16:38

    【机器学习论坛】滴滴出行资深软件工程师唐博分享了《滴滴机器学习平台k8s落地与实践》,唐博从滴滴机器学习平台的特点开始探讨,分享了滴滴机器学习场景下的k8s落地实践与二次开发的技术实践与经验,包括平台稳定性、易用性、利用率、平台k8s版本升级与二次开发等内容。此外,唐博还介绍了滴滴机器学习平台是如何从yarn迁移到到k8s的,以及yarn的二次开发、与k8s的对比等。最后,他与大家分享了滴滴机器学习平台正在研发中的功能以及未来展望。

  • 16:15

    【自然语言处理专题】百度NLP主任研发架构师、语义计算团队负责人孙宇带来主题演讲《百度语义理解框架ERNIE》,本次演讲主要介绍百度语义表示技术发展脉络、ERNIE技术原理及其应用实践。

    孙宇表示,语言表示是解决自然语言理解的首要问题。其挑战主要为自然语言存在基本单元一词多义、多词同义,句子表述无限等特性。

    据介绍,百度于今年7月升级ERNIE技术,发布持续学习语义理解框架 ERNIE 2.0,同时借助飞桨高效分布式训练优势发布了基于此框架的 ERNIE 2.0 预训练模型。该模型在共计 16 个中英文任务上超越了 BERT 和 XLNet,取得了 SOTA 效果。

  • 16:05

    【计算机视觉论坛】华为云OCR人工智能高级算法工程师王晶讲述了文字识别服务的技术实践、底层框架及应用场景。

    他认为,不只是OCR产品,而是所有人工智能产品或其他产品都需要走这样的路。第一条路是要持续突破新场景,要识别分子式,希望把证件类和票据类的APR归一,很多公司都希望用一个模型包打天下,省时省力。其次是推理和训练速度要持续优化,因为训练速度的提高意味着产品更快的迭代,而推理速度的提高意味着成本更可控。

  • 16:05

    【AI+小程序技术专题】微软(亚洲)互联网工程院人工智能语音团队首席研发总监赵晟、微软(亚洲)互联网工程院 Office 365资深产品经理,Office 小程序负责人张鹏发表《微软语音AI与微软听听小程序实践》的主题演讲,分享微软人工智能语音的技术以及微软听听小程序的落地实践。

    赵晟表示,微软在30年前开办微软研究院时便已开始投入大量的人力物力在语音和语言的技术上,近几年来,在语音识别首先取得突破,在2018年9月,语音合成发布了基于神经网络的GPS,它的自然度有98.6%接近人类。

    目前微软的语音服务在微软Azure平台上,提供语音转文字、文字翻译等标准服务。接着赵晟分享语音合成平台集成最新的神经网络合成技术,在微软神经网络TTS自然度评测上有较高的评分。他还现场演示了基于神经网络TTS的多风格声音,中文晓晓风格合成的样例。

    谈及具体的应用实践,张鹏分享微软听听文档小程序便是使用微软AI语音系统技术,实现AI朗读PPT备注功能与AI朗读公众号文章功能,让每个人都能轻松做出专业的语音文档。

    最后,张鹏谈到微软Office微信小程序本地化策略方向有:一是信息输入,例如微软AI识图小程序;二是信息管理,例如微软Office文档小程序;三是信息输出,例如微软听听文档。

  • 15:30

    【自然语言处理论坛】百度NLP主任研发架构师,语义计算团队负责人孙宇带来主题演讲《百度语义理解框架ERNIE》,本次演讲主要介绍百度语义表示技术发展脉络、ERNIE技术原理及其应用实践。

    语言表示是解决自然语言理解的首要问题。其挑战主要为自然语言存在基本单元一词多义、多词同义,句子表述无限等特性。将语言符号“表示”为另一种形式,这种表示具有语义上的等价性,更好的可计算性,更好地把握语义信息是其目标。

    据介绍,百度于今年7月升级ERNIE技术,发布持续学习语义理解框架 ERNIE 2.0,同时借助飞桨高效分布式训练优势发布了基于此框架的 ERNIE 2.0 预训练模型。该模型在共计 16 个中英文任务上超越了 BERT 和 XLNet,取得了 SOTA 效果。

    针对ERNIE的应用案例,孙宇例举多个案例,案例之一便是度小满的用户风控,在面对性能不敏感的问题时,传统方法的问题是传统风控模型依赖于特征挖掘,以及有标注的用户数据稀缺。而基于 ERNIE后,小规模标注数据即可训练,并且不依赖特征挖掘;非高频场景可以实时计算;Fine-tuning 直接使用 AUC 提升显著;25%的用户排序得到优化。

  • 15:28

    【机器学习论坛】上汽集团云计算中心AI应用部门技术负责人任如意和ThoughtWorks AI系统架构师廖国龙合作,分享了《如何构建面向大型制造业的一站式AI工作平台》。为了支持上汽集团在自动驾驶、智能制造等领域的探索和落地,上汽帆一尚行和ThoughtWorks合作开发了iGear,一个全流程的AI工作平台。iGear主要分为数据平台和计算平台两大部分,数据平台管理海量的数据资源,包括PB级的数据存储和管理、素材的管理和标注服务;计算平台管理异构计算节点和任务分配,负责GPU算力调度、模型训练、AI科学家进行开发调试、模型发布、模型压缩等。基于iGear,可以方便地进行AI系统研发和构建行业智能化解决方案。

  • 15:25

    【自然语言处理论坛】新浪微博机器学习团队AI Lab负责人张俊林带来了题为《Bert和Transformer到底学到了什么?》的演讲。

    他首先介绍了BERT的基本原理和流程,以及其优缺点,BERT与Transfomer之间的关系,以及BERT到底比之前的RNN、CNN等传统方法多学到的知识。就此他得出了一些关于Transformer和BERT到底学了什么的结论,如第一层编码层主要学习自然语言表层特征,中层学编码句法信息,高层学到编码语义特征。

    他表示,目前关于BERT的研究还不够细致,还需要做更深入的探索,相信未来会出现更多、更好的研究和成果。

  • 15:20

    【AI+小程序技术专题】腾讯云 小程序·云开发+AI方向核心研发工程师杨航发表《云开发的小程序AI技术方案实践》的主题演讲,分享云开发如何助力开发者在小程序AI技术上更好地开发实践。

    杨航介绍道,云开发是支持小程序、Web等多端的应用开发平台。在传统模式下,开发者想开发一个小程序,需要首先引入SDK或编写SDK来请求服务器、搭建服务来操作底层的存储资源等,后续还要花费很多运维精力。而云开发基于腾讯云提供基础服务,并提供云数据库、云存储、云函数等开发运维能力,让开发者更专注于自己业务逻辑。

    目前小程序在AI技术应用上遇到的问题有:一是包体积限制2M大小,多数算法库或机器学习框架都较大,资源紧张时甚至难以清理空间以引入本地AI计算能力;二运行效率低;三是网络状况差。

    对此,云开发为降低开发者在小程序端使用AI能力的门槛,从开发能力上支持更多的开发语言,云函数支持Java、PHP等;实现一云多端,支持多客户端访问。提升深度广度,满足不同场景下开发者对AI能力的需求,打造一站式解决方案。从接入方式上,扩展 CLI+SDK 的服务接入方式,满足开发者可编程管理的需求。除封装独立云函数外,还将采取插件的形式组合自定义组件、客户端SDK与云存储、云函数等云端资源,提供更高层级、更完备的接入。

  • 15:00

    【计算机视觉论坛】旷视研究院主任研究员、基础模型组负责人张祥雨分享了高效轻量级深度模型的研究与实践。

    他提到了六点高效模型设计的基本思路。第一点是直接设计一个轻量级架构,第二点是可以设计一个相对比较重量级的架构,但是通过一些模型裁剪的方法把它裁下来,得到一个能在端上实时跑的。第三种可以建立一种模型搜索,利用模型搜索的方法自动完成模型设计和设备匹配。还有一些其他的思路,比如低精度量化,浮点运算通常比较慢,旷视倾向于用低精度也可以实现很明显的加速,此外,还可以用知识蒸馏或高效的底层实现进行模型加速,旷视会使用这六种甚至更多的方案综合进行模型的设计。

    在他看来,目前在轻量级模型设计这个领域基于模型搜索的方法已经成为了目前的主流,也是最重要的研究方向。在实践中会发现模型搜索对设备适配尤其是寻找对于具体设备上运行时间最快、功耗最少的模型,相对于人工有非常大的优势,但是也有很多问题,搜索空间现在还是依靠人工设计,搜索空间的设计非常依赖经验,并且没有好的指导原则,这是未来的研究方向和难点。

  • 14:47

    【机器学习论坛】知乎算法团队负责人孙付伟分享了《Graph Embedding及其在知乎的实践》。Graph Embedding 技术是一种将图的拓扑结构进行向量表示的方法,从而获取到网络关系信息,应用于推荐等多种场景;在本报告中,孙付伟重点讲了Graph Embedding 技术,以及在知乎的具体实践,包括知乎用户 embedding 的实践和在在知乎收藏夹数据中的应用。未来,知乎还计划用Graph Embedding 进行会员购买预测,以及个性化推送的召回(目前已经上线)。

  • 14:45

    【自然语言处理论坛】微软小冰全球首席架构师及研发总监周力以《全双工语音对话以及在智能硬件上的应用》为题,与现场的开发者分享了全双工技术的应用与普及,重点介绍了全双工语音的发展之路。他表示,人工智能对话技术及自然语言处理的新挑战诸多,利用全双工语言对话可以轻松解决这些困难。

  • 14:15

    【AI+小程序技术专题】小米资深软件高级工程师,快应用框架技术总负责人杨亮发表《快应用助力AI服务落地》主题演讲,分享快应用的技术和如何助力AI服务落地实践。 杨亮表示,当前App的生态有分发困难、应用孤岛、内容冗杂、设备特定的问题,难以满足智能化服务的需求。而基于手机+IoT硬件平台的新型应用形态——快应用,其拥有服务矩阵、场景融合、多样终端的生态能力和即点即用、原子服务的基础能力,使得快应用更满足智能化服务的要求。 例如,使用快应用+卡片帮助智能助理来融合第三方的服务,实现了各种场景化的服务形态。具体技术实现先是通过算法建议、状态追踪以及用户订阅的方式向用户推荐其最需要的服务,然后将所有服务整合,重要信息放在最上面进行信息提示,这样用快应用卡片的形式展现来自很多第三方应用的各类服务,提升用户的使用体验。

  • 14:10

    【计算机视觉论坛】下午,计算机视觉论坛首位演讲嘉宾是图森未来合伙人&首席科学家王乃岩,他分享了图森未来无人驾驶技术实践。

    为什么图森未来会选择卡车货运的场景?王乃岩解释称,一个最重要的原因是商业场景是成立的,对于出租车来说场景很复杂,至少是一个城市的级别,对于干线运输来说需求非常简单,在一条道路上从A点到B点不会有多样化的需求,简化的需求恰恰是AI落地非常重要的因素,卡车货运会是自动驾驶行业尤其高级别自动驾驶行业中最希望率先落地的场景。

    图森未来把无人车系统分为四部分,感知、定位、路径规划、车辆控制。感知过程中,要做的是融合不同传感器完成感知车辆周围环境和状态,为后面的决策规划输出合适表示。在定位阶段,不同于拿出手机做导航的定位,他们在无人车做的定位是遥感车辆相对道路的基准。再往下的模块是路径规划,首先是融合前面两个模块输出做出下一步行驶决策,然后根据这样的决策会生出一条车辆可知性的最优轨迹。最后一部分是车辆控制,执行规划计划的轨迹,输出车辆控制量。

  • 13:30

    【自然语言处理】微软小冰全球首席架构师及研发总监周力以《全双工语音对话以及在智能硬件上的应用》为题,与现场的开发者分享了全双工技术的应用与普及,重点介绍了全双工语音的发展之路。

    2018年,微软小冰正式宣布上线共感模型,同时也开始公测一种融合了文本、全双工语音与实时视觉的新感官。据介绍,这项新技术可以实时预测人类即将说出的内容,实时生成回应,并控制对话节奏,从而使长程语音交互成为可能。而采用该技术的智能硬件设备不需要用户在每轮交互时都说出唤醒词,仅需一次唤醒,就可以轻松实现连续对话,使人与机器的对话更像人与人的自然交流。

    人工智能对话技术及自然语言处理的新挑战诸多,利用全双工语言对话可以轻松解决这些困难。首先,边听边想的预测模型,需要铺垫回复以预估高延迟的缓解体验,以及意图执行回复,以优化远程任务体验。其次,非对称对话下的主导模式,可以达到主导对话,让对话更加智能;第三,对话的节奏控制,全双工智能对话中,说话的时机变得和说话的内容同等重要,AI将会与自己和用户进行节奏协调。

  • 13:30

    【AI+小程序技术专题】Google Brain 工程师,TensorFlow.js 项目负责人俞玶发表《TensorFlow.js遇到小程序》的主题演讲,分享TensorFlow.js的技术实现和与微信小程序相结合的落地实践。 俞玶介绍道,TensorFlow.js 是为JavaScript定制的机器学习平台,为JavaScript 开发者提供简洁高效的API。提供图像分类、物体识别、姿态识别、语音命令识别、文字分类这五类模型,并支持多平台的使用。 谈及TensorFlow.js和微信小程序结合的落地实践中,俞玶举例道,动态虚拟试妆小程序在开发中遇到手机适配、微信对插件的JavaScript文件有大小的限制等问题,后采用TensorFlow.js技术,从模型、框架中优化该小程序,让其成为至今已来最小、最快的虚拟试妆程序。 谈及未来,俞玶表示TensorFlow.js将会为更多的试用场景提供模型和解决问题的例子程序;后续将开发支持AutoML,为定制模型提供APIs;加强服务器端推理执行的性能和可用性;用最新的技术提供性能优化;还将会支持更多的JavaScript运行平台(例如支付宝小程序等)。

  • 11:35

    【机器学习技术专题】第四范式资深AI架构师陈迪豪的议题为《快速构建高性能AI应用——AI特征数据库技术实践》。陈迪豪讲道,随着数据高速增长,AI进入大规模应用时代,而AI应用开发却着面临一致性和实时性的巨大挑战。

    一方面,数据一致性问题为AI应用开发带来不可预测的风险,而现有方案一般通过开发者人力进行模型转换及一致性校验,成本高且难以复用。

    另一方面,在AI应用中使用线上实时数据提升模型效果成为趋势,但该系统开发难度大周期长,需投入大量人力才能达到预期效果与性能。

    第四范式AI特征数据库采用独有的AI存储计算一体化架构,通过线上线下同源解析保证数据一致性,通过将毫秒级变化作为特征自动入模降低AI生产级实时应用开发成本。开发者使用第四范式的AI特征数据库,只需编写离线调研脚本,即可快速构建线上线下数据一致的高性能实时AI应用。

  • 11:35

    【自然语言处理论坛】上海瓦歌智能有限公司总经理、狗尾草科技人工智能研究院院长邵浩发表了《自然语言处理在虚拟生命中的工程实践》主题演讲,分析了现阶段自然语言处理产品的技术瓶颈,提出针对性的解决方案。邵浩说,现在我们周围有很多聊天机器人产品,但目前有不好用、担忧隐私泄露等问题,我们的期望值没有被满足。

    邵浩认为,聊天机器人由多模态输入、自然语言理解、对话管理、自然语言生成、多模态输出构成的典型架构是“缺少灵魂的”。目前我们处于虚拟生命的1.0状态,他想做一款不仅是关注聊天本身,还具有看、听、说、动作、思考能力的下一代聊天机器人的产品。接下来他分享了他们在自然语言处理上的突破,包括预训练语言模型在语义表示、文本的向量表示、Matching等方面的技术。他们还运用深度学习+知识图谱技术来更好地理解用户,开发出新智能音响产品“HE叶修”。

  • 11:30

    【AI+DevOps】阿里巴巴高级技术专家滕圣波以《阿里云智能运维的自动化三剑客》为题,与现场的开发者分享了阿里云与智能运维的发展之路,并重点介绍了自动化的三剑客。

    首先,滕圣波介绍了阿里云和智能运维发展之路。据介绍,从运维到SRE,无人值守是目的、自动化是无人值守的手段、人工智能是自动化的手段之一。其中,无人值守的最后一公里由客户侧运维开发。

    接下来,滕圣波重点介绍了自动化三剑客,包括弹性伸缩、资源编排与运维编排。基于AI预测的弹性伸缩,智能预测模式中,可以做到预测业务变化智能调整实例数量,结合目标追踪模式完美贴合业务变化;自动化三剑客之资源编排,阿里云资源编排-ROS,提交代码资源自动修改,版本化管理,随时回滚,Copy/paste完成资源成套复制;自动化三剑客之运维编排,为应对运维各种困境,阿里云运维编排服务-OOS,是阿里云官方的DevOps运维平台,全免费,其高效率的Serverless执行引擎,有着高可靠的特性。

  • 11:15

    【计算机视觉论坛】商汤科技研究总监石建萍则以《视觉感知驱动的量产自动驾驶》为题主要介绍了商汤在智能驾驶上的主要方向,第一是非常重要的ADAS驾驶辅助系统的量产方向,以模块级别装到汽车上,要达到精确识别检测,预警及时且准确率高,车规级标准,灵活易部署;第二是做自动驾驶的研发,以计算机视觉为主、多传感器融合的自动驾驶解决方案。第三是基础技术,包括大数据、自研深度学习系统、自研FPGA计算平台。

  • 10:50

    【AI+DevOps】华为云运维服务产品经理徐博以《云原生应用AIOps技术与实践》为题,立足于云原生应用AIOps技术,围绕运维介绍了华为云近几年的相关成果,并与现场的开发者分享了利用AI提高运维的主要方式。

    越来越多企业选择将应用托管上云或开发云原生应用,享受云计算提供一站式资源申请和各种云原生接口的便利。由于应用与各类云服务之间产生了紧密的联系,运维产品需要关注应用与云资源的运行状态,包括产生的各类指标、告警、事件与日志等,当应用异常时能帮助企业快速找到异常的根因,华为云AIOps团队在不断探索各类方法解决这类问题,包括建立应用与资源的关系,通过AI算法减少告警风暴,并洞察到异常的根因。

    最后,徐博总结智能运维的挑战,首先,商业价值场景,解决客户的痛点,AI只是一种技术,需要商业场景来匹配。其次,运维知识库,AI算法不理解数据业务属性,需要运维知识作为辅助;第三,算法高效准确,基于大数据运算平台,算法与场景完美结合。

  • 11:00

    【自然语言处理论坛】思必驰副总裁、北京研发院院长初敏的分享主题为《对话智能中的技术与实践艺术》。 初敏表示,现在她有两个身份,不仅要做研发,还带了一个事业部,所以很关心真正的技术如何在商品和商业化中应用。今天的报告侧重点从应用的角度切入,探讨如何在应用场景使用对话智能。

    她表示,在此前的大浪潮中,大家关注语音识音、唤醒等基本的语音能力,当这样的能力达到可以很好地解决实际问题之后,最终智能对话是否好用,对话中的机器人是否聪明、在机器和人对话中展现出来的智能程度,会对后续产生非常大的影响。初敏认为,人机语音交互越来越重要了,思必驰的视角是帮助企业提高优化效果。语音交互中一个典型的场景是呼叫中心,其中人机语音交互可以发挥很大的作用。未来很多工作大部分都可以交给机器人,可以降低很多场景的人工成本。再如在企业内部,企业大了以后,企业内部的信息沟通非常复杂,公司的 OA 系统、财务、人事、IT等各种问题都很麻烦。这时,通过语音交互、知识沉淀,加上语音对话可以很大地提升效率。

  • 10:45

    【机器学习技术论坛】RealAI(瑞莱智慧)CEO 田天在《第三代AI思考与实践》的主题演讲中提出了自己的见解:第一代是知识驱动的符号模型,最具典型的是逻辑专家系统,但基于规则和知识驱动的系统很难做到比较大的规模。统计学习方法,包括深度学习方法,则属于第二代人工智能。但是以深度神经网络为代表的第二代AI存在不可靠、不安全、不可解释等缺点,RealAI针对这些问题提出了贝叶斯深度学习等应对方式,并在金融、工业等垂直行业得到应用,报告分还享针对AI技术发展趋势的展望。

  • 10:30

    【计算机视觉论坛】百度视觉技术部主任架构师,视频基础技术团队技术负责人文石磊为现场观众介绍了互联网视频基础技术探索和应用。

    基于百度丰富的视频应用场景,什么样的技术来支撑应用?文石磊解释,与互联网视频相关的技术分为视频理解、视频编辑、算力优化。视频理解分三个内容,第一是视频分类/检测/摘要/垂类,第二是做多模态融合和知识图谱,我们看到视频内容不仅有图像还有语音、标题,这些不同的信息资源该怎么融合,基于视频得到的标签如何结合构建好的知识图谱都是热门内容。

    他还介绍了飞桨深度学习平台中与视觉相关的内容,关于PaddlePaddle推理效率,他指出模型库里视觉算法模型都会开放在PaddleCV里面。再往上是工具组件,目标是降低门槛,用户只需要十行代码就可以定制一个自己的模型。再往上走是EasyDL和AI Studio提供免费的算力算法供开发者使用。

  • 10:30

    【自然语言处理专题】上海瓦歌智能有限公司总经理,狗尾草科技人工智能研究院院长邵浩发表《自然语言处理在虚拟生命中的工程实践》主题演讲,分析了现阶段自然语言处理产品的技术瓶颈,提出针对性的解决方案。 邵浩说,现在我们周围有很多聊天机器人产品,但目前有不好用、担忧隐私泄露等问题,我们的期望值没有被满足。 邵浩从技术上介绍聊天机器人的典型架构,是由多模态输入、自然语言理解、对话管理、自然语言生成、多模态输出构成,但他说这样的聊天机器人是“缺少灵魂的”。目前我们处于虚拟生命的1.0状态。 所以他想做一款不仅是关注聊天本身,还具有看、听、说、动作、思考能力的下一代聊天机器人的产品。接下来他分享了他们在自然语言处理上的突破,包括预训练语言模型在语义表示、文本的向量表示、Matching等方面的技术。他们还运用深度学习+知识图谱技术来更好地理解用户,开发出新智能音响产品“HE叶修”。

  • 10:00

    【AI+DevOps】饿了么高级架构师孙立伟以《饿了么可拆分微服务的单体应用(EMMF)实践》为题,立足于可拆分微服务技术,结合饿了么实际应用案例,与现场的开发者分享了其单体应用(EMMF)实践。

    EMMF(Eleme Modular Monolith Framework )是一个模块化的单体应用框架,支持业务系统以模块化的方式构建一个单体应用。基于EMMF的业务模块,可独立的,自动化的拆分成一个微服务进行独立部署。使业务系统具备单体应用的管理简单、快速迭代的特点的同时,也支持拆分成多个微服务的方式部署,以满足业务系统不断发展的需要。同时也提高了业务系统的可测试性。一个业务的多个微服务,能够更容易的合并在一起进行测试工作。

    孙立伟强调,我们真正需要的是“模块化”,其实现要点主要包括“模块化”开发、依赖Spring Boot的自动化配置机制、依赖Gradle强大的脚本能力、智能的API网关、完善的自动化构建部署系统。如何实践?通常情况下,让系统机制自己起作用;绝不容忍错误的业务数据;Bean Validation Framework;在系统最外层try-catch,确保进程不退出或崩溃。

  • 09:55

    【机器学习技术论坛】第一位演讲嘉宾是好未来 AI Lab 算法科学家杨非,他的议题是《人工智能在教学场景中的应用》。杨非表示,目前用技术推动教育进步的过程可以分为三个阶段,我们还处于教学辅助阶段,比如通过OCR技术拍照判题。下一阶段属于价值创造阶段,更多AI能力将贯穿整个场景,比如对学习过程进行评价,对学习全流程进行管理。再下一阶段是因材施教阶段,希望AI技术可以帮助学生自适应学习,通过AI的方式,让老师和学生互动。

  • 9:45

    【计算机视觉论坛】首先上场的是快手硅谷实验室负责人王华彦,他以《端上视觉技术的极致效率及其短视频应用实践》为题做了演讲。

    王华彦表示,端上视觉短视频的应用场景带来的技术挑战有三方面:第一是不可控的复杂场景和环境;第二是极为有限的移动设备计算资源;第三是由于所有应用都是时效性很强的 。

    为了解决这些挑战,快手的解决方案和研究方向有三个要素:第一是运用高度结构化的模型和充分利用先验知识;第二是面对计算资源的紧缺,需要充分发掘各种冗余来提高算法的推理效率;第三是用高度结构化的信息表示提高学习算法利用数据的效率,第三是快速开发和部署的需要。

    在他看来,如果希望像人一样高效的从很少的数据或者虚拟的数据中学习,我们就需要分解的本事,把视觉信息分解为形状轮廓信息和颜色纹理的信息,对于很多任务来说只有形状轮廓是有用的,颜色和纹理不是那么重要的,通过把不同属性的信息分解出来我们才能在不同样本中有效建立联系,从而提高学习的效率。

  • 09:45

    【自然语言处理专题】思必驰副总裁、北京研发院院长 初敏做《对话智能中的技术与实践艺术》的主题演讲。 初敏表示,现在她有两个身份,一个是做研发,自己带了一个事业部,所以很关心真正的技术真正如何在商品和商业化中应用。今天的报告侧重点是从应用的角度切入,探讨如何在应用场景使用对话智能。在此前的大浪潮中,大家关注语音识音、唤醒等基本的语音能力,当这样的能力达到可以很好地解决实际问题之后,最终智能对话是否好用,对话中的机器人是否聪明、在机器和人对话中展现出来的智能程度,会对后续产生非常大的影响。 初敏认为,人机语音交互越来越重要了,思必驰的视角是帮助企业提高以傲虎的效果。语音交互中一个典型的场景是呼叫中心,其中人机语音交互可以发挥很大的作用。未来,未来很多工作大部分都可以交给机器人,可以降低很多场景的人工成本。再如在企业内部,企业大了以后,企业内部的信息沟通非常复杂,公司的OA 系统、财务、人事、IT等各种问题都很麻烦,这时,通过语音交互、知识沉淀,加上语音对话可以很大地提升效率。

  • 9:10

    【AI+DevOps】京东数科资深技术架构师、应用架构部负责人王超以《运维的数据化与智能化转型》为题,与现场的开发者分享了结合生产实践,阐述运维中的痛点问题是如何通过大数据,智能化的方式优化的,以及相关的AIOPS平台是如何建设如何运用的。

    京东数科有着非常复杂的运维场景,数千的微服务应用,十几万应用实例,既要保障业务的可用性,也需要结合运行数据和业务增长的预测,合理的控制容量和成本。 

    为什么运维需要数字化转型?王超表示我们正处于VUCA时代,面临着易变性、不确定、复杂、模糊的现实问题。那么解决以上问题,需要我们有主动的心态、敏捷的行动、洞察方法以及预见目标。在出现问题之前发现它,这种前置性与预期性,将为运维与更多工作带来更好的效率。其中,实时监控数据分析中的落地场景APM应用性能监控,可以提供秒级分析海量方法调用量和延时,智能调用链分析和容量规划,结合日志、告警快速定位问题,以及快速定制业务类监控-银行大盘。

    为什么运维需要智能化?运维的智能化可以做到智能基线、更快发现问题、避免误报、减少人工投入。基于此,王超介绍了闭环智能监控、基于调用链的根因分析、基于多维下钻的根因分析、容量规划等处理方法。

  • 09:00

    【AI+DevOps】DevOps、AIOps是近些年来非常火热的话题。为此,本论坛主要就AIOps、DevOps理念,AIOps和DevOps的挑战和机遇,AIOPs和DevOps落地实践以及AI在开发和运维中发挥的重要作用和具体实践为主要内容,重点探讨AI与开发以及运维的结合。

    9月7日上午《AI+DevOps技术专题》论坛,在中通商业CTO黄哲铿的主持下,如期开始。本论坛相关精彩分享敬请期待。

  • 09:00

    【自然语言处理专题】华为诺亚方舟实验室语音语义首席科学家刘群发表《预训练语言模型的研究与应用》主题演讲,分享华为诺亚方舟实验室在预训练语言模型的研究和应用实践。

    刘群表示,预训练语言模型本身就是神经网络语言模型,它有个很大的优点是使用大规模无标注纯文本语料进行训练。诺亚方舟实验室在预训练语言模型的研究上,完成在内部的服务器上重现Google BERT-base和BERT-large的实验,还利用BERT的代码,实现了OpenAI GPT-2模型等工作。

    在预训练语言模型的应用上,他们推出了中文预训练语言模型“哪吒”;将实体知识融入BERT并开发了“ERNIE”;基于GPT模型的中国古诗词生成方法,推出“乐府”作诗机,在场同学立即玩起“乐府”来。

    谈及未来,刘群表示他们将会研究更好、更强大的预训练语言模型,融入更多的知识,跟语音和图像进行结合后,希望能应用到更多领域。另外在模型压缩和优化方面的研究期待能在终端落地。目前他们和华为海思合作,把预训练语言模型在华为自己的芯片上实现,以后大家可以在手机上看到其预训练语言模型。

  • 09:00

    【机器学习技术专题】由北京一流科技有限公司创始人袁进辉作为出品人,该专题聚焦的是机器学习在产业落地中的实际挑战。

  • 17:40

    【5G驱动AIoT技术论坛】金山云AIoT事业部高级研发总监肖江,在5G驱动AloT技术论坛上,发表了以《5G+AIoT 在智慧社区领域的技术实践和应用》为主题的演讲。他提到,金山云做智慧社区的Goal是什么?物业希望能够精准服务业主,通用的思维方式就是给业主和物业App互动和联动,这样才能及时响应,业主需要进到这个小区完全Free,一个是自由,一个是免费,不需要任何门禁,通过一张脸就可以从小区门口回家,通过语音呼叫让所有设备为自己服务,进到家门之前所有的空调和电视都打开,也希望有一个很安全的环境,摄像头无死角地提供监控。地产商需要提高附加利润,现在我们正在落地的项目也是一个地产项目,通过这个项目能够打造智慧社区的形象,现在已经有越来越多的新项目,会向外输出。

  • 17:35

    【5G驱动AIoT技术论坛】华为IoT标准产业与创新总监张朝辉,在5G驱动AloT技术论坛上,发表了以《5G时代的爱(AI)如何在物联中轰轰烈烈》为主题的演讲。他表示,大家都说互联网业务是羊毛出在猪身上,其实从通信的角度来看也不新鲜,几十年前就已经发生。GSM当时在开始研发的时候,其需求来自欧洲的铁路系统,最开始就是需要组建一个专用的系统,后来大家从成本和监管、资源方面考虑,就是要用民用的通信系统承载这些业务,所以当时铁路系统的发展也是一个很大的促进。现在来看GSM行业发展非常成功,但最开始的时候大家都不愿意去投,当时日本开发了小灵通技术,GSM当时没有怎么开发,成熟度也是比较高的,主要也有通信系统在用,而现有的技术已经在占有大量市场。

  • 17:10

    【推荐系统论坛】时间飞快,本论坛的最后一位嘉宾华为诺亚方舟实验室推荐与搜索项目组资深研究员唐睿明带来了题为《推荐系统中的前沿技术研究与落地:深度学习、强化学习与AutoML》的演讲,介绍了华为诺亚方舟实验室在深度学习、强化学习与AutoML结合上的最新进展,如聚焦在建模特征之间相互关系的PIN模型,交互特征自动化探索AutoGroup,正在计划进行的AutoML工作等。

    唐睿明表示,他们的团队想要解决推荐系统里比较复杂的问题,推荐系统直接推荐商品的侯选集比较大,达到几千或者几万的规模,这种侯选集对于一般企业来说是无法承受或者训练不了的。华为的想法很简单,先用公开数据集进行预训练,建出一棵树,树的叶子节点代表代售的产品,树的非叶子节点,从根走到叶子节点,走到哪个叶子节点就推荐哪一个。沿着根节点走到叶子节点的概念,就是中间小的Policy输入的层级。最终,推荐也是用叶子节点中所有的Policy进行推荐。入股觉得数量太多,每一个节点分几个子节点,树大一点就可以了。

    总结起来就是,深度学习算法将成为业界主流,平台+算力+算法+数据是深度学习推荐系统能力的核心竞争力。

  • 17:00

    【AI开源技术论坛】最后一位登场的嘉宾,是华为MindSpore资深架构师于璠带来的《MindSpore计算框架创新技术介绍》的主题演讲。为我们分享了华为AI战略与解决方案的进展,并详细介绍了MindSpor计算框架创新技术。

    AI行业研究到全场景应用存在巨大鸿沟,开发门槛高、运营成本高、部署时间长的业界挑战;新编程范式、新执行模式、新协作方式的技术创新,促使着MindSpore跨越应用鸿沟,助力普惠AI。

    于璠详细介绍了MindSpore的设计理念,第一,新编程范式,AI算法即代码,降低AI 开发门槛;第二,新执行模式,Ascend Natave的执行引擎;第三,全场景按需协同,更好的资源效率和隐私保护。值得注意的是,全场景支持,是在隐私保护日渐重要的背景下,实现AI无所不在越来越基础的需求,也是MindSpore的重要特色。针对不同的运行环境,MindSpore框架架构上支持可大可小,适应全场景独立部署。MindSpore框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而不是数据本身,以此实现在保证用户隐私数据保护的前提下跨场景协同。除了隐私保护,MindSpore还将模型保护Built-in到AI框架中,实现模型的安全可信。

  • 16:50

    【知识图谱专场】美团点评 NLP 中心知识图谱团队负责人张富峥做《生活服务领域知识图谱的构建及应用》主题演讲,分享美团点评的生活服务知识图谱“美团大脑”,在搜索推荐的技术实现与赋能商家的落地场景。 美团大脑通过充分挖掘美团点评各业务场景公开的数据,构建餐饮娱乐知识图谱,并用AI赋能商家,改善用户体验。美团大脑由数据层、知识构建层、知识表示层、服务层、引擎层、应用层组成。在商品知识的挖掘、场景聚合、情感挖掘上均有优化实践。 此外,美团大脑在搜索推荐场景中有精确性、多样性、可解释性这三大应用:为商家和商品引入了更多的语义关系,深层次发现用户兴趣;提供不同的关系连接种类,利于搜索推荐结果的发散,避免结果越来越限于单一类型;连接用户的兴趣历史和搜索推荐结果,提高用户对结果的满意度。

  • 16:28

    【推荐系统论坛】接下来,京东高级总监殷大伟结合京东的工作,介绍了推荐系统在电商领域的应用。

    他说到,推荐系统有几个重要的场景,第一个场景是Front page,即基于用户画像无限制地推荐;第二个是product Page推荐,基于主商品进行推荐;第三是购物车推荐,根据购物车中的商品进行用户画像;以及基于订单完成的推荐,根据已购历史进行相关推荐。这几种场景在京东的底层技术都是通用的。在进入底层技术之前,殷大伟先介绍了工业界电商的架构。他表示,在工业界,电商的架构基本上是在数百亿级的商品中为用户推荐感兴趣的商品。在此过程中,京东用到了检索,如基于商品图谱(知识图谱)的方法,定位在商品上的关系,以及基于Embedding的方法。在排序上,他讲到了如何拍讯,以及李永强化学习进行排序等。

    因为电商场均考虑的因素非常复杂,如回归时长、APP驻留时长等,输入信号也相应非常复杂,京东会用Statc-action Embedding的方法,预测用户的驻留时长,并采取相应的措施。此外,推荐系统的多样性也很重要,京东会直接优化 User Egagement VSdiversity和浏览深度,推荐的多样性就可以显示出来。

  • 16:25

    【推荐系统论坛】快手科技的推荐架构负责人任恺分享了他在短视频推荐系统架构设计与前沿技术中的探索。近年来,短视频行业发展情况势头迅猛,日均时长快速增长5倍,现在日均时长在整个行业排名第二,仅次于通讯,月活用户是8.21亿。今年6月份,快手的日活突破了2个亿,对推荐系统提出巨大挑战。

    面对挑战,快手推荐系统不断演进,以适应庞杂的计算发展。发现原来的架构无法承载如此多的流量规模后,快手采用四个方向的手段,对整个推荐系统进行优化。首先,是采用多阶段的排序方式优化排序;第二,快手通过计算存储分离的形式提高拓展性,逐步对推荐系统各个服务进行拆分,使得每个服务单独进行扩展;第三,数据和模型实时化,把数据和模型的时效性推到极致,有效将最新最热的视频推荐给用户;第四,软件和硬件结合,异构计算与异构存储提升单机性能,在硬件发展中挖掘到新的性能,构建出更强大的推荐服务。

  • 16:20

    【AI开源技术论坛】 小米深度学习框架负责人何亮亮以《基于MACE深度学习框架的落地实践》为题,与开发者们详细介绍了MACE开源深度学习框架的设计思路,优化方法,以及典型应用案例。帮助开发者了解移动端深度学习框架的原理和特点,以及端侧深度学习应用的落地关键技术和实践,助力开发者更高效地开发端侧人工智能应用。

    会上,何亮亮主要分享了MACE的落地实践,在开发过程中,开发者常常会遇到硬件选型、框架适配、性能优化与工程部署四方面问题。对此,小米对外开源了Kaldi模型到ONNX模型的转换工具Kaldi-ONNX,有望进一步促进Kaldi生态与深度学习生态间的互通。同时,配合移动端深度学习框架MACE,将极大降低语音模型在手机与智能设备上的离线部署门槛,并大幅提升推理效率。由于将训练得到的Kaldi DNN模型部署到移动端设备上往往需要大量的移植开发工作。

    Kaldi-ONNX是一个开源的轻量化python脚本工具,可以用来将Kaldi的神经网络模型文件转换为ONNX格式模型。使用Kaldi-ONNX将Kaldi的神经网络模型转换成ONNX开源格式,一方面可以使用兼容ONNX的各种工具,如进行可视化检查或模型优化。另外转换得到的模型可以借助MACE或其他神经网络框架部署到Android,iOS,Linux/Windows或其他设备上,为开发者部署语音识别神经网络模型提供了更多框架或工具的选择。

    MACE(移动端AI计算引擎)框架已支持ONNX格式模型文件和Kaldi模型中常用的算子,因此推荐使用MACE来部署Kaldi的语音识别神经网络模型。同时MACE的Model Zoo项目里已经收录了数个转换好的Kaldi语音识别DNN模型。

  • 16:05

    【5G驱动AIoT技术论坛】云知声董事长、CTO梁家恩,在在5G驱动AloT技术专题论坛,发表了《5G 驱动 AIoT 多模态智能技术与应用》的演讲。他表示,目前AIoT的空间很大,但是我们仍然任重而道远,最大的挑战还是出现在应用阶段,到底什么样的应用,使得产业能够发生变化,形成一个很大的突破?如果这个规划不能解决的话,下面两个发展其实是很难的,如果业务起来以后,底层的支撑就有可能产生实质的变化,有了这个可能性以后,想像力不足也要利用起来。我们要把手机应用分散到各个IoT当中,应该是整体的智能应用,用户真正互动起来让模式发生改变,这个产业才能真正形成,底层无论是边缘计算还是数据,这些真正起来之后,才能够有效支撑IoT的发展。

  • 16:05

    【知识图谱专场】阿里巴巴业务平台商品知识图谱负责人张伟发表以《知识图谱技术与新零售智能》为主题的演讲,分享阿里使用知识图谱技术让新零售更智能。 张伟介绍其知识引擎是由4个模块,10个算法和其他工具搭建。在知识建模上,用TransE来分析上下位对、同义词对;知识获取运用到Transformer的文本分类模型、短文本NER+Entity Linking;知识融合上,张伟分享他们在基于ML的实体对齐、基于规则的实体对齐的创新技术实现。 最后,张伟分享知识推理Jena-RDF-Json框架,这个推理引擎是基于规则槽填充、规则、深度学习生成关系边,基于规则画像,规则过滤算法结果,将知识放大。这些技术使得我们在零售场景上,能更智能地分析用户搜索行为和挖掘,给与用户更精准的搜索结果。

  • 15:30

    【AI 开源技术论坛】亚马逊 AWS AI 应用科学家马超发表《使用 DGL 训练大规模图神经网络》主题演讲。马超表示,从 2016 年开始,图神经网络论文发表呈指数级上升。与传统基于张量 (Tensor) 的神经网络相比,图神经网络将图 (Graph) 作为输入,从而学习和推演图中节点之间的关系,该方法已被证明在许多场景可以取得很好的效果。然而,使用传统的深度学习框架(比如 TensorFlow、Pytorch、MXNet)并不能方便地进行图神经网络的开发和训练,而 DGL 作为专门面向图神经网络的框架,可以很好地弥补这一缺陷。由此,马超从 API、系统优化、可扩展性等多个维度深入分享如何使用 DGL 进行大规模神经网络的开发和训练。

    DGL 开源后在国内外引起了强烈的反响,马超在分享 DGL 的下一步目标 —— 向前对用户兼容,向后框架兼容,做到更快、更可扩展的同时,也提出一个问题,那便是当图神经网络论文爆炸性增长,我们的框架能否提供非常灵活、易用的 API?对此 DGL 抽象出 Message Passing API,支持用户自定义函数。此外,还有大量用户存在着直接调用的需求,对此,DGL 团队一口气写了三十多个模型,能够让用户直接调用。在此基础上,更要提升系统的兼容性,从系统底层、编译器到框架进行兼容优化。

  • 15:15

    【5G驱动AIoT技术论坛】北京邮电大学教授、博士生导师孙松林,在5G驱动AloT技术专题论坛,发表了《5G时代的物联网期待重生》的演讲。他表示,3G时代数据业务大幅度发展以后,大量的数据和语音发起适配,室外的5G覆盖非常容易,室内就会非常缓慢,这是一个漫长的过程,运营商现在也都非常苦。室内分布系统需要和物业去谈,就是进入这个大楼区是不是要交钱维护,这笔费用相当高,需要出人力出财力。韩国也是一样,5G主要是室外覆盖比较多,室内大部分还是4G,一旦室内室外切换就会非常明显。这样又会带来一个问题,就是耗电非常大,三星推出了4500耗安时的大电池手机终端,这也给我们一个启发:到了5G的时候,要让用户体验或者发展用户的终端,一定要是能够经得起电量的考验,就是要有大的电量。

  • 15:00

    【知识图谱专题】华为云通用AI服务总经理、语音语义创新Lab主任、首席科学家袁晶发表以《知识图谱助力企业知识化转型》的主题演讲,分享华为云在AI领域的技术和落地实践。 袁晶表示,为了提升效率、专业传承、管理优化,我们需要从数据化转型走向知识化转型。对此,华为云提出全栈、全生命周期知识计算解决方案。该方案华为云知识图谱云服务,支持全量或增量,多源融合,是基于高性能自研图引擎研发的。最后分享其在企业场景中的落地应用,在石油勘探、生物医疗领域、政务知识图谱构建,交互式智慧运营中心,灵活配置对话服务,华为云智能外呼机器人等均有实践落地应用。

  • 14:40

    【5G驱动AIoT技术论坛】微软(中国)首席技术官韦青,在5G驱动AloT技术专题论坛,发表了《论通讯的本质—从4G, 5G和即将被炒作的6G说起》的主题演讲。他表示,通讯可以有非常复杂的图案,我们做IT的特别喜欢抽象,比如现在流行的人工智能Framework,大家都觉得很好用,但是我们不要忘记,其实这些Framework是帮助你掩盖了很多细节,有好有坏。最早是叫通信,后来又叫通讯,其实也是从几千年前的飞鸽传信或者鸡毛信之类的开始,随着电子技术的发展,电报、传真、寻呼、无线通讯,功能机到智能机。开发的时候我们无论如何不能忘记通讯的根本。

  • 14:30

    【AI开源技术论坛】阿里妈妈搜索广告排序和机制算法负责人林伟发表《Euler:超大规模图深度学习开源框架》主题演讲,从图深度学习面临的主要技术挑战着手,详细讲解了国内首个在核心业务大规模应用后开源的图深度学习框架 Euler 的构建之旅。林伟表示,图深度学习面临着许多技术挑战,比如数据结构方面,是超大规模、动态更新的,同时计算模式也发生了变化,这就对平台提出了新的要求。

    当前,图深度学习有基于 Random Walk、Neighbor Aggregation 两种主要 Pattern。Euler 采用分层灵活可扩展设计、大规模高性能异构图学习、灵活多样的图算法支持、通用 GNN 训练加速的设计理念,支持图分割和高效稳定的分布式训练,可以轻松支撑数十亿点、数百亿边的计算规模,同时,Euler 系统抽象为图引擎层、图操作算子层、算法实现层,可以灵活、快速地在高层扩展一个图学习算法。

  • 14:15

    【知识图谱专题】OpenKG联合创始人王昊奋发表以《基于KG的认知智能中台——思考及产业化实践》主题演讲,分享技术知识图谱的认知智能中台。 区别通用知识图谱,王昊奋分享行业知识图谱数据具有数据来源多、数据类型多、数据模式无法预先处理、数据大等特点。而在人工智能时代的感知型企业需要融合使用全量数据,将面临多源异构数据难以融合、数据模式动态变迁困难、非结构化数据计算机难以理解、数据使用专业程度过高、分散的数据难以统一消费利用的挑战。对此使用平台化的管理平台来解决,但在平台实践过程中遇到难题:图谱建设、应用生命周期长;图谱构建过程难度较高,需要专业技能;跨行业迁移成本高;功能粒度粗,可复用程度低;应用构建较复杂,需要技术人员开发。对此,提出知识图谱认知智能中台化,基于知识图谱的认知智能中台完成知识图谱简单使用到生态打造的跃迁,可实现敏捷并规模化创新,并最终实现大数据智能。 最后,王昊奋表示知识图谱的价值和应用阶段我们已从第一阶段的统一语义表示数据到第二阶段的业务决策过程知识,向着第三阶段的知识驱动商业智能前进。

  • 14:10

    【推荐系统技术论坛】9月6日下午,AI ProCon 《推荐系统技术论坛》开始,在出品人朱小强的主持下,论坛顺利开场。作为开场演讲嘉宾,阿里妈妈深度学习平台负责人朱小强带来了题为《工业级深度学习2.0:算力+算法+系统架构的co-design理念与实践》的演讲。

    朱小强说道,互联网技术发展到今天,个性化非常重要,如何充分洞察用户的兴趣、习惯提供更好的个性化体验,是需要融入血液的事情。推荐系统本身其实是一个信息配置的问题,如何能够把合适的物品推荐给合适的用户。当商品数量量级已经达到人无法计算的程度,我们需要用数据和算法解决这个问题。这是推荐系统遵循的基本范式。

    计算力基础之上,整个推荐系统有三个因素联动,第一个是系统架构,支撑整个系统跑起来的硬核。在系统架构基础之上是大家容易忽视,但事实上是今天技术背后比较关键的一个问题,即整个数据链路,拥有一个好的数据体系,就成功了一半;第三是如何构建算法体系。这三个因素构建在一起才是计算力。没有系统架构,算法跑不出来,有系统和算法没有数据也搞不定。

    推荐技术的发展大概经历了两个大的阶段,第一个阶段从2010年到2015年左右,我将之定义为成浅层机器学习时代。在推荐系统发展的初期,协同滤波CF算法是早期非常棒的技术,它本质上是近邻模型的查找过程,算法做的事是关于近邻KNN,通过IocaI方式,洒下一些种子,并通过协同滤波把这些种子关联起来等事情。

    这种状况在2016年到2017年开始进入了称之为工业级深度学习时代之后,推荐系统技术发生了翻天覆地的变化。整个匹配召回的体系有了革命性的变化,原来基于CF的体系一定把用户圈在历史点击行为,在附近做探索的小范围内,但现在我们可以把用户、Global KNN做对接、量化和快速查找,找到用户所需要的物品,这意味着我们第一次真正具备了全空间的检索。

    今天整个体系系统,开始按照2.0工业级深度学习时代进行改进,因为技术逐渐往前推进,我们今天可以全面系统地考虑在线实时,全面改造匹配召回、粗排、精排、策略,这些需求部署在今天看来,如果想原封不动地用 co-design 去做是很困难的。架构一定要和算法一块考虑,让新的架构去承载更复杂、更实时的计算。

  • 14:00

    【AI开源技术论坛】鹏城实验室人工智能研究中心副主任邱景飞以《开源汇智,以智创新——人工智能开发者的成功之路》为题,与现场的开发者分享了开源的发展与趋势,以及如何在开源之路上成为一位良好的开源开发者。

    开源即开放一类技术或一种产品的源代码,源数据,源资产,可以是各行业的技术或产品。开源软件是一种源代码可以自由获取和传播的计算机软件,用户可以在开源许可证的规定下使用开源软件的全部功能,自由修改、自由重新发布和自由创建衍生品,共同推动开源软件的进步。

    为什么要开源?邱景飞总结五点:丰富行业应用,带动行业生态;集中资源形成联盟;技术共享和同业交流;作为产品特性获取竞争优势;体现社会责任及优化形象。会上,邱景飞重点向现场的开发者介绍了如何开源的6项要点。第一,确定开源项目;第二,确定代码平台;第三,选择许可证;第四,编写项目说明;第五,编写贡献说明;第六,建立行为准则。

    邱景飞强调中国开源的趋势从用到回馈到引领。越来越多的中国公司在贡献开源,并积极加入到顶级的开源组织,更涌现出越来越多的开源英雄。而当前人工智能开源发展现状也有较好的势头。其中,鹏城实验室-鹏城汇智开源代码托管平台,将面向开发者,优选和汇聚AI和RISC-V等开源项目与代码,以智引智。

  • 13:40

    【知识图谱技术论坛】复旦大学教授、博士生导师,复旦大学知识工场实验室负责人肖仰华以《Knowledge Graph Construction and Application in Practice》为题,分享知识图谱的构建和实践应用。 肖仰华表示,知识图谱是认知智能的基石。知识图谱构建由规模、质量、成本三个要素组成,并包含 抽取、纠错、补全、更新、精化、验证这五个环节。 知识图谱作为大数据知识工程的典型代表,是以自动化知识获取为其根本特征的知识图谱源于传统知识工程。随着大数据时代的到来,使得自动化知识获取成为可能,知识工程有望突破知识库的规模与质量瓶颈。知识工程在知识图谱技术引领下进入大数据知识工程全新阶段(BigKE),BigKE将显著提升机器认知智能水平。 而数据驱动的知识获取成为主流技术手段,但质量问题是数据驱动构建的知识图谱的核心问题。突破深度学习天花板的关键是引入先验知识。最后肖仰华表示,知识图谱一定要做最后的验证,用众包化来验证。

  • 13:30

    9月6日下午《AI开源技术论坛》,在Openl启智平台秘书处秘书长刘明的主持下,如期开始。本论坛相关精彩分享敬请期待。

  • 11:55

    亚马逊首席科学家李沐,《动手学深度学习》签售会现场。签售尚未开始场馆外便排起了望不到尽头的队伍,可见开发者们对于技术的热情,签售会活动场面非常火爆。

    本书旨在向读者交付有关深度学习的交互式学习体验。书中不仅阐述深度学习的算法原理,还演示了它们的实现和运行。与传统图书不同,本书的每一节都是一个可以下载并运行的 Jupyter记事本,它将文字、公式、图像、代码和运行结果结合在了一起。此外,读者还可以访问并参与书中内容的讨论。

  • 11:40

    本次大会重磅发布了《CSDN 2019 Top 30+ 案例评选榜单》,该榜单是由CSDN联合多位行业内技术专家,根据创新性、先进性、 引领性、效率性四大标准,从数百个优秀案例中评选出来的可能影响未来社会发展,具有变革性的AI和IoT产品及解决方案。

  • 11:15

    驭势科技联合创始人、董事长、CEO吴甘沙以《无人驾驶产业化的AI挑战和机遇》为题,立足于无人驾驶技术,与大家共同探讨无人驾驶产业化的AI挑战和机遇。 吴甘沙表示,无人驾驶要尊重汽车产业长期存在的规律 ,要有敬畏之心。如今无人驾驶技术中,AI 感知不是重要的问题,决策才是重要的问题。 而传统 AI是基于数据和规则,现在需基于学习,再是博弈+学习来设计。传统无人车关注的是舒适性、安全性,现在需关注其竞争性和社会性。对此,驭势科技推出自动代客泊车、机场无人物流拖车、无人小巴,并建立7*24小时无人化测试场地。

    谈及下一步的AI发展,吴甘沙表示,现在的AI还很笨,根据条条框框来训练。后续他将从背景知识和常识,模仿学习、强化学习,因果推理,基于迁移学习的举一反三等方面来提升AI的算法能力。“与先行者同行,与开创者共创。”

  • 11:00

    乂学教育-松鼠AI联合创始人&CTO樊星以《AI智适应技术如何带来学习效率的革命》为题,立足于人工智能技术,与大家分享在AI+教育的背景下,人工智能技术对学习效率提升的革新之路。

    会上,樊星列举了传统教育中的困境,并借助AI得以突破以上难题。例如教育资源分配不均,借助人工智能技术,可以做到突破地域和时间的限制;面对千人一面的学习内容,人工智能技术可以使得每一个孩子得到个性化教育;统一化齐的学习速度,利用人工智能技术,可以针对每一个孩子的学习速度量身定制学习方案;最后,传统教育往往只注重知识掌握的训练,AI将兼顾学生的思想与能力的培养。

    为此,樊星介绍了基于松鼠AI智适应学习引擎架构,利用人工智能技术破解以上种种难题。其中,AI智适应学习引擎架构第一层基础数据中的Content Map、Learning Map、Mistake Reasoning Ontology,将形成行为目标,利用数据收集与分析,评估学生状态,尝试推荐学习行为。

    樊星强调AI+教育的挑战除了AI算法模型之外,领域知识专家是最大的挑战。利用技术方法,将学习思想、能力、方法拆分将突破以上难题。具体来说,使用状态评估引擎,针对学情的认定和针对是如何进行的?实时、持续地评估诊断学生的知识状态和能力水平,更新学生个人画像,并实时采集数据,不断追踪学生学习情况。

    最后,樊星总结,利用AI解决“好”教育迫在眉睫,AI将会为教育带来的革命:学生少做80%的题目;一考定终身的现象将会消失;教育将变得更加透明;每个孩子对学习上瘾,掌握真正的学习能力与方法。

  • 10:25

    百度深度学习技术平台部总监马艳军以《飞桨大规模分布式训练和高速推理引擎》为题,分享开源深度学习平台飞桨的核心框架设计和技术。

    马艳军表示,深度学习框架极大降低了研发门槛,但放眼深度学习开源框架现状,国外的居多,国内功能完备的开源深度学习框架只有飞桨。飞桨具备五大优势:兼具动态图和静态图两种计算图的优势,精选应用效果最佳的算法模型并官方支持,大规模稀疏参数场景工业实践全面开源,端到端部署,提供系统化深度学习技术服务的平台。

    针对百度产品系统受到的挑战:超大规模稀疏性特征、万亿级模型参数量、百亿级训练数据、终身流式学习。飞桨大规模分布式训练从高效训练、收敛稳定、成本低廉核心需求出发,满足高频算法迭代、海量规模数据的场景,构建起三层架构的分布式训练引擎。最后马艳军还分享轻量、通用的端侧推理引擎Paddle Lite的技术实践。

  • 10:00

    华为云通用AI服务总经理、语音语义创新Lab主任、首席科学家袁晶以《AI的落地和落地的AI》为题,立足于人工智能技术,与大家共同探讨人工智能技术与行业AI落地实践。

    AI是一种新的生产力,改变将涉及各个行业。例如公共、教育、健康、媒体、制药、物流、金融等各行各业都将在AI的加持下向更加智慧的方向发展。

    袁晶强调探索AI落地的唯一方式便是实践,他特别介绍了华为全栈全场景AI,其中应用使能能够提供全流程服务(ModelArts), 分层API和预集成方案;MindSpore支持端、边、云独立的和协同的统一训练和推理框架;CANN是芯片算子库和高度自动化算子开发工具;Ascend是基于统一、可扩展架构的系列化AI IP和芯片。

    华为开放多年AI研发积累,将更多的开放能力全面释放。其中包括面向所有AI开发者所打造的一站式AI开发平台ModelArts,将大幅提升AI开发效率,降低开发门槛;HiLens 端云协同AI开发及应用平台,提供一站式AI应用开发、分发、部署、管理平台,Skill 开发、Skill 市场、设备管理、数据管理等功能。华为全栈全场景AI服务与面向开发者的种种权益,华为将自己的能力开放出来,不仅可以让开发者们可以紧抓AI技术红利,更能够促使整个AI行业在实践中快速落地。

    袁晶总结:改变才刚刚开始,“实践”是解决焦虑和冲动的唯一出路。人工智能时代已来,定义边界,分步实施,持续学习,从而形成商业闭环,由点及面的全面铺开,便是行业AI的落地之道。

  • 9:35

    亚马逊首席科学家李沐以《构建深度学习开源生态的努力和思考》为题,立足于深度学习技术,与大家共同探讨他在构建深度学习开源生态的经验。

    李沐自2014年进入深度学习领域,从降低深度学习上手门槛、减少深度学习的机器成本这两点出发,在过去五年探索出一些开源的深度学习工具,包括Apache MXNet、GluonNLP、书籍《动手学深度学习》,来帮助不同层次的开发者。

    另外,他谈到机器成本是学习成本外的障碍。机器成本下降比不过算法复杂度的增加,在新硬件上优化快速变化的深度学习模型很困难。对此,专门AI定制的芯片或者边缘计算可以有效缓解,他们还采用编译器解耦计算实现和硬件优化来使得支持新算法和新硬件更简单。

    最后他表示,深度学习开源的落地场景、用户需求仍在快速变化,没有尘埃落定,开发者应有开放的心态来拥抱这些改变。

  • 09:30

    鹏城实验室人工智能研究中心副主任田永鸿教授发表《鹏城云脑——打造新一代人工智能基础理论开源开放创新平台》主题演讲。田永鸿教授表示,人工智能是当前国际科技竞争的重点领域,正如习总书记指示,我们需要加快建立新一代人工智能关键共性技术体系,在短板上抓紧布局。

    面对高水平人才不足,AI 基础理论和原创算法差距较大,高端芯片、关键部件、高精度传感器等基础薄弱,未形成具有国际影响力的人工智能开源开放平台等问题,鹏城实验室对症下药,以成为一个实现国家使命的创新基础平台为目标,重点布局新一代人工智能创新研究,致力于研究智能行为的基础理论,开发未来异构智能计算开源平台和重大应用。

    对此,鹏城实验室从平台筑基、标准张脉、开源赋能三个维度入手,建设具有国际影响力的 AI 超算平台,支撑 AI 基础研究与重大应用需求;建立 AI 国家/团体标准,齐心协力,求同存异,加速开放共享;以开源开放形式 AI 赋能应用场景,促进 AI 发展,构建 AI 生态。

  • 9:10

    CSDN 创始人&董事长、极客帮创始合伙人蒋涛发表《AI 时代的开发者机会》主题开场致辞。蒋涛表示开发者是对技术变革最敏感的人群,在 CSDN 2700 万用户中,有 230 万开发者正在阅读、撰写与研究 AI 技术。为什么 AI 时代如此重要?

    蒋涛说道:“AI 可能是比移动互联网、我们过去面临的技术革命中更深远的一次革命,AI 会改变每一个行业,每个行业的领航者都将是行业大脑系统创新者,今后企业的竞争将成为行业大脑的竞争。”由此带来了强烈的 AI 人才需求,以 BAT、字节跳动为代表的互联网企业,加上以华为、网易、美团、平安、滴滴、商汤等数十种不同领域不同类型的企业均对 AI 人才有着巨大的需求量。

  • 09:00

    北京时间 9 月 6 日,面向 AI 技术人的年度盛会 —— 2019 AI 开发者大会 AI ProCon 在北京富力万丽酒店盛大召开,会议全力聚焦技术与应用,在助力企业智能化升级,驱动产业变革的同时,也让这些实实在在的经验助力开发者的技术跃迁和能力升级。

精彩花絮

学习中

李沐老师图书签售

演讲

现场

现场

现场

深度学习实训营

深度学习实训营

深度学习实训营

网友互动
我说