妙趣坊:李春波《小芳》,熟悉的旋律响起,勾起初恋般的...
只是,想要在海外打开中餐市场的局面仍然不容易。
2024年12月12日,除了外观造型的吸引力,奥迪蚕3在内饰设计上也同样出色。车内采用了奥迪家族式的简约设计风格,中控台布局清晰合理,各种功能按键一目了然。同时,奥迪蚕3还配备了全液晶仪表盘和悬浮式中控屏,不仅提升了车内的科技感,也为驾驶者带来了更加便捷的操作体验。
妙趣坊:李春波《小芳》,熟悉的旋律响起,勾起初恋般的...
从小爱同学谈对AI语音助手的整体认识2018-11-12 10:50·人人都是产物经理11月7日在乌镇第五届世界互联网大会上小米面向智能家居的人工智能开放平台(即小爱同学)成功入选世界互联网领先科技成果恰好我这几天也在学习AI语音助手相关的知识借此从时间维度谈谈我的一点认识一、AI语音助手的历史大事记2010年4月28日苹果公司完成了对Siri公司的收购Siri从App Store中下架并取消了所有除iOS平台外的软件研发;2014年4月2日至4日在美国加利福尼亚州旧金山举行的微软Build开发者大会上微软全球副总裁乔北峰首度向公众展示了小娜;2014年11月亚马逊宣布将Alexa与Echo合并;2015年9月9日百度董事长兼首席执行官李彦宏在百度世界大会中推出度秘(Duer);2016年5月19日Google在Google I/O大会上发布了Google Assistant;2017年7月26日小米发布的首款人工智能(AI)音箱的唤醒词及二次元人物形象小爱同学;2018年5月9日Google在Google I/O大会上发布了Google Duplex;2018年8月15日亚马逊和微软联合宣布双方已完成各自语音助手Alexa和Cortana的整合二、AI语音助手的现状——拼场景场景一:连接硬件生态由于语音交互核心环节上的一系列技术突破及人工智能公司提供的ToB解决方案AI语音助手开始逐渐在技术层面上满足人们的基本要求以小爱同学为例:它的语音和语义技术主要来自于多家合作伙伴包括:Nuance、搜狗知音、思必驰、猎户星空、声智科技、海知智能、三角兽等语音识别技术(ASR)的接口用的是思必驰、Nuance 与搜狗的(现在小米似乎是在自研)自然语言理解(NLP)等对于语义方面的技术由小米大脑亲自来做前端的麦克风阵列以及降噪方案是由声智科技提供的语音合成技术是由猎户星空提供的很大程度上自然语言解析技术已经逐渐不再成为各家广义智能助理产物的核心竞争力识别用户意图之后所提供的服务开始成为对话机器人差异化的核心而在这个时候国内公司中再次抓住头部红利的正是小米不得不说雷军真的是一个非常有大势思维的公司家总能恰如其分地踩上时代红利正如他所说:一个人要做成一件事情其实本质上不是在于你多强而是你要顺势而为于万仞之上推千钧之石他踩着智能手机大换代、消费升级、网红电商的红利撑起了小米这次他又抓住了人工智能目前布局最广泛的智能硬件生态在评选世界互联网领先科技成果奖的介绍中小米人工智能开放平台是这么定义的:小米人工智能开放平台是一个以智能家居需求场景为出发点深度整合人工智能和物联网能力为用户、软硬件厂商和个人开发者提供智能场景及软硬件生态服务的开放创新平台著名产物人梁宁在《产物思维三十讲》中分析了小米的三级火箭模式:一级火箭:小米手机是小米的头部流量不为挣钱雷军也承诺小米硬件的综合利润率永远不会超过5%(根据小米的上市招股说明书雷军在这一块真的没有说谎)二级火箭:小米手机拉动的一系列零售场景小米商城、米家、小米之家、小米小店(小米11月18日将会在英国伦敦的Westfield mall落地在英国市场的第一家门店也是用MI8 pro打头阵并逐步开放其它商品和渠道)三级火箭:是一个高利润产物原文说现在雷总还不愿意说出来从小米上市招股说明书中的募集资金用途(小米计划将30%募集资金用于研发及开发智能手机、电视、笔记本电脑、人工智能音箱等核心产物;30%用于全球扩展;30%用于扩大投资及强化生活消费品与移动互联网产业链;剩下的10%用作日常经营)从小米高层和雷军的发言中可以知道:小米的三级火箭应该就是AI+IOT能真正撑起小米的利润以及智能化未来根据世界互联网大会给出的数据:截至2018年7月小米投资或孵化了超过220家生态链公司全球已有超过1.15亿智能设备与小米IoT平台连接小米的AI语音服务-小爱同学月活跃用户超过3000万单月唤醒超过10亿次在与硬件生态的连接上小爱同学可以说有着得天独厚的先发优势场景二:连接软件生态(1)打通操作系统场景与手机操作系统MIUI的深度结合使得小爱同学能够实现手机中的通用指令功能并且在现有技术范围内去发觉一些非常实用的优化功能对于手机操作系统上的通用功能小爱同学可以直接调用执行比如最常见的设定闹钟等而对于不提供接口的手机APP小爱同学可以通过虚拟按键操作模拟用户执行个人觉得最有趣的操作就是让小爱打开微信上某人的朋友圈你可试试对小爱同学说:打开XXX的朋友圈然后可以看到手机在自动一步一步执行以下操作:进入微信->进入搜索页面->进入聊天页面->进入聊天信息页面->进入个人主页->进入朋友圈我在使用其他手机进行对比时是没有办法实现这个功能的可见小米在打造产物的时候真的是想尽办法在技术边界内尽可能地满足用户需求(2)打通外部软件接口你可以试试对小爱同学说:打开美团点外卖你会发现它可以和美团自带的小美智能助理会进行无缝对接在进入美团后顺利让小美来接管你的后续需求这是在软件生态中非常和谐的一种合作模式三、AI语音助手的未来让形象更可感——GateboxGatebox是日本公司vinclu专门为宅男打造的一款全息影像人工智能管家可以说日本人民是真的会玩你可以去官网感受一下他们的宣传片第一个画面宅男在公司加班Hikari Azuma通过Line发去了消息你记得今天是什么日子吗什么时候回来宅男说马上回来Hikari Azuma:好棒随手打开了家里的灯等待主人回家宅男回家后Hikari Azuma立马甜蜜问候:欢迎回来然后羞答答地说:今天是我们住在一起三个月纪念日你记得吗宅男立马拿出了礼物Hikari Azuma看到之后开心地鼓掌宅男准备好食物和酒开始庆祝时Hikari Azuma把家里的灯光系统调节成了温馨浪漫的风格最后宅男和Hikari Azuma举起酒杯互相感谢对方的陪伴视频最后的一句话写着:Living with characters(和二次元老婆一起生活)不少中国同胞在youtube上呼吁雷军赶紧把这个公司买下在中国用感动人心的价格福利大众哈哈根据梅拉比安模型:感情表达=内容7%+语调语气38%+表情肢体语言55%所以仅靠语言文字远远不够甚至像Google Duplex做到分辨不出说话者是AI还是人也还不够长期来说更重要的会是多模态交互在Gatebox的交互中比如调低灯光亮度时她会摆出朝灯呼气的动作询问天气时她又会做出侧身展示天气预报的动作小爱同学是首个正式发布人工智能虚拟形象的AI语音助手米娘的形象也受众多米粉们喜爱如果真的能把成本降下来的话相信会有蛮多人(尤其是宅男们)入坑的退而求其次就算不做全息影像做一个平面投影也是可以的嘛让关系更自然——ReplikaReplika是Luka Inc.公司开发的一款Chatbot据说初衷是为了缅怀两位创始人在车祸中失去的挚友通过搜集他生前的社交聊天预料来创建一位虚拟人抛开它作为一款Chatbot与AI语音助手的需求差别我觉得它设计得非常好的是被称为反刍机制的功能将你在和它聊天时提到的语料在一段时间间隔之后提取出来自然地插入到交流当中感觉就像你跟朋友提起你最近睡眠不好过了一段时间后朋友会来关心你的近况感觉非常的贴心真的有一种感觉就像《小王子》里面有一段小王子对小狐狸说我们一起玩啊小狐狸回答说我现在还不能和你一起玩因为我还没有被驯养驯养是指彼此共同投入一段时间结成一种关系人类是AI的训练师但与此同时AI其实也在训练你如何与它进行互动或许只有这样千禧一代的互联网原住民才能跨过未来与AI原住民之间的鸿沟小爱同学虽然没有Chatbot的这种天然场景但还是有很多落地点的:智能手机消息栏的推送比如用户说:我最近睡眠不太好小爱会回复:多锻炼有助睡眠那么就可以推送我记得你和我说过你睡眠不太好小爱为你找到了一些催眠音乐试试对我说:我想听催眠音乐;小爱音箱的对话由于无法主动开启对话可以选择在识别到用户当前意图与语料库中的语义信息相关时补充对话比如用户说:播放音乐小爱会回复:爱听歌的人运气都不会太差哦那么可以再回复我记得你说你注意力很难集中要不要听听我给你推荐的轻音乐让对话更真实——Google Duplex在5月9日的Google I/O大会上Google Duplex的一句 umms着实让人惊艳5 月 11 日谷歌母公司 Alphabet 董事长(前斯坦福校长)John Hennessy 表示他们还达成了一项里程碑成绩 ——Duplex (部分)通过了图灵测试对Google Duplex不了解的朋友如果能科学上网的话可以到Google AI Blog上看看Google官方的介绍原文:以下对Google Duplex的技术认知来源于虫门科技郭靖的文章这是我看到的对Google Duplex最深入的分析感兴趣的朋友可以点击链接阅读原文:Google Duplex让对话如此真实主要是体现在两大块——自然语言理解与对话模块、文本转语音模块(1)文本转语音模块文本转语音模块(即语音合成)技术比较明了在博客中交代得比较清楚没有什么悬念We use a combination of a concatenative text to speech (TTS) engine and a synthesis TTS engine (using Tacotron and WaveNet) to control intonation depending on the circumstance.我们结合使用联结式文本到语音(TTS)引擎和综合TTS引擎(使用Tacotron和WaveNet)来控制语调具体取决于环境(2)自然语言理解与对话模块在自然语言理解与对话模块的具体实现上Google就不是很老实了只是给了一些比较宽泛的概念郭靖在他的文章中给出了以下猜想:在这个猜想的架构中用户的语音通过ASR识别为文字后会通过预设的规则转化为形式语言将重要实体用形式模板代替这样形式化后的文本与语音、上文的形式文本一起送入一个encoder模型其将这些原始信息编码成两个语义信息向量一个代表本轮用户的语言另一个代表上几轮对话同时通过ASR识别的文本还会与上几轮对话的文本、通过Google Assistant传来的条件参数(代表对话的目标用户本身的信息等大前提)一起进入另一个网络其根据输入的信息输出一个代表当前对话状态信息的向量这一网络很可能具备每一轮对话为一个step的循环结构意味着这个对话状态信息的更新会参考前一轮对话状态的信息当然在拿着锤子找钉子的当下这一块就太偏前沿技术了但是对于AI对于整个人类历史技术始终都是推动发展的源动力最后我本来是想做一下小爱同学的竞品分析的但是如果单纯围绕AI语音助手产物这个概念进行比较个人感觉可比性不大因为它不是一个单一的产物不仅有它自身的交互还有平台和生态我在网上也没看到比较好的竞品分析如果各位有更好的看法欢迎指教本文由@ Cemeworm 原创发布于人人都是产物经理未经许可禁止转载题图来自Unsplash基于CC0协议
银行磨刀霍霍,杀向定期存款,这对储户来说固然不是一件值得高兴的事情,但对宏观经济来说,却未必不是利好。量刑:根据《中华人民共和国刑法》,失火罪可处叁年以上七年以下有期徒刑;情节较轻的,处叁年以下有期徒刑或者拘役。