漂亮的保姆6高清在线中字电影喜剧-完整版在线观看...
现场直击|北京坐公交不再必须48小时核酸2022-12-05 10:55·北京日报客户端北京日报客户端 | 记者 孙宏阳12月5日起,北京公交、地铁运营公司在核验健康信息时,不得拒绝无48小时核酸阴性证明的乘客乘车。记者早上探访多条公交线路发现,上公交车已经不再要求必须有48小时核酸,持老年卡市民同样适用这项新规。早上8点半,市民胡女士在甘石桥公交站登上了22路公交车,她打开北京公交APP刷码,系统迅速提示刷码正常。“本来坐车前还有些忐忑,核酸已经超过3天了,周末看到新闻后,就没再出门去做核酸。”胡女士说,最近她每天就是去父母家照顾老人,也没去公共场所,公交车不再要求必须48小时核酸,省去了她为了乘车去排队做核酸的时间。记者在甘石桥站、西单路口南站、宣武门内站等多个公交站看到,候车市民全都能顺利乘车,没有发生因核酸问题产生的“卡壳”现象。公交车上,多位老年人上车后,向乘务人员咨询,持老年卡是否也不再必须有48小时核酸,得到的答案也是肯定的。不过,记者发现,虽然刷码乘车很顺利,但是无论北京公交APP,还是亿通行APP,地铁和公交乘车码下方均有一行小字提示“健康码异常”。对此,客服人员解释道,这个提示只是说明用户核酸已经超过48小时,但并不影响乘车。在102路、22路等公交车上,前车窗处均贴有车辆已经消毒的车贴,消毒日期为当日。同时,车辆按照规定,行驶过程中全程通风。公交车上,乘客基本都能间隔就座,正确佩戴口罩。“不查核酸了,我们更要做好自身防护。不是说了嘛,每个人都是自己健康的第一责任人。”一位老年乘客对记者说。
2025年01月04日,本来商铺所在的位置就已经很嘈杂了,再选择底商上一层的话,就会对我们生活造成严重干扰,还会影响我们的正常睡眠。此外,我们也需要考虑到安全隐患的问题,如果底商是做餐饮的话,难免会用到天然气,万一使用不恰当的话,就可能会出现天然气爆炸等事故。一旦出现事故,离底商最近的上一层自然会损失惨重。
漂亮的保姆6高清在线中字电影喜剧-完整版在线观看...
清华教授邓志东:大模型评测能不能也建个L0-L5分级2023-12-29 17:10·至顶科技作者:于佳卉两周前Reddit上一个爆料GPT-4.5的帖子火了其中提到GPT-4.5将具备更强的多模态能力文本、语音、图片以及视频都能一并处理还具备复杂的推理以及跨模态理解能力消息一出网友就热闹起来了有好事者去Sam Altman的帖子下询问GPT-4.5是否泄露得到了一个轻飘飘的nah网友们又转去问ChatGPT结果还真问出了一个模型说自己是4.5版本的回答不过很快OpenAI的员工回应这是大模型产生了幻觉随后ChatGPT官方账号发推配了脑和雾的表情大概是委婉地承认大模型幻觉问题大模型的幻象迷航大模型幻觉通俗地说就是一本正经的胡说八道看似很有道理其实是在骗你在过去这一年大模型赛道风起云涌无数国内外科技巨头、AI创业公司涌入形成了千模大战的盛景与此同时幻觉现象频出并且由于大模型的强大生成的幻觉有时看上去非常合理难以分辨已经成为大模型产物落地的拦路虎清华大学计算机系长聘教授、清华大学人工智能研究院视觉智能研究中心主任邓志东在接受至顶科技采访时表示大模型幻觉可以分为事实性幻觉和上下文不一致幻觉前者是大模型生成的内容不符合常识甚至出现了捏造或者杜撰后者则是大模型生成的回复或下文与用户上文的指令不一致也就是答非所问驴唇不对马嘴事实性幻觉是目前大模型幻觉研究的热点这一类幻觉对用户的影响更大还可能产生安全问题例如大模型在生成医疗建议时可能会捏造错误的药品剂量在具身智能中可能会带来时空错乱这些都会给用户带来安全风险但是幻觉问题是客观存在的它的成因涉及到数据、模型结构、预训练、微调甚至推理各个部分从训练数据的角度来看由于互联网上的信息是非均衡的有的数据特别丰富有的数据很少甚至缺失也可能存在偏见或根本是错误信息还有些数据的时效性不够等大模型通过互联网采集的数据较容易出现这类缺陷从训练本身来看主流的大模型是自回归生成式模型没有纠错机制也就是说前面发生的错误会传递到后面导致错上加错像滚雪球一样此外如果问题超出了大模型的知识边界也可能由于大模型的对齐策略产生幻觉有什么方法能缓解这种幻觉邓志东从四个层面进行了解说一是提高训练数据的质量在预训练和微调阶段通过数据清洗减少偏见增加多元性和均衡性例如针对不同质量的预训练样本集采用打分加权给高质量数据集比如程序代码、专业论文和正式出版的书籍以更高的权重而对于网页上抓取的信息通过大量清洗筛除其错误和冗余数据这方面特别需要时间和资源的投入二是知识增强利用外部工具检索跟常识性知识源进行对比对于专用模型则可增加更多的专业知识库喂养还可以借助于数字孪生将数字孪生系统与大模型结合起来进行交叉验证帮助其消除幻觉三是增强一致性包括逻辑一致性、知识一致性通过一致性来判断是否出现了幻觉尤其是对上下文不一致的幻觉有较好的效果最后是给大模型增加电子水印未来互联网上AI生成的内容会越来越多甚至超过人类产生的数据清楚数据来源就显得很重要我们要知道它是由人类产生的还是由AI大模型产生的具体是哪个大模型加水印是比较简单的一个低成本鉴别方法另外幻觉问题也与用户如何跟模型交互相关若巧妙地提问采用一步一步拆解的策略通过思维链方式将一个复杂问题分解为多个子问题或者将一个大任务拆解成若干子任务也能缓解幻觉问题揭秘大模型评测机制如今大模型之争是整个科技界的焦点市场上不乏声称自己产物超越GPT-3.5甚至对标GPT-4的团队在各个榜单上刷脸如何客观评测大模型能力成为一个公众和业界共同关注的议题最近由工信部中国电子技术标准化研究院发起的国内首个官方大模型标准符合性评测结果揭晓有四家大模型通过了这一评测:360智脑、百度文心一言、腾讯混元、阿里云通义千问这也标志着大模型的官方认证进程已经开启邓志东表示尽管业界已形成多个评测基准如NLP领域的MMLU、BIG-Bench、C-Eval、GSM8K等但大模型的跨领域特性使得每个细分领域都有其独特的评测指标例如在计算机视觉领域中的视觉目标检测通常使用mAP进行评测图像与视频分类任务则用准确率、召回率等指标进行性能评估总体上目前还没有形成完整统一的跨领域多任务的评测体系很多厂商因此钻了空子仅展示自己表现最好的方面大模型评测需要构建一个统一、客观的第三方评测机构不能由公司或者研究机构自说自话邓志东认为评测体系的建设应遵循定性与定量相结合、评测大模型与人类专家相结合的原则既有客观又有主观评测体系可以分为安全性、准确性、涌现能力和泛化能力四个维度综合评估大模型在各项任务中的表现评测模式包括做题打分、模型间PK还包括对模型各项单一能力的评估等他进一步提出了一个想法类似于自动驾驶技术的L0-L5分级大模型评测体系是否也可以采用这样划分在这种框架下L0至L2级可能代表的是大模型的基础感知与生成能力而L3级及以上则标志着模型具备更高级的理解认知与多模态生成能力从初级认知到中级认知L5级则是宽度接近甚至超越人类的高级认知能力从发展路径上看人工智能可分成弱人工智能-通用人工智能-强人工智能-超级人工智能这几个演化阶段我们现在正处于通用人工智能的早期阶段当它的认知能力与完成复杂任务的宽度和人类差不多就是强人工智能时代到了在这一大尺度发展路径上既有巨头公司推动的基础、基座通用大模型也有针对垂域或特定应用场景的专用模型毕竟大模型的价值在于实际应用和产物落地这样才能形成一个可持续发展的商业闭环因此更多初创公司应转向垂域专用模型的产业落地在这一过程中中国在商业模式构建、应用落地速度以及应用场景多样性上的优势可能也会体现出来以此重建我们在AI大模型时代的新优势从单模态到多模态从简单任务执行到复杂的认知功能比如智能涌现零样本泛化等通用人工智能这一年的发展超出了很多人的预期在大模型不断演化过程中完善的评测体系和标准构建尤为重要这不仅仅是技术的竞合更意味着话语权和对未来行业趋势的引领
越南的旅行社常抱怨称,许多国际旅游团因没有及时获得签证,不得不在最后一刻取消了他们的越南行程。越南文化体育旅游部部长阮文雄也承认,许多国家通过免签政策吸引了大量的游客,越南在这方面竞争力不足。我可以很清晰地告诉大家,我们是两条腿走路,除了和华为合作,我们也要有自己的技术储备。