《SD学园二三事》风魂 ^第1章^ 最新更新:2008-03-03 11...《se01在线观看》高清在线观看 - 全集剧情 - 皇家影院
湟源:西宁最低调的县,曾被称为“小北京”,文成公主走过的地方原创2021-10-26 17:18·马小吏爱美食、爱生活,喜欢旅游和随手拍,关注我带你了解更多旅游知识。青海省作为一个高海拔地区,夏天是它最美的时节。每年有不少游客从千里之外,来到青海旅游,总会在西宁小住几日,需要适应一下高海拔气候,然后一路向西,开始自觉的大美青海之旅,因为青海最美的景色,几乎都在西宁往西。从西宁出发,一路向西,很多游客的目的地都会是青海湖,但是在路途当中,会经过一个小县城,这个县城,就是西宁市下辖的湟源县。它的名字得名于“湟水之源”,今天就和大家一起聊一聊西宁的湟源县。在青海,一直有一句老辈传下来的话:湟源的姑娘门源的马,意思是说湟源县的姑娘长得好看,是个出美女的地方。而门源县则产名马。相对于湟源美女,湟源优美的风景和十分重要的地理位置,更被人们津津乐道。湟源县所处的位置,在青海的历史上是十分重要的,它是去青海湖的必经之路,是古代唐蕃古道的咽喉重镇,有海藏咽喉之城。因为当年这里货运之分发达,商贾流通,贸易流畅,曾经成为了青海非常有名的一个集市,是牧区和农业区交融的地方,因此这里曾经商业非常繁华,有着“小北京”的美誉。在青海的历史上,湟源县是一个非常重要的地方,唐朝时期这里被吐蕃占领,包括今天的湟中地区,整个被改名为青唐城。成为了当时汉族和高原少数民族茶马互市的重要地区。在清朝时期,为了加强和西藏的交流,这里直接设置了丹葛尔厅,隶属于西宁府管辖,而丹葛尔城一度成为青海十分繁华的小镇。如今的湟源县,繁华不在,但是湟源县的风光依然十分美丽,湟源县最著名的景点应该是日月山,这个地方不仅是一个旅游景区,实际上它对于中国地理行政的意义也很这重大。日月山古代被称为赤岭,相传文成公主进藏的时候,在这里怒摔日月宝镜,化为两山,名为日月。当然这只是历史传说,实际上日月山是青海农业区和牧业区的分界线,是青藏高原和黄土高原的分界线,而湟源县,也是汉文化与藏文好的结合部,地理位置十分重要。在湟源县城,有一座保存完整的古城,被人们称为是丹葛尔古城,这座古城见证了当年湟源的繁荣,如此这座古城保存的依然很完成,经过修缮后,已经向游人们免费开放,而且这个古城也是整个青海地区为数不多的保存完成的古城,整体来说还是值得一去的。如果你喜欢美景,湟源的宗家沟风景区一定不能错过,这是湟源县近些年重点打造的一个风景区,它距离湟源大概只有20公里左右,是一处非常漂亮的山沟,进入沟内,你可以看到两侧的山崖上长满了树木,群山巍峨,峰峦叠嶂,怪石嶙峋,山沟之中清泉缓缓流下,简直就是一副诗情画意的中国画,非常漂亮。其实整个湟源县内,像宗家沟这样的风景还很多,只是因为一些原因,并没有大规模去开发,而当地人则十分喜欢在夏季选择风景好的地方,去进行野炊,俗称是浪山,很多地方的风景,甚至比一些景区还要美的多。湟源县的美食已经走出来湟源,遍布青海各地,其中大家最熟知的一道菜就是“湟源里脊”,能和酸辣里脊齐名,可见这道菜在青海又多受欢迎。湟源还有一道非常有名的美味,那就是小高陵的排骨,很多西宁人都会驱车几十公里,专程去小高陵品尝当地的排骨,味道非常好。湟源县,一处风景很美的小众旅游地,如果有时间,不妨去看看,还是非常值得一去的。朋友们,你们去过这个小县城吗?觉得这里怎么样呢?欢迎大家一起留言讨论,期待你们的留言!部分图片来源于网络,如有侵权,请联系删除。
2024年12月19日,更何况,在别的领域里,她已经作出了自己的贡献。
《SD学园二三事》风魂 ^第1章^ 最新更新:2008-03-03 11...《se01在线观看》高清在线观看 - 全集剧情 - 皇家影院
搜索产物指南:必须知道的几件事2019-11-30 11:56·人人都是产物经理搜索产物有很多其中有哪些需要注意的问题在技术之外我们还需要知道什么搜索本身是一个比较技术的事情小白产物想要学习搜索的产物知识就会发现各大论坛上的搜索相关内容都是技术为主即使买上几本搜索相关的书籍也大部分讲的是搜索引擎的原理无从下手去学习入门就更难了那对于一个搜索小白来说到底应该怎么样去设计一个搜索引擎呢搜索路径:输入搜索词-抓取数据-分析用户搜索意图-识别意图并召回内容-结果集排序一、抓取数据搜索引擎:在全网中抓取尽可能全的数据供搜索引擎查询垂类搜索引擎:这些数据95%以上都是平台自建的所以不需要去其他平台抓取数据如:淘宝、美团都是平台自己维护的数据平台需要做的事情就是尽量让数据准确、真实如果一个卖衣服的商品录入的信息全是卖鞋的即使引擎再好也无法识别这件衣服二、分析用户搜索意图:分词、词语处理、词语识别1. 分词:单字分词、短语分词1)单字分词就是用户输入词分成单个字每个单字匹配上搜索域就可以被搜索这种分词简单易开发适合spu和品类较少的平台但这种分词方式有一个弊病那就是搜索结果不准就比如我想搜索小金锁的面膜那搜索域中匹配上小、金、锁三个字就可以被召回真实案例就是搜索结果出现金色小米手机人脸解锁的手机尴尬至极2)短语分词这种分词方式需要准备一个基于自己平台的分词词库(如果没有找一个开源词库)分词引擎基于这个分词库来分词并进行搜索比如你想搜索小金锁分词库中包含金锁、小金锁那你搜索的词就会被分成小、金锁、小金锁那搜索域中是金色小米手机人脸解锁的sku就不会被搜索出来因为金锁、小金锁这两个词并没有匹配上部分垂类需要自建自己平台的分词库比如电商类的平台就可以从品类名称、地域名称、品牌名称、店铺名称去搭建一个基础库提供一个思路大家自己去思考下一步应该怎么搞2. 词语处理类用户搜索词千奇百怪避免不了同一个搜索结果每个人搜索的词不相同但为了保证无论用户输入什么搜索词都可以变成想要的结果这个时候就需要同义词、近义词、错别字、屏蔽词来干预1)同义词因为结果集取并集所以用户无论搜索同义词中的哪个词得到的结果都是相同的同义词库搭建的时尽量保证词库的真实、准确如果匹配分词库时有专业的业务部分最好和业务部分确认好后再配置如:剃须刀、刮胡刀书、图书上海九院、上海第九人民医院拖鞋、鞋拖2)近义词近义词是两种词的定义接近但又不是同一个东西的时候一般配置近义词如:生抽、老抽猕猴桃、奇异果有的人认为不是一种东西有的人又非说是一种东西(人的认知边界此处不接受杠)所以近义词可以完美解决这种情况排序的时候优先展示搜索词的结果集配置的近义词在搜索词结果展示完后展示;当然也可以穿插展示具体情况具体设计3)错别字错别字需要做的是定义主词和错别字词错别字在没有进入搜索引擎的前一步就完成的替换错别字情况在搜索引擎中最常见如:雅诗兰黛、雅思兰黛、雅诗兰戴、雅诗蓝黛这种情况简单点就走同义词但对应的搜索词和搜索域的相似度会有一定程度的影响所以错别字还是最有解决方案4)屏蔽词屏蔽掉一些无关或者无意义的词如各种奇奇怪怪的标点符号、各种反d反d的词语等行业内有很多标准词库在技术论坛上查找不过多介绍3. 词语识别类主要还是标记一些词为特殊词可以在用户搜索该类词的时候给出一些特殊样式的惊喜就比如搜索雅诗兰黛不仅仅展示雅诗兰黛商品也可以展示雅诗兰黛店铺、雅诗兰黛活动入口等等给用户的惊喜也是很大的三、识别意图并召回内容1. 搜索域:搜索域就是搜索词匹配相似度的文本初级的搜索产物可能会觉得所有的信息都放进搜索域中就行了其实大错特错这样导致的结果就是非常不准确这个时候搜索产物一定要克制尽量把重要的字段放在搜索域中就比如:商品标题、品类、标签、sku名称、sku规格等2. 相似度:搜索词和搜索域匹配度也叫相似度(偏技术可略过)1)分词方式如用户搜索:你说的确实在理你说、的、确实、在理=1*2+2*1+3*2+4*2=18你说、的确、实、在理=1*2+2*1+3*1+4*2=15你说、的确、实在、理=1*2+2*1+3*2+4*1=14机器无法判定那种分词方式是对但是数字可以判断大小所以搜索词先判定了第一种分词方式(真正的分词比这个还要复杂用分词数量和分词位置比较好理解下几篇文字会详细讲下如何分词)2)匹配方式or和andor和and无非就是用户搜索词和搜索域匹配的结果集是要部分匹配还是完全匹配用哪种模式还是比较看行业的电商、020建议用and较好社区、视频等内容类建议用or较好3)文本相似度=余弦相似度余弦相似度就是通过一个向量空间中两个向量夹角的余弦值作为衡量两个个体之间差异的大小把1设为相同0设为不同那么相似度的值就是在0~1之间余弦相似度的特点是余弦值接近1夹角趋于0表明两个向量越相似看下图:比如:{你说 的 确实 在理}、{你说 的 在理}对应的向量分别是{1111}、{1101}套入到的公式中相似度约等于80.4%PS:但相似度是不准确的你真好看和你真难看相似度75%但其实他们一点也不相似所以机器学习、语义识别、神经语言等还是需要逐渐搞起来的(小厂谨慎搞)四、结果集排序1. 业务因子排序基于行业特性定义一些业务因子来综合打分行程排序基于多维度的分数来定义对应的结果集一般可以加一些ctr、单uv价值、单pv价值、退款因子、转发互动因子等等要知道搜索结果不仅要准确还要足够受欢迎2. 人工干预排序对于特定的词或者类型给予一些人工干预保证搜索结果的准确性3. 个性化排序基于用户标签在搜索结果集中加权值比如技术宅搜索苹果大概率是想要iphone手机那吃货当然更希望是水果喽搜索底层路径基本就这四大节点底层动作围绕着四个节点有很多标准的行业解决方案欢迎大家一起聊聊本文由 @Hankys 原创发布于人人都是产物经理未经许可禁止转载题图来自 Unsplash基于 CC0 协议
野鸭子在水面上滑行,偶尔张开白色翅膀低空飞行,为这宁静的湖面增添灵气。乌汶