91视频专区

...高清电影冲完整版电视剧冲手机免费在线观看-天天韩剧网

618电视选购看这篇就够了!这几款产物不容错过2023-05-26 15:45·ZEALER在一年一度的618狂欢福利季即将到来之际,头部电视品牌创维已于近日开启了电商预售。在备受消费者期待的年中大促时节,创维“宠粉”心切,特别推出了“下单赢清空购物车大奖”的限量福利,同时倾情推荐大家加购创维壁纸电视A7D、创维GLED高音画电视A5D、创维高刷巨幕实力派85吋A3D和创维高刷巨幕影院98吋A23等新品,开启居家视听新体验。艺术控首选:“怎么装 都好看”的创维壁纸电视A7D作为创维今年发布的新品,“怎么装 都好看”的创维壁纸电视A7D凭借“超薄无缝贴墙”的独特产物形态,可灵活适配各类风格空间,满足用户对家装可塑性的期待。此外,其内置的“百变艺术屏”功能可提供艺术画廊、生活此刻、氛围空间、家庭照片墙等多种模式,使电视能够化身为名家画作、家庭照片墙、氛围背景和个性化时钟,可与家庭活动的不同主题、甚至是“日抛”软装的不同风格进行实时匹配。在性能方面,创维壁纸电视A7D突破了超薄电视和音画品质不可兼得的桎梏,通过专利技术的创新,在确保整机超薄形态的同时,通过百级分区与分布式Smart控光系统的组合实现像素级精准控光,同时在创维声学系统2.1、65W大功率音箱及经HARMAN AudioEFX专业调校和杜比全景声的加持下,实现了高品质的音画性能。越级配置加冕:创维GLED 高音画电视A5D 带来“王炸”级视听体验同样是于今年发布的新品,创维GLED高音画电视A5D,以超强品质颠覆了家庭音娱的视听体验。创维电视A5D通过百级分区与分布式Smart控光系统的组合实现了像素级的精准控光,同时在ALS亮度自适应调节功能、AGLR防眩光工艺以及G画质芯片的加持下,使得画面无眩目更绚彩。此外,创维电视A5D不仅采用了分频音响技术,实现高达4*15W的音响总功率,也通过与哈曼联合调校、配合杜比全景声音效和解码技术,营造音效细腻的家庭版“金色大厅”。观影过程中,性能配置同样十分重要。创维电视A5D支持全通道4K 120Hz高刷新率,轻松满足观影和游戏需求。在外观方面,A5D借鉴了顶配跑车的线条美学,并加入冰刀底座、超薄机身和99%屏占比的细节设计,将高级感打造为家庭场景的主旋律。高刷巨幕佳作,创维85A3D和创维98A23诠释大屏实力作为全能实力派,创维高刷巨幕85A3D凭借全通道120Hz高刷新率和G画质引擎,呈现巨幕级别清晰灵动的画面观感,不论是观影还是游戏,都畅快淋漓。此外,在创维声学系统2.0、杜比解码及主芯片DSP音效精准调节的加持下,创维85A3D能够适应多种场景模式下的音轨参数,带来宛如身临其境的震撼音效。即将于5月31日20点正式开售的创维98A23同样备受瞩目。98吋巨幕搭载ADS抗光屏,击破巨幕观影痛点;在120Hz高刷新率和Hi-Fi级三分频音响的配合下,98A23带来声画俱佳的影院级沉浸感。除居家观影外,98A23还内置MIITEE办公模式,可轻松换身“公屏”,满足无线投屏、会议、办公全场景等商务需求。618大促在即,创维已推出“下单赢清空购物车大奖”的限时活动,在5月20日20:00至6月20日20:00期间,于指定店铺购买任意型号的创维电视,即可获得一次抽奖机会(具体活动规则以各店铺公告为准,具体预售时间以渠道为准)。自6月20日20:00起,进入创维电视官方直播间,即可参与抽奖,并于直播间现场获悉中奖名单。狂欢已启幕,福利待放送,期待大家加购心仪电视,开启超感官的视听盛宴。

2024年12月06日,15. 引入失败经历:交谈中,一旦你高高在上地审视对方,闲聊就会充满说教意味。

...高清电影冲完整版电视剧冲手机免费在线观看-天天韩剧网

海港俱乐部回应奥斯卡发文:很快相见我们也爱你2022-08-03 09:30·直播吧直播吧8月3日讯 今天海港外援奥斯卡发文称自己因个人与家庭问题已回到巴西但仍然是海港球员海港俱乐部在官方微博中发文回应称很快就能相见奥斯卡发文写道:2022年伊始我逐渐遇到个人与家庭问题的挑战也在最近回到了故乡巴西陪伴家人回来巴西我会在家训练或与当地球队一起训练尽力保持自己的精气神与竞技状态毫无疑问我仍然也将继续是上海海港俱乐部的一员我的心和队友们在一起也会为球队打气加油再次感谢所有球迷和俱乐部上下所有工作人员与队友在这段时间对我们的帮助、理解与支持希望早日再见到大家海港俱乐部官方转发了奥斯卡的微博并写道:See u soon Love u too(很快相见 我们也爱你)此前据罗马诺消息奥斯卡接近加盟弗拉门戈预计交易会很快完成(小虎)

2024款丰田威兰达的外观设计的运动得体,车头的造型处理的较为立体,前大灯组的样式饱满,并且保持一定角度的倾斜,支持了尝贰顿远近光源。进气格栅是梯形的样式,两侧切割样式的线条设计提升了立体感,前包围处理的略带层次感。近日,有博主曝光了据称是苹果颈笔丑辞苍别?15?笔谤辞的颁础顿设计图。据设计图可见,全新的颈笔丑辞苍别?15?笔谤辞、颈笔丑辞苍别?15?笔谤辞?惭补虫将彻底取消音量按键和静音按键,采用固态音量和静音按键。

锄耻颈箩颈苍诲别测颈锄丑补苍驳锄丑补辞辫颈补苍辩耻别谤补苍驳蹿别苍蝉颈尘别苍箩颈耻虫颈苍产耻测颈,苍补驳别锄别苍驳箩颈苍驳测颈辩颈蹿别苍驳蹿补诲别苍补苍蝉丑别苍,谤耻箩颈苍辩耻别虫颈补苍濒耻肠丑耻蝉耻颈测耻别诲别丑别苍箩颈。锄辞苍驳别谤测补苍锄丑颈,驳辞耻肠丑别锄丑颈濒惫蝉耻颈濒颈苍驳谤别苍虫颈苍驳蹿别苍,诲补苍锄补颈驳别锄丑辞苍驳测辞耻丑耻颈丑别锄别苍驳辫颈苍尘颈补苍辩颈补苍产补辞肠丑颈辩颈苍驳虫颈苍驳迟辞耻苍补辞锄丑颈驳耻补苍锄丑辞苍驳测补辞。箩颈锄丑耻,锄丑别苍锄丑别苍驳诲别测辞耻丑耻颈测颈苍驳箩颈补苍濒颈锄补颈迟辞耻尘颈苍驳、驳辞苍驳锄丑别苍驳诲别箩颈肠丑耻蝉丑补苍驳。锄补颈虫颈补苍驳蝉丑辞耻测辞苍驳测辞耻虫颈苍肠丑别诲别濒别辩耻迟辞苍驳蝉丑颈,测别测补辞虫耻别丑耻颈蝉丑颈产颈别产颈苍驳产颈办补颈苍补虫颈别办补苍蝉颈尘别颈丑补辞蝉丑颈锄别补苍肠补苍驳虫耻补苍箩颈诲别虫颈补辞蹿别颈虫颈补苍锄耻辞。产颈箩颈苍驳,尘别颈测颈肠颈尘颈苍驳锄丑颈诲别虫耻补苍锄别,诲耻蝉丑颈诲耻颈锄颈箩颈丑别箩颈补谤别苍补苍辩耻补苍蹿耻锄别诲别产颈补辞虫颈补苍。谤补苍驳飞辞尘别苍测颈辩颈,锄耻辞测颈飞别颈濒颈虫颈苍驳诲别驳辞耻肠丑别锄丑别,虫颈补苍驳蝉丑辞耻肠丑耻苍肠耻颈诲别箩颈补蝉丑颈濒别辩耻产补!

丰(贵别苍驳)乐(尝别)镇(窜丑别苍)除(颁丑耻)奸(闯颈补苍)

liqiangchenmoliao,tazhidaomuqindehuayouyidingdedaoli,dantayeqingchu,shenzuobuhuijieshouzhegeanpai。raner,muqindejianchirangtagandaowulifankang。$24 now 29% off

“耳(贰谤)朵(顿耻辞)本(叠别苍)身(厂丑别苍)具(闯耻)有(驰辞耻)叁(厂补苍)个(骋别)特(罢别)点(顿颈补苍)的(顿别)人(搁别苍),一(驰颈)般(叠补苍)来(尝补颈)说(厂丑耻辞)都(顿耻)会(贬耻颈)是(厂丑颈)长(颁丑补苍驳)寿(厂丑辞耻)之(窜丑颈)象(齿颈补苍驳)。我(奥辞)看(碍补苍)您(狈颈苍)的(顿别)耳(贰谤)朵(顿耻辞),恰(蚕颈补)好(贬补辞)叁(厂补苍)个(骋别)特(罢别)点(顿颈补苍)都(顿耻)符(贵耻)合(贬别),所(厂耻辞)以(驰颈)您(狈颈苍)活(贬耻辞)到(顿补辞)现(齿颈补苍)在(窜补颈)还(贬耻补苍)很(贬别苍)健(闯颈补苍)康(碍补苍驳)。”

elasticsearch分词器 character filter ,tokenizer,token filter2023-09-02 18:14·孫攀龍分词器:规范化:normalization字符过滤器:character filter分词器:tokenizer令牌过滤器:token filter无论是内置的分析器(analyzer),还是自定义的分析器(analyzer),都由三种构件块组成的:character filters , tokenizers , token filters。内置的analyzer将这些构建块预先打包到适合不同语言和文本类型的analyzer中。Character filters (字符过滤器)字符过滤器以字符流的形式接收原始文本,并可以通过添加、删除或更改字符来转换该流。举例来说,一个字符过滤器可以用来把阿拉伯数字(??????????)转成成Arabic-Latin的等价物(0123456789)。一个分析器可能有0个或多个字符过滤器,它们按顺序应用。(PS:类似Servlet中的过滤器,或者拦截器,想象一下有一个过滤器链)Tokenizer (分词器)一个分词器接收一个字符流,并将其拆分成单个token (通常是单个单词),并输出一个token流。例如,一个whitespace分词器当它看到空白的时候就会将文本拆分成token。它会将文本“Quick brown fox!”转换为[Quick, brown, fox!](PS:Tokenizer 负责将文本拆分成单个token ,这里token就指的就是一个一个的单词。就是一段文本被分割成好几部分,相当于Java中的字符串的 split )分词器还负责记录每个term的顺序或位置,以及该term所表示的原单词的开始和结束字符偏移量。(PS:文本被分词后的输出是一个term数组)一个分析器必须只能有一个分词器Token filters (token过滤器)token过滤器接收token流,并且可能会添加、删除或更改tokens。例如,一个lowercase token filter可以将所有的token转成小写。stop token filter可以删除常用的单词,比如 the 。synonym token filter可以将同义词引入token流。不允许token过滤器更改每个token的位置或字符偏移量。一个分析器可能有0个或多个token过滤器,它们按顺序应用。小结&回顾analyzer(分析器)是一个包,这个包由三部分组成,分别是:character filters (字符过滤器)、tokenizer(分词器)、token filters(token过滤器)一个analyzer可以有0个或多个character filters一个analyzer有且只能有一个tokenizer一个analyzer可以有0个或多个token filterscharacter filter 是做字符转换的,它接收的是文本字符流,输出也是字符流tokenizer 是做分词的,它接收字符流,输出token流(文本拆分后变成一个一个单词,这些单词叫token)token filter 是做token过滤的,它接收token流,输出也是token流由此可见,整个analyzer要做的事情就是将文本拆分成单个单词,文本 ----> 字符 ----> token1 normalization:文档规范化,提高召回率停用词时态转换大小写同义词语气词#normalizationGET _analyze{ "text": "Mr. Ma is an excellent teacher", "analyzer": "english"}2 字符过滤器(character filter):分词之前的预处理,过滤无用字符HTML StripMappingPattern ReplaceHTML Strip##HTML Strip Character Filter###测试数据

I'm so happy!

DELETE my_indexPUT my_index{ "settings": { "analysis": { "char_filter": { "my_char_filter(自定义的分析器名字)":{ "type":"html_strip", "escaped_tags":["a"] } }, "analyzer": { "my_analyzer":{ "tokenizer":"keyword", "char_filter":["my_char_filter(自定义的分析器名字)"] } } } }}GET my_index/_analyze{ "analyzer": "my_analyzer", "text": "

I'm so happy!

"}Mapping##Mapping Character Filter DELETE my_indexPUT my_index{ "settings": { "analysis": { "char_filter": { "my_char_filter":{ "type":"mapping", "mappings":[ "滚 => *", "垃 => *", "圾 => *" ] } }, "analyzer": { "my_analyzer":{ "tokenizer":"keyword", "char_filter":["my_char_filter"] } } } }}GET my_index/_analyze{ "analyzer": "my_analyzer", "text": "你就是个垃圾!滚"}Pattern Replace##Pattern Replace Character Filter #17611001200DELETE my_indexPUT my_index{ "settings": { "analysis": { "char_filter": { "my_char_filter":{ "type":"pattern_replace", "pattern":"(\\d{3})\\d{4}(\\d{4})", "replacement":"$1****$2" } }, "analyzer": { "my_analyzer":{ "tokenizer":"keyword", "char_filter":["my_char_filter"] } } } }}GET my_index/_analyze{ "analyzer": "my_analyzer", "text": "您的手机号是17611001200"}3 令牌过滤器(token filter)--停用词、时态转换、大小写转换、同义词转换、语气词处理等。比如:has=>have him=>he apples=>apple the/oh/a=>干掉大小写时态停用词同义词语气词#token filterDELETE test_indexPUT /test_index{ "settings": { "analysis": { "filter": { "my_synonym": { "type": "synonym_graph", "synonyms_path": "analysis/synonym.txt" } }, "analyzer": { "my_analyzer": { "tokenizer": "ik_max_word", "filter": [ "my_synonym" ] } } } }}GET test_index/_analyze{ "analyzer": "my_analyzer", "text": ["蒙丢丢,大G,霸道,daG"]}GET test_index/_analyze{ "analyzer": "ik_max_word", "text": ["奔驰G级"]}近义词匹配DELETE test_indexPUT /test_index{ "settings": { "analysis": { "filter": { "my_synonym": { "type": "synonym", "synonyms": ["赵,钱,孙,李=>吴","周=>王"] } }, "analyzer": { "my_analyzer": { "tokenizer": "standard", "filter": [ "my_synonym" ] } } } }}GET test_index/_analyze{ "analyzer": "my_analyzer", "text": ["赵,钱,孙,李","周"]}大小写#大小写GET test_index/_analyze{ "tokenizer": "standard", "filter": ["lowercase"], "text": ["AASD ASDA SDASD ASDASD"]}GET test_index/_analyze{ "tokenizer": "standard", "filter": ["uppercase"], "text": ["asdasd asd asg dsfg gfhjsdf asfdg g"]}#长度小于5的转大写GET test_index/_analyze{ "tokenizer": "standard", "filter": { "type": "condition", "filter":"uppercase", "script": { "source": "token.getTerm().length() < 5" } }, "text": ["asdasd asd asg dsfg gfhjsdf asfdg g"]}转小写转大写长度小于5的转大写停用词https://www.elastic.co/guide/en/elasticsearch/reference/7.10/analysis-stop-tokenfilter.html#停用词DELETE test_indexPUT /test_index{ "settings": { "analysis": { "analyzer": { "my_analyzer自定义名字": { "type": "standard", "stopwords":["me","you"] } } } }}GET test_index/_analyze{ "analyzer": "my_analyzer自定义名字", "text": ["Teacher me and you in the china"]}#####返回 teacher and you in the china官方案例:官方支持的 token filterhttps://www.elastic.co/guide/en/elasticsearch/reference/7.10/analysis-stop-tokenfilter.html4 分词器(tokenizer):切词默认分词器:standard(英文切割,根据空白切割)中文分词器:ik分词https://www.elastic.co/guide/en/elasticsearch/reference/7.10/analysis-whitespace-tokenizer.html配置内置的分析器内置的分析器不用任何配置就可以直接使用。当然,默认配置是可以更改的。例如,standard分析器可以配置为支持停止字列表:curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'{ "settings": { "analysis": { "analyzer": { "std_english": { "type": "standard", "stopwords": "_english_" } } } }, "mappings": { "_doc": { "properties": { "my_text": { "type": "text", "analyzer": "standard", "fields": { "english": { "type": "text", "analyzer": "std_english" } } } } } }}'在这个例子中,我们基于standard分析器来定义了一个std_englisth分析器,同时配置为删除预定义的英语停止词列表。后面的mapping中,定义了my_text字段用standard,my_text.english用std_english分析器。因此,下面两个的分词结果会是这样的:curl -X POST "localhost:9200/my_index/_analyze" -H 'Content-Type: application/json' -d'{ "field": "my_text", "text": "The old brown cow"}'curl -X POST "localhost:9200/my_index/_analyze" -H 'Content-Type: application/json' -d'{ "field": "my_text.english", "text": "The old brown cow"}'第一个由于用的standard分析器,因此分词的结果是:[ the, old, brown, cow ]第二个用std_english分析的结果是:[ old, brown, cow ]--------------------------Standard Analyzer (默认)---------------------------如果没有特别指定的话,standard 是默认的分析器。它提供了基于语法的标记化(基于Unicode文本分割算法),适用于大多数语言。例如:curl -X POST "localhost:9200/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "standard", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'上面例子中,那段文本将会输出如下terms:[ the, 2, quick, brown, foxes, jumped, over, the, lazy, dog's, bone ]-------------------案例3---------------------标准分析器接受下列参数:max_token_length : 最大token长度,默认255stopwords : 预定义的停止词列表,如_english_ 或 包含停止词列表的数组,默认是 _none_stopwords_path : 包含停止词的文件路径curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'{ "settings": { "analysis": { "analyzer": { "my_english_analyzer": { "type": "standard", "max_token_length": 5, "stopwords": "_english_" } } } }}'curl -X POST "localhost:9200/my_index/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "my_english_analyzer", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'以上输出下列terms:[ 2, quick, brown, foxes, jumpe, d, over, lazy, dog's, bone ]---------------------定义--------------------standard分析器由下列两部分组成:TokenizerStandard TokenizerToken FiltersStandard Token FilterLower Case Token FilterStop Token Filter (默认被禁用)你还可以自定义curl -X PUT "localhost:9200/standard_example" -H 'Content-Type: application/json' -d'{ "settings": { "analysis": { "analyzer": { "rebuilt_standard": { "tokenizer": "standard", "filter": [ "lowercase" ] } } } }}'-------------------- Simple Analyzer---------------------------simple 分析器当它遇到只要不是字母的字符,就将文本解析成term,而且所有的term都是小写的。例如:curl -X POST "localhost:9200/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "simple", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'输入结果如下:[ the, quick, brown, foxes, jumped, over, the, lazy, dog, s, bone ]5 常见分词器:standard analyzer:默认分词器,中文支持的不理想,会逐字拆分。keyword分词器,不对输入的text内容做热呢和处理,而是将整个输入text作为一个tokenpattern tokenizer:以正则匹配分隔符,把文本拆分成若干词项。simple pattern tokenizer:以正则匹配词项,速度比pattern tokenizer快。whitespace analyzer:以空白符分隔 Tim_cookie6 自定义分词器:custom analyzerchar_filter:内置或自定义字符过滤器 。token filter:内置或自定义token filter 。tokenizer:内置或自定义分词器。分词器(Analyzer)由0个或者多个字符过滤器(Character Filter),1个标记生成器(Tokenizer),0个或者多个标记过滤器(Token Filter)组成说白了就是将一段文本经过处理后输出成单个单个单词PUT custom_analysis{ "settings":{ "analysis":{ } }}#自定义分词器DELETE custom_analysisPUT custom_analysis{ "settings": { "analysis": {#第一步:字符过滤器 接收原始文本,并可以通过添加,删除或者更改字符来转换字符串,转换成可识别的的字符串 "char_filter": { "my_char_filter": { "type": "mapping", "mappings": [ "& => and", "| => or" ] }, "html_strip_char_filter":{ "type":"html_strip", "escaped_tags":["a"] } }, "filter": { #第三步:令牌(token)过滤器 ,接收切割好的token流(单词,term),并且会添加,删除或者更改tokens, 如:lowercase token fileter可以把所有token(单词)转成小写,stop token filter停用词,可以删除常用的单词; synonym token filter 可以将同义词引入token流 "my_stopword": { "type": "stop", "stopwords": [ "is", "in", "the", "a", "at", "for" ] } }, "tokenizer": {#第2步:分词器,切割点,切割成一个个单个的token(单词),并输出token流。它会将文本“Quick brown fox!”转换为[Quick, brown, fox!],就是一段文本被分割成好几部分。 "my_tokenizer": { "type": "pattern", "pattern": "[ ,.!?]" } }, "analyzer": { "my_analyzer":{ "type":"custom",#告诉 "char_filter":["my_char_filter","html_strip_char_filter"], "filter":["my_stopword","lowercase"], "tokenizer":"my_tokenizer" } } } }}GET custom_analysis/_analyze{ "analyzer": "my_analyzer", "text": ["What is ,as.df ss

in ? &

| is ! in the a at for "]}------------------------------自义定2---------------------------------------------curl -X PUT "localhost:9200/simple_example" -H 'Content-Type: application/json' -d'{ "settings": { "analysis": { "analyzer": { "rebuilt_simple": { "tokenizer": "lowercase", "filter": [ ] } } } }}'Whitespace Analyzerwhitespace 分析器,当它遇到空白字符时,就将文本解析成terms示例:curl -X POST "localhost:9200/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "whitespace", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'输出结果如下:[ The, 2, QUICK, Brown-Foxes, jumped, over, the, lazy, dog's, bone. ]------------------------------Stop Analyzer-----------------top 分析器 和 simple 分析器很像,唯一不同的是,stop 分析器增加了对删除停止词的支持。默认用的停止词是 _englisht_(PS:意思是,假设有一句话“this is a apple”,并且假设“this” 和 “is”都是停止词,那么用simple的话输出会是[ this , is , a , apple ],而用stop输出的结果会是[ a , apple ],到这里就看出二者的区别了,stop 不会输出停止词,也就是说它不认为停止词是一个term)(PS:所谓的停止词,可以理解为分隔符)curl -X POST "localhost:9200/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "stop", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'输出[ quick, brown, foxes, jumped, over, lazy, dog, s, bone ]stop 接受以下参数:stopwords : 一个预定义的停止词列表(比如,_englisht_)或者是一个包含停止词的列表。默认是 _english_stopwords_path : 包含停止词的文件路径。这个路径是相对于Elasticsearch的config目录的一个路径curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'{ "settings": { "analysis": { "analyzer": { "my_stop_analyzer": { "type": "stop", "stopwords": ["the", "over"] } } } }}'上面配置了一个stop分析器,它的停止词有两个:the 和 overcurl -X POST "localhost:9200/my_index/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "my_stop_analyzer", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'基于以上配置,这个请求输入会是这样的:[ quick, brown, foxes, jumped, lazy, dog, s, bone ]Pattern Analyzercurl -X POST "localhost:9200/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "pattern", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog\u0027s bone."}'由于默认按照非单词字符分割,因此输出会是这样的:[ the, 2, quick, brown, foxes, jumped, over, the, lazy, dog, s, bone ]pattern 分析器接受如下参数:pattern : 一个Java正则表达式,默认 \W+flags : Java正则表达式flags。比如:CASE_INSENSITIVE 、COMMENTSlowercase : 是否将terms全部转成小写。默认truestopwords : 一个预定义的停止词列表,或者包含停止词的一个列表。默认是 _none_stopwords_path : 停止词文件路径curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'{ "settings": { "analysis": { "analyzer": { "my_email_analyzer": { "type": "pattern", "pattern": "\\W|_", "lowercase": true } } } }}'上面的例子中配置了按照非单词字符或者下划线分割,并且输出的term都是小写curl -X POST "localhost:9200/my_index/_analyze" -H 'Content-Type: application/json' -d'{ "analyzer": "my_email_analyzer", "text": "John_Smith@foo-bar.com"}'因此,基于以上配置,本例输出如下:[ john, smith, foo, bar, com ]Language Analyzers支持不同语言环境下的文本分析。内置(预定义)的语言有:arabic, armenian, basque, bengali, brazilian, bulgarian, catalan, cjk, czech, danish, dutch, english, finnish, french, galician, german, greek, hindi, hungarian, indonesian, irish, italian, latvian, lithuanian, norwegian, persian, portuguese, romanian, russian, sorani, spanish, swedish, turkish, thai7 中文分词器:ik分词安装和部署ik下载地址:https://github.com/medcl/elasticsearch-analysis-ikGithub加速器:https://github.com/fhefh2015/Fast-GitHub创建插件文件夹 cd your-es-root/plugins/ && mkdir ik将插件解压缩到文件夹 your-es-root/plugins/ik重新启动esIK文件描述IKAnalyzer.cfg.xml:IK分词配置文件主词库:main.dic英文停用词:stopword.dic,不会建立在倒排索引中特殊词库:quantifier.dic:特殊词库:计量单位等suffix.dic:特殊词库:行政单位surname.dic:特殊词库:百家姓preposition:特殊词库:语气词自定义词库:网络词汇、流行词、自造词等ik提供的两种analyzer:ik_max_word会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合,适合 Term Query;ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”,适合 Phrase 查询。热更新远程词库文件优点:上手简单缺点:词库的管理不方便,要操作直接操作磁盘文件,检索页很麻烦文件的读写没有专门的优化性能不好多一层接口调用和网络传输ik访问数据库MySQL驱动版本兼容性https://dev.mysql.com/doc/connector-j/8.0/en/connector-j-versions.htmlhttps://dev.mysql.com/doc/connector-j/5.1/en/connector-j-versions.html驱动下载地址https://mvnrepository.com/artifact/mysql/mysql-connector-java演示下载安装:扩展词库:重启es后生效=》本文来自博客园,作者:孙龙-程序员,转载请注明原文链接:https://www.cnblogs.com/sunlong88/p/17093708.html不过儿子、儿媳却担心他天天散步会不小心摔倒,毕竟身边就有散步摔倒骨折的老人。...高清电影冲完整版电视剧冲手机免费在线观看-天天韩剧网

正在水中挣扎

发布于:古浪县
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
意见反馈 合作

Copyright ? 2023 Sohu All Rights Reserved

搜狐公司 版权所有