美女扒开腿让男人桶爽久久软_免费观看四虎精品成人_精品国产亚洲一区二区麻豆_色老汉一区二区三区_老湿机69福利_久久久日本电影_久久精品免费一区二区_久久视频国产精品免费视频在线_热草久综合在线_中文字幕永久免费

美林?jǐn)?shù)據(jù)
ABOUT US
美林?jǐn)?shù)據(jù)技術(shù)股份有限公司(簡(jiǎn)稱(chēng):美林?jǐn)?shù)據(jù),NEEQ:831546)是國(guó)內(nèi)知名的數(shù)據(jù)治理和數(shù)據(jù)分析服務(wù)提供商。

Tempo數(shù)據(jù)挖掘—文本挖掘之信息抽取

2018-07-31 16:30:00
Tempo數(shù)據(jù)挖掘平臺(tái)是對(duì)數(shù)據(jù)的深度探索,發(fā)掘數(shù)據(jù)價(jià)值:圖形化拖曳式的數(shù)據(jù)挖掘建模工具,開(kāi)箱即用的內(nèi)置機(jī)器學(xué)習(xí)算法,讓業(yè)務(wù)人員快速進(jìn)行數(shù)據(jù)模型構(gòu)建與優(yōu)化,完成數(shù)據(jù)深層次價(jià)值的探索與挖掘。更多詳細(xì)介紹盡在網(wǎng)站內(nèi)部,今天我們著重給大家介紹其中文本挖掘之信息抽取。
 
Tempo數(shù)據(jù)挖掘工具

1、信息抽取

信息抽取的定義為:從自然語(yǔ)言文本中抽取指定類(lèi)型的實(shí)體、關(guān)系、事件等事實(shí)信息,并形成結(jié)構(gòu)化數(shù)據(jù)輸出的文本處理技術(shù)。
信息抽取有許多不同的用途,一種典型的應(yīng)用是使用信息抽取面向特定任務(wù)的結(jié)構(gòu)化信息,互聯(lián)網(wǎng)的快速發(fā)展產(chǎn)生了海量的信息,由于文本數(shù)據(jù)的多樣性和異構(gòu)性,對(duì)這些的信息進(jìn)行檢索和處理受到很大的限制,而信息抽取則致力于將這些信息轉(zhuǎn)化成結(jié)構(gòu)化的數(shù)據(jù),滿足搜索引擎和數(shù)據(jù)挖掘等相關(guān)應(yīng)用。另一種典型的應(yīng)用是特定目標(biāo)信息的發(fā)現(xiàn)和識(shí)別(如發(fā)現(xiàn)與“人工智能”相關(guān)的新聞)。在現(xiàn)在的Web中,相關(guān)的信息往往被無(wú)關(guān)的信息的淹沒(méi),而信息抽取技術(shù)可以發(fā)現(xiàn)并整理蘊(yùn)含在海量信息中的特定目標(biāo)信息,為正確決策提供大量的相關(guān)情報(bào),大大降低需要的人工成本。

2、算法原理

語(yǔ)言的表述通常具有規(guī)律性,對(duì)于相似意圖的描述一般會(huì)有固定的表達(dá)模式,對(duì)這些固定表達(dá)模式進(jìn)行泛化即可抽象出語(yǔ)言表述對(duì)應(yīng)的模板。如我們常說(shuō)“我 吃 蘋(píng)果”和“我 吃 梨”,那么通過(guò)泛化表述語(yǔ)句中的不同部分,就可以抽象出相應(yīng)的語(yǔ)言表述模板“我 吃 [FOOD]”,其中[FOOD]稱(chēng)為泛化槽位,即在槽位中填上其他的詞(如“西瓜”),就可以生成新的語(yǔ)句“我 吃 西瓜”。很顯然,槽位的填充是要滿足一定約束的,如[FOOD]槽位應(yīng)該填充食物相關(guān)的詞才是符合語(yǔ)義的,這些約束就是所謂的規(guī)則。
規(guī)則模板引擎我們期望實(shí)現(xiàn)的是簡(jiǎn)單匹配, 所以我們對(duì)于文法的設(shè)計(jì)盡可能的簡(jiǎn)化,定義模板的元字符為四類(lèi):泛化槽位、固定詞、通配符、注冊(cè)函數(shù)。例如我們構(gòu)造了一個(gè)識(shí)別建筑物地址的模板:
[D:ner_street][F:num]號(hào)[W:1-6][D:building]
很顯然,構(gòu)造該模板如圖1是基于如下的先驗(yàn)知識(shí)進(jìn)行的:我們經(jīng)常有“長(zhǎng)安路26號(hào)宏遠(yuǎn)大廈”這樣的表述,所以“長(zhǎng)安路”可以被泛化為槽位,以便其他街道的名稱(chēng)也能適用,同理“大廈”被歸集到[D:building]的槽位詞典中;至于多少號(hào)的數(shù)字可以通過(guò)數(shù)字識(shí)別的注冊(cè)函數(shù)實(shí)現(xiàn);而大廈的名稱(chēng)比較多樣化,索性就用通配符匹配“大廈”前面的1-6個(gè)字節(jié)實(shí)現(xiàn)。
 
模板Trie樹(shù)匹配示例
圖1 模板Trie樹(shù)匹配示例

3、利用Tempo數(shù)據(jù)挖掘平臺(tái)實(shí)現(xiàn)信息抽取

Tempo文本挖掘算法模塊提供了豐富的文本挖掘功能節(jié)點(diǎn),能夠覆蓋整個(gè)文本挖掘的生命周期,它在兼顧專(zhuān)業(yè)性的同時(shí)保持非常友好的易用性。Tempo友好的圖形化操作界面,使用鼠標(biāo)即可完成數(shù)據(jù)挖掘全過(guò)程;便捷的參數(shù)設(shè)置窗口,使模型的構(gòu)建更加靈活;自定義詞典、配置文件均為明文,可滿足不同業(yè)務(wù)場(chǎng)景的個(gè)性化需求。  
金融機(jī)構(gòu)向客戶發(fā)送的短信是文本形式的,需要從這些文本短信中分析出用戶是否出現(xiàn)逾期記錄,逾期行為的具體信息,如逾期時(shí)間、逾期金額、借款機(jī)構(gòu)等。以金融信貸短信的信息抽取為例子,我們講如何利用Tempo信息抽取節(jié)點(diǎn)從金融信貸短信中抽取出逾期金額、時(shí)間、借款機(jī)構(gòu)等結(jié)構(gòu)化信息點(diǎn)。抽取過(guò)程可分為下面三部分:
信息抽取流程
圖2 信息抽取流程

第一步,數(shù)據(jù)準(zhǔn)備
在使用信息抽取算法時(shí),需要將短信文本整理為T(mén)empo可讀取的文件格式,關(guān)系數(shù)據(jù)庫(kù)表或者txt、 csv等文本文件。我們整理的數(shù)據(jù)格式如下表:
id 短信文本
1 【華嚴(yán)法務(wù)】尊敬的客戶,您在閃電平臺(tái)借款截止2016年07月28日逾期共計(jì)1000元。若您還款困難,請(qǐng)立即聯(lián)系客服為您協(xié)調(diào)解決?;貜?fù)TD退訂。
2 【信而富】尊敬的客戶,您的借款已逾期,需還款520.50元。請(qǐng)前往微信公眾號(hào)“信而富現(xiàn)金貸”還款,避免產(chǎn)生更多延遲還款服務(wù)費(fèi)及不良的信用影響。點(diǎn)滴信用,成就未來(lái)!
3 【靠譜鳥(niǎo)】尊敬的客戶,您在更美貸借款1000逾期未還,我司將上報(bào)全國(guó)誠(chéng)信系統(tǒng)并起訴至法院,請(qǐng)轉(zhuǎn)告盡快還款電話4008986985,回復(fù)TD退訂
 
第二步:構(gòu)建信息抽取模型
 
這一步是最重要的一步,打開(kāi)信息抽取節(jié)點(diǎn),配置模版文件、槽位文件、可略詞文件。我們的目的是抽取,日期、逾期金額、貸款機(jī)構(gòu)。
Tempo數(shù)據(jù)挖掘-信息抽取節(jié)點(diǎn)參數(shù)界面
圖3信息抽取節(jié)點(diǎn)參數(shù)界面

 
分別點(diǎn)擊下載模版文件、槽位文件、可略詞文件。下載完成后本地會(huì)出現(xiàn)三個(gè)txt文件,以第一條短信為例,我們看一下如何配置這三個(gè)文件,第一條的文本短信內(nèi)容為:“【華嚴(yán)法務(wù)】尊敬的客戶,您在閃電平臺(tái)借款截止2016年07月28日逾期共計(jì)1000元。若您還款困難,請(qǐng)立即聯(lián)系客服為您協(xié)調(diào)解決?;貜?fù)TD退訂。”,目的是抽取日期,逾期金額,貸款機(jī)構(gòu)。因?yàn)橥唤鹑跈C(jī)構(gòu)發(fā)送的短信信息格式相對(duì)固定,通過(guò)模板基于元字符匹配并提取文本中的可變字符,以上短信中紅字部分均為可變字符,這些可變字符正好對(duì)應(yīng)我們想要抽取的貸款機(jī)構(gòu),逾期金額和日期。首先我們抽取貸款機(jī)構(gòu),短信中貸款機(jī)構(gòu)出現(xiàn)的上下文為“在XXXX借款”,因?yàn)槲覀儫o(wú)法判定用戶在什么平臺(tái)上借款,所以匹配“閃電平臺(tái)”用任意字符匹配,我們就可以使用匹配出閃電平臺(tái),接著通過(guò)內(nèi)置的注冊(cè)函數(shù)匹配日期。最后我們匹配逾期金額,逾期金額出現(xiàn)的上下文為“逾期共計(jì)1000元”我們的目的是把“1000”抽取出來(lái),逾期金額一般為數(shù)字,因此用[F:num]匹配數(shù)字,一般只有在“元”,或者“塊”,“美元”等詞前面出現(xiàn)的數(shù)字才為金額。所以在[F:num]后增加槽位。應(yīng)此最終的匹配模板為:“【借款截止逾期共計(jì) 機(jī)構(gòu)_6,還款日期_8:date,金額_10:double”。模板信息主要包含兩部分內(nèi)容,其中“【借款截止逾期共計(jì)”為規(guī)則模板,“機(jī)構(gòu)_6,還款日期_8:date,金額_10:double”為抽取的結(jié)構(gòu)化信息,兩個(gè)字符串以Tab鍵間隔。“機(jī)構(gòu)_6”表示抽取的信息字段名為“機(jī)構(gòu)”值在第6個(gè)槽位,槽位索引從1開(kāi)始,一個(gè)元字符代表一個(gè)槽位。“還款日期_8”表示抽取的信息字段名為“還款日期”值在第8個(gè)槽位,“date”表示輸出類(lèi)型為日期型;“金額_10”表示抽取的信息字段名“金額”值在第10個(gè)槽位,“double”表示輸出的金額格式為double類(lèi)型。以上短信文件信息抽取最終的規(guī)則模板文件為:
 
規(guī)則模板文件
借款截止逾期共計(jì)      機(jī)構(gòu)_6,還款日期_8:date,金額_10:double
還款      機(jī)構(gòu)_2,金額_6:double
借款逾期      機(jī)構(gòu)_6,金額_8:double

槽位詞典文件為:
槽位詞典文件  

還款
還錢(qián)



美元
歐元


已在
已經(jīng)
 
 
 

可忽略詞文件為:
可忽略詞文件  

 
 
 
 
將這三個(gè)文件分別上傳到對(duì)應(yīng)為目錄下。算法在校驗(yàn)規(guī)則模版文件、槽位文件、可略詞文件合法完成后會(huì)根據(jù)以上文件構(gòu)建規(guī)則模版樹(shù)和槽位樹(shù),把構(gòu)造的對(duì)象分發(fā)到分布式節(jié)點(diǎn)上供各節(jié)點(diǎn)對(duì)文本分布式信息抽取。

Tempo數(shù)據(jù)挖掘-文本信息抽取流程
圖4文本信息抽取流程圖
第三步:開(kāi)始信息抽取
信息抽取是基于Spark集群中的RDD數(shù)據(jù)實(shí)現(xiàn)文本信息抽取,基于RDD分布式遍歷每一條文本,通過(guò)分發(fā)到各節(jié)點(diǎn)的信息抽取模型實(shí)現(xiàn)對(duì)文本信息抽取的原子操作。抽取結(jié)果如下圖
Tempo數(shù)據(jù)挖掘-文本信息抽取結(jié)果
圖5文本信息抽取結(jié)果表

 
以上是美林?jǐn)?shù)據(jù)小編對(duì)基于Tempo數(shù)據(jù)挖掘工具的文本挖掘中信息抽取的詳細(xì)介紹,想要了解更多Tempo數(shù)據(jù)挖掘平臺(tái)功能的小伙伴,歡迎您來(lái)電咨詢或試用我們的產(chǎn)品,我們將竭誠(chéng)為您服務(wù)!
服務(wù)熱線
400-608-2558
咨詢熱線
15502965860-
美林?jǐn)?shù)據(jù)
微信掃描二維碼,立即在線咨詢
菠萝蜜影院一区二区免费| 视频在线99re| 少妇人妻丰满做爰xxx| 999久久久精品一区二区| 91免费看视频| 日韩av电影国产| 国内精品美女av在线播放| 午夜欧美巨大性欧美巨大| 91最新在线观看| 日韩国产在线不卡视频| 亚洲精品va| 久久久老熟女一区二区三区91| 夜夜躁狠狠躁日日躁av| 亚洲午夜国产一区99re久久| 精品午夜av| 精品无线一线二线三线| eeuss影院网站免费观看| 精彩视频一区二区| 精品无人区麻豆乱码久久久| 国产三级一区二区| 18成人免费观看视频漫画| 日韩三级一区| www.999av| 成人黄色片免费| 国产精品免费视频二三区| 先锋影音资源综合在线播放av| 日韩最新中文字幕电影免费看| 国产精品久久久久久久久久久久冷| 爱草tv视频在线观看992| 日韩国产在线| 免费三级毛片| 日韩性生活视频| 一二三区不卡| 国产黄色片在线免费观看| 中文日产幕无线码一区二区| 日本中文字幕观看| 欧美aaaaa成人免费观看视频| 欧美性xxxxxxxxx| 日本一区二区黄色| 国色天香一区二区| 97超碰资源站在线观看| 无码内射中文字幕岛国片| 国产va免费精品高清在线观看| 激情久久中文字幕| 亚洲一区二区三区四区不卡| 欧美极品欧美精品欧美视频| 粉嫩av四季av绯色av第一区| www.男人的天堂| 粗暴蹂躏中文一区二区三区| 国产一二三四区在线| а天堂中文在线资源| 蜜乳av一区二区| 国产精品一二| 在线免费av一区| 欧美中文字幕在线观看视频| 日韩欧美的一区二区| 精品国产美女在线| 乱精品一区字幕二区| 91网址在线观看精品| 成人天堂资源www在线| 在线永久看片免费的视频| 日本一二区视频| 欧美午夜网站| 国产精品视频xxxx| 秋霞在线一区二区| 色久欧美在线视频观看| 91久久偷偷做嫩草影院| 亚洲欧美日韩国产综合精品二区| 欧美日韩国产激情| jizzjizzjizz亚洲日本| 日本高清免费不卡视频| 国产精品久久久久久久app| 精品国产免费久久久久久尖叫| 91一区二区三区四区| 粉嫩av一区二区三区免费野| 日韩精品一区二区三| 国产福利资源在线| 国产精品久久久国产盗摄| 亚洲尤物在线| 亚洲人成无码www久久久| 久久久久久久九九九九| 国产精品无码专区av在线播放| 2020国产精品久久精品美国| 美女一区二区在线观看| 无码人妻av一区二区三区波多野| 亚洲三级小视频| 好吊的妞视频这里都有| 久久久精品视频国产| 亚洲欧美日韩国产成人综合一二三区| 91精品国产高清一区二区三区蜜臀| 亚洲影院一区二区三区| 一个人免费观看视频www在线播放| 91欧美精品午夜性色福利在线| 婷婷一区二区三区| 久草精品视频在线观看| 亚洲精品成人三区| 国产成人一区二区三区免费看| 日韩视频在线免费| 国产av一区二区三区精品| 欧美一区二区三区网站| 91精品国产综合久久香蕉| 外国成人毛片| 成人ssswww在线播放| av动漫在线观看| 欧美亚韩一区二区三区| 久久99精品视频一区97| 国产乱国产乱老熟300部视频| 97超碰人人模人人人爽人人爱| 天天夜夜亚洲| 高清日韩av| 国产在线视视频有精品| 亚洲av无码成人精品国产| 欧美日韩国产一区中文午夜| 欧美体内she精高潮| 日韩免费在线| 免费观看av网站| 91久久精品国产| 免费成人直播| 国产高清999| 中国一级大黄大黄大色毛片| 欧美激情视频网站| 国产日韩精品综合网站| 日本精品性网站在线观看| 国内外成人激情免费视频| 黄色一级片免费的| 99热在这里有精品免费| 午夜私人影院在线观看| 青青草成人免费视频| 亚洲欧洲视频在线观看| 一区二区三区在线视频看| 免费在线视频一级不卡| 中文字幕第66页| 黄色动漫在线| 精品国产18久久久久久二百| 亚洲黄色在线观看视频| 麻豆免费在线观看视频| 国精产品一区一区三区有限在线| 先锋影音av在线| 国产精品美女午夜爽爽| 伊人久久大香线蕉精品组织观看| 国产乱国产乱老熟| 成人直播在线| 午夜欧美性电影| 日韩精品一区二区亚洲av性色| 欧美hdsex| 国产精品qvod| 欧美一区=区| 貂蝉被到爽流白浆在线观看| 中文字幕导航| 色偷偷久久人人79超碰人人澡| 亚洲一卡二卡三卡四卡| 欧美一区二区日韩| 伊人成综合网站| jizz18日本| 天天色综合社区| 手机在线看片1024| 水野朝阳av一区二区三区| 四虎精品一区二区永久在线观看| 成人在线日韩| 国产精品久久久久77777丨| 99久久99| 久久99精品视频一区97| 成熟妇人a片免费看网站| 亚洲小视频在线播放| 久久精品久久久精品美女| 国产一区视频网站| 二区三区在线播放| 国产精品一级片在线观看| 亚洲影视第一页| aⅴ在线免费观看| 爱豆国产剧免费观看大全剧苏畅| 欧美一区二区播放| 欧美日韩国产成人在线免费| 日日噜噜夜夜狠狠久久波多野| 欧美少妇在线观看| 久久欧美在线电影| 欧美日本国产一区| 国产一区二区精品久久91| 男女性高潮免费网站| 2020亚洲男人天堂| 国产精品免费观看高清| 久久66热re国产毛片基地| 在线观看欧美日韩| 久久久久久av无码免费网站下载| 欧美日韩一区二区三区免费| 国产精品一国产精品最新章节| 欧美在线视频观看免费网站| 日韩免费视频| 青青青草视频在线| 国产一区二区三区在线观看免费视频| 亚洲欧美日韩三级| 伊人久久大香线蕉综合75| 国产综合精品视频| 免费人成又黄又爽又色| 日本不卡一二区| 中国极品少妇xxxx| 精品国产乱码久久久久| a看欧美黄色女同性恋| 又黄又爽在线观看| 日本a视频在线观看| 免费成人结看片| 亚洲性猛交xxxx乱大交| 亚洲一级免费视频| 天堂资源在线亚洲资源| 欧美成人一区二区在线| 亚洲av激情无码专区在线播放| 四虎影视18库在线影院| 国产精品日本| 久久人人爽亚洲精品天堂| 色一情一伦一子一伦一区| www 久久久| 国产毛片精品国产一区二区三区| 国产视频在线播放| 中文字幕另类日韩欧美亚洲嫩草| 欧美日韩一二三区| 国产蜜臀av在线一区二区三区| 精品一性一色一乱农村| √资源天堂中文在线| 天堂网一区二区三区| 久久久久久久久电影| 欧美另类videoxo高潮| 色综合久久综合| 国产精品一二二区| 欧美第一精品| 久久久久久亚洲av无码专区| 97国产精品视频人人做人人爱| 国产精品一色哟哟哟| 成人在线国产视频| 99re6这里只有精品视频在线观看| 欧美成人精品欧美一级乱黄| 日本啊v在线| 久久久精品视频成人| 国产精品va在线| 国产成人午夜精品| 极品裸体白嫩激情啪啪国产精品| 97dyy97影院理论片在线| h片在线观看视频| 久久综合88中文色鬼| 久久一区免费| 国产午夜精品无码一区二区| 亚洲a∨精品一区二区三区导航| 337p日本欧洲亚洲大胆张筱雨| 99在线精品视频免费观看软件| 国产亚洲精品aa午夜观看| 久久国产精品露脸对白| 欧美在线www| 国内自拍视频网| 亚洲大香人伊一本线| 色xxx在线播放| 中文娱乐网av| 无码人妻一区二区三区在线| 少妇精品久久久一区二区| 九九热精品国产| 蜜桃臀一区二区三区| 国产精品一区二区三区不卡| 欧美群妇大交群的观看方式| 欧美久久久久久一卡四| 韩日三级av| 欧美区二区三区| 欧美xx视频| 亚洲免费黄色网址| 日本在线观看高清完整版| 91精品国产91综合久久蜜臀| 日韩激情av在线| 免费男同深夜夜行网站| 精品污污网站免费看| 色综合天天狠狠| 99久久99久久精品国产片果冰| 亚洲免费一级片| 老司机精品视频在线| 免费一级黄色录像| 女同性恋一区二区| 青青草国产成人99久久| 色综合97天天综合网| 国产精品成人一区二区三区吃奶| 日韩av官网| 99久久免费国产精品| 国产精品久久久久久久久| 成人免费淫片95视频观看网站| 男人天堂久久久| 亚洲精品乱码久久久久久久久久久久| 亚洲熟妇无码一区二区三区导航| 成人h猎奇视频网站| 国产寡妇树林野战在线播放| 欧美日韩激情在线一区二区三区| 国产激情视频在线观看| 国产白浆在线| 日韩电影免费观看| 国产特级毛片| 亚洲a一级视频| 欧美亚洲视频在线观看| 日韩电影在线观看网站| 黄大色黄女片18免费| 欧美日韩电影一区二区三区| 午夜亚洲性色福利视频| 亚洲高清av一区二区三区| 美女激情福利视频在线观看| 自拍偷拍色综合| 亚洲精品一区二区三区不卡| 亚洲久草在线| 中文字幕在线亚洲三区| 亚洲の无码国产の无码步美| 97精品国产97久久久久久粉红| 玖玖综合伊人| 婷婷社区五月天| 黄色资源在线观看| 国产最新免费视频| 极品少妇xxxx精品少妇| 4hu四虎永久网址| 欧美成人a交片免费看| 亚洲高清不卡| 免费视频二区| 夜夜添无码一区二区三区| 美女爽到高潮91| 亚洲第一福利网| 人人干人人草| av网站在线免费看| 美女视频黄a大片欧美| jk破处视频在线| 亚洲欧洲在线观看av| 1024在线播放| 天堂av在线资源| 日韩欧美福利视频| 国产最新免费视频| 国产欧美一区二区精品性| av中文一区| 2018av男人天堂| 99久久精品无免国产免费|