日本午夜免费一区二区,亚洲麻豆一区,国产伦精品一区二区三区千人斩,日韩高清电影一区

美林數據
ABOUT US
美林數據技術股份有限公司(簡稱:美林數據,NEEQ:831546)是國內知名的數據治理和數據分析服務提供商。

大話數據挖掘之聚類分析(上篇)

2021-01-28 14:17:45
人物介紹
許教授:國內數據挖掘專家、某985高校智能信息處理學術帶頭人
趙總:某電力公司總經理
萬總:某超市集團營銷副總
姜局長:市衛生局副局長
李部長:某鋼鐵集團生產部部長
 
某985高校管理學院第五屆EMBA班的《數據挖掘及其應用》課程上。
國內數據挖掘專家、智能信息處理學術帶頭人徐教授站在講臺上打開PPT說:“同學們,大家好!今天我們講的是數據挖掘中的聚類分析。”
“在平時的人際交往和私下的生活空間中,大多數人會自覺不自覺地加入到一個個社交圈子中。‘驢友’、‘同學會’、‘高爾夫俱樂部’,林林總總。真可謂‘物以類聚,人以群分’。”徐教授開始了聚類的講解。


聚類算法

“徐老師,是不是說,圈子就是聚類?”一學員問。
徐教授沒有正面回答,繼續說:“大家想一想,生活中的圈子有什么特點?”
李部長說到:“社會學家指出,‘圈子’就是由志向、趣味、地位、年齡、職業、愛好、特長、個性、收入甚至居住地點比較相近的人自發形成的團體。”
“對了,正是因為這些人具有相似的特征,他們才能聚集在一起。聚類就是將數據對象劃分成若干個類,在同一類中的對象具有較高的相似度,而不同類中的對象差異較大。”徐教授趁機給出了聚類的經典定義。
機器學習-聚類算法

剛才提問的那位學員從徐教授話語悟出了聚類的真諦,感慨道:“我有點明白了,我們加入某個‘圈子’,實際上就是聚類的過程,因為這個圈子的成員與我們有著相似的特點。”
這時,徐教授才對這位學員理解的圈子就是聚類作了正面回應:“回答正確,加十分!”
“徐老師,從聚類的定義來看,進行聚類前并不知道所研究的對象有多少個類,聚類的過程就是通過相似性的度量,使對象聚集成若干個類,各個類的成員具有其共同的或相似的特性。”李部長說出了自己對聚類的理解。
徐教授認為李部長的理解已經比較深刻,頻頻點頭。他因勢利導,又提出了一個深刻的問題:“聚類的關鍵是對象相似性的度量,大家想一想,如何度量數據對象的相似性呢?”
李部長搶答道:“兩個對象間的距離越小,說明二者越相似,用距離度量對象的相似性應該是最自然的方法。”
徐教授滿意地點了點頭:“對,基于距離度量對象的相似性的思想,研究者提出了兩類經典的聚類算法:劃分方法和層次聚類方法。”
趙總似乎對這兩種方法有所了解,說道:“聽我們公司數據挖掘算法組經常說Partitioning Method和 Hierarchial Method,原來就是指的這兩類聚類算法。徐老師,昨天晚上我預習時大概了解了一下聚類算法,但理解的不夠深刻,您就給我們講講吧。”
徐教授欣然答應,但沒有立即開始講算法,他先引導學員回顧基本的數學知識,問道:“大家還記得距離怎么計算?”
趙總簡潔地答道:“用歐氏距離唄!”
“對,就是大家在高等數學中經常用到的歐幾里得(Euclid)距離。不過在聚類分析中,還經常用到曼哈坦(Manhattan)距離、切比雪夫(Chebyshev)距離、馬哈拉諾比斯(Mahalanobis)距離等。其實,凡是滿足距離定義的四個條件即唯一性、非負性、對稱性和三角不等式的函數都可以作為距離公式。”
徐教授掃視了一下學員,覺得大家理解了距離的含義,于是說:“好了,我現在就簡單地介紹一下基于距離的聚類算法:劃分方法和層次方法。這兩類方法的典型代表分別為k-Means、k-Medoids和聚集、分裂算法。下面我就分別介紹這些算法。”
徐教授翻動了一下PPT,接著道:“k-Means算法的核心思想是把n個數據對象劃分為k個類,使每個類中的數據點到該類中心的距離平方和最小。”
李部長的腦子是雙核的,徐教授的話音剛落,他便道出了他的理解:“徐老師,k-Means算法本質上是在實現聚類的基本思想:類內數據點越近越好,類間點越遠越好盡可能算法。”
“李部長理解得完全正確,不過k-Means算法的思想只是給出了一個優化目標——距離之和最小,具體實現一般使用如PPT圖示的迭代算法。”
學員們都將注意力集中在k-Means算法框圖上,趙總看出了問題:“徐老師,k-Means算法事先就給定了聚類的個數k,然后通過迭代過程將數據點聚集到k個類中去。但是,一般情況我們并不知道數據點可以聚集成多少個類。”
“趙總說的對,k-Means算法就是要嘗試找出使平方誤差函數值最小的k個劃分,為了找出最合適的聚類個數k,一般要用若干個k去試驗,哪個k最后得到的距離平方和最小,就認為哪個k是最佳的聚類個數。”徐教授回答說。
李部長問道:“徐老師,k-Means算法第(3)步中的聚類中心是怎么計算的?”


聚類算法
 
“很簡單,將已聚集的點的均值作為新的聚類中心。這正是將這種聚類算法成為k-Means算法的原因。如果以各聚類均值點最近的點為聚類中心,其他步驟不變,則k-Means算法就變為k-Medoids算法了。”徐教授回答道。
徐教授突然冒出了個k-Medoids算法,又被李部長的雙核腦筋捕捉到了:“徐老師,k-Medoids算法只是對k-Means算法作了個小小的改變,這樣有什么作用呢?”
徐教授笑了笑,說:“k-Medoids算法用簇中最靠近中心的一個對象來代表該簇,而k-Means算法用質心來代表簇。可見k-Means算法對噪聲和孤立點數據非常敏感,因為一個離群值會對質心的計算帶來很大的影響。而k-Medoids算法通過用中心點來代替質心,可以有效地消除這種影響。”
聽徐教授這么一解釋,李部長又大發感慨:“真是小改變,大作用啊!”
趙總覺得他們電力行業對數據挖掘有迫切的應用需求,非常關注算法的應用效果,又問道:“k-Means算法的應用效果怎么樣?”
徐教授:“當結果簇是密集的,而簇與簇之間區別明顯時,k-Means算法的效果較好。對于大規模數據集,該算法是相對可擴展的,并且具有較高的效率。
李部長不僅腦子轉速高,而且善于從反面思考,他又提出了一個問題:“徐老師,k-Means算法和k-Medoids算法有哪些不足呢?”
徐教授對答如流:“首先,k-Means算法和k-Medoids算法只有在簇的數據點的平均值有定義的情況下才能使用。這可能不適用于某些應用,例如涉及有離散屬性的數據。”
還沒有等徐教授的“其次”出口,一直只聽不說的超市集團的萬總,被徐教授的這句話觸動了,道出了她們數據挖掘時遇到的問題:“k-Means算法和k-Medoids算法一般適用于連續變量,而對于離散屬性的對象,例如兩本書,A=(小說,英文,1/32開本,浙江大學出版社),B=(計算機圖書,中文,1/16開本,浙江大學出版社),就無均值可言,當然無法使用這兩種算法。那么,對于含有離散屬性數據的聚類問題怎么辦呢?”
徐教授:“為了就解決這類問題,人們對k-Means算法進行改進,出現了很多它們的變種,例如,k-模算法用模代替簇的平均值,用新的相異性度量方法來處理分類對象,用基于頻率的方法來修改聚類的模。而k-Means算法和k-模算法相結合,用來處理有數值類型和分類類型屬性的數據,就產生了k-原型算法。”
聽了徐教授的回答,萬總非常高興:”k-模算法和k-原型算法對我們可太有用了。徐老師,您就詳細給我們講講k-模算法和k-原型算法吧!”
徐教授看了看手表,說道:“今天的時間差不多了,關于k-模算法和k-原型算法的更多內容我們下節課再講。同學們,下節課見!”

服務熱線
400-608-2558
咨詢熱線
15502965860-
美林數據
微信掃描二維碼,立即在線咨詢
日本午夜免费一区二区,亚洲麻豆一区,国产伦精品一区二区三区千人斩,日韩高清电影一区
国产一区观看| 国产精品日本一区二区不卡视频 | 亚洲欧美日韩国产| 亚洲成人二区| 亚洲一级黄色| 91九色精品| 免费成人在线影院| 亚洲精品第一| 国产日产一区| 久久精品国产亚洲aⅴ| 青青青免费在线视频| 亚洲1234区| 日韩视频一区| 蜜桃一区二区三区在线| 综合亚洲色图| 久久97久久97精品免视看秋霞| 成年男女免费视频网站不卡| 亚洲午夜一级| 日本综合视频| 麻豆精品蜜桃| 日本亚洲不卡| 综合日韩av| 噜噜噜躁狠狠躁狠狠精品视频| 日本在线不卡视频| 国产精品yjizz视频网| 男女男精品视频网| 久久免费精品| 乱人伦精品视频在线观看| 日本欧美大码aⅴ在线播放| 久久久久九九精品影院| 免费欧美一区| 国产在线观看91一区二区三区| av不卡在线看| 中文字幕在线视频网站| 91嫩草精品| 久久成人国产| 日本久久成人网| 国产伦精品一区二区三区视频| 国产精品99免费看| 国产精品久久久久久久久久妞妞| 久久久久99| 国产精品大片| 日韩午夜视频在线| 国产精品久久久久av电视剧| 亚洲精品高潮| 亚洲综合日韩| 久久国产电影| 日韩大片在线| 国产成人在线中文字幕| 日日摸夜夜添夜夜添国产精品| 激情欧美丁香| 成人午夜国产| 日韩伦理一区| 久久av偷拍| 国产人成精品一区二区三| 综合一区在线| 日韩视频一二区| 日韩不卡手机在线v区| 男女精品网站| 久久福利精品| 在线综合欧美| 欧美精品九九| 国产视频一区免费看| 亚洲欧美视频| 国产91精品对白在线播放| 亚洲三级欧美| 成人台湾亚洲精品一区二区| 91嫩草亚洲精品| 久久久久久黄| 午夜久久影院| 四虎国产精品免费久久| 日本午夜精品久久久| 欧美在线首页| 91久久精品无嫩草影院| 欧美日本精品| 久久亚洲道色| 国产精品一区二区av交换| 老司机精品视频在线播放| 日韩欧美一区二区三区在线视频 | 精品欧美一区二区三区在线观看| 欧美成人基地| 视频一区二区三区中文字幕| 国产毛片一区| 国产精品一站二站| 国产精品大片| 欧美特黄一级大片| 亚洲网站视频| 国产无遮挡裸体免费久久| 日韩成人精品一区二区| 亚洲国产日韩欧美在线| 国产亚洲一区| 欧美日韩在线播放视频| 婷婷精品在线| 偷拍精品精品一区二区三区| 欧美大黑bbbbbbbbb在线| 日韩精品一区二区三区中文在线 | 精品国产午夜| 国产精品丝袜xxxxxxx| 日韩欧美2区| 中文字幕高清在线播放| 日韩精品91亚洲二区在线观看| 日韩av有码| 欧美精品国产| 视频一区中文字幕国产| 国产高清不卡| 欧美精品国产白浆久久久久| 欧美日韩亚洲在线观看| 国产精品视频一区视频二区| aa国产精品| 久久亚洲成人| 日韩在线二区| 美女性感视频久久| 石原莉奈一区二区三区在线观看| 久久99蜜桃| 一级欧美视频| 欧美综合另类| 日韩免费一区| 日韩久久精品| 精品亚洲免a| 久久久久国产| 久久久噜噜噜| 视频二区不卡| 欧美aa在线观看| 91欧美国产| 国产在线观看www| 不卡专区在线| 中文字幕一区久| 日韩在线观看| 国内一区二区三区| 久久精品免费看| av中文资源在线资源免费观看| 福利一区二区三区视频在线观看| 麻豆国产精品| 韩国久久久久久| av亚洲免费| 蜜桃久久久久久| 日韩和欧美一区二区三区| 日韩av在线免费观看不卡| 欧美欧美黄在线二区| 欧美亚洲一区二区三区| 国产精品jk白丝蜜臀av小说| 精品欧美视频| 99久久精品费精品国产| 国产精品成久久久久| 欧美69视频| 日韩**一区毛片| 成人国产精品| 亚洲激情偷拍| 日韩不卡一区二区三区| 成人高清一区| 免费看精品久久片| 国产精品主播| 国产精品av久久久久久麻豆网| 爽爽淫人综合网网站| 国产精品国产三级在线观看| 精品三级久久| 亚洲欧美在线综合| 国产精品sss在线观看av| 黑森林国产精品av| 亚洲一区二区免费看| 国产美女撒尿一区二区| 丝袜美腿诱惑一区二区三区| 日韩制服丝袜av| 成人精品动漫一区二区三区| 亚洲精品护士| 久久久久中文| 久久99青青| 亚洲欧美在线综合| 99精品电影| 精品久久97| 日本aⅴ免费视频一区二区三区| 亚洲性色av| 国产精品v一区二区三区| 久久男女视频| 国产精品久久久久久久久久齐齐 | 亚洲中字黄色| bbw在线视频| 国产精品免费99久久久| 免费中文字幕日韩欧美| 最近高清中文在线字幕在线观看1| 日韩av午夜在线观看| 亚洲一区二区三区高清不卡| 国产精品专区免费| 精品丝袜久久| 国产精品jk白丝蜜臀av小说| 日韩一区二区三免费高清在线观看 | 久久高清国产| 伊人久久亚洲美女图片| 亚洲伦乱视频| 国模精品一区| 久久一区国产| 国产极品嫩模在线观看91精品| 少妇精品久久久一区二区| 狠狠爱www人成狠狠爱综合网| 亚洲黄色免费av| 天堂√8在线中文| 日本高清不卡一区二区三区视频| 国产精品亚洲四区在线观看| 好吊日精品视频| 老司机精品视频网|