您當(dāng)前位置:網(wǎng)站首頁(yè) > jsp畢業(yè)設(shè)計(jì) > 微博情感信息挖掘系統(tǒng)

微博情感信息挖掘系統(tǒng)

2017-07-25 10:31:10 來(lái)源:本站原創(chuàng) 瀏覽:89
0
內(nèi)容提要:編號(hào)jsp360:我國(guó)有著龐大的微博用戶群,據(jù)不完全統(tǒng)計(jì),我國(guó)微博網(wǎng)民達(dá)到3.31億之多,微博平臺(tái)信息發(fā)布與傳播快,產(chǎn)生巨大的信息量,如何從這些數(shù)據(jù)中挖掘出有價(jià)值的信息,特別是對(duì)熱點(diǎn)問(wèn)題的情感態(tài)度,對(duì)分析社會(huì)的正能量和不穩(wěn)定因素有重要意義。

我國(guó)有著龐大的互聯(lián)網(wǎng)用戶群,隨著微博的興起,互聯(lián)網(wǎng)上出現(xiàn)了大量的微博用戶群,針對(duì)大量的微博用戶,針對(duì)其情感信息的研究有著很重要的意義。所以大數(shù)據(jù)的分析也隨之出現(xiàn)。通過(guò)大數(shù)據(jù)的分析,可以更容易更方便了解到微博情感信息,可以準(zhǔn)確掌握人們的心理情況。本系統(tǒng)采用了java技術(shù)開(kāi)發(fā),采用大數(shù)據(jù)分析的理念和爬蟲(chóng)技術(shù)進(jìn)行微博數(shù)據(jù)的爬行和分析,也是一項(xiàng)比較有創(chuàng)新特色的畢業(yè)設(shè)計(jì),系統(tǒng)功能主要分為以下幾個(gè)方面:
1、針對(duì)微博的信息進(jìn)行格式化處理,主要挖掘微博題目、內(nèi)容、發(fā)布時(shí)間、轉(zhuǎn)發(fā)數(shù)量以及評(píng)價(jià)數(shù)量等基本信息,并存入數(shù)據(jù)庫(kù)。
2、數(shù)據(jù)信息的清洗:利用分詞技術(shù)對(duì)熱門(mén)的微博進(jìn)行分詞,將停用詞和特殊的符號(hào)等不相干數(shù)據(jù)進(jìn)行清理。
3、建立情感詞庫(kù):通過(guò)建立積極情感詞庫(kù)和消極情感詞庫(kù),為情感數(shù)據(jù)的挖掘做好服務(wù)工作。
4、蟻群算法在本系統(tǒng)中發(fā)揮重要的作用,本人利用蟻群算法信息素?fù)]發(fā)原理,對(duì)微博數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)情感分析,主要完成以下兩種關(guān)聯(lián):
a)事件與情感的關(guān)聯(lián),發(fā)現(xiàn)一些引起積極情感的事件,和一些引起負(fù)面情感的事件。
b)用戶與情感的關(guān)聯(lián),發(fā)現(xiàn)一些用戶在某個(gè)時(shí)間段與積極情感或消極情感的關(guān)聯(lián),給出用戶的情感變化曲線。
5、以曲線的方式,給用戶展示出直觀的情感的波動(dòng)圖。

微博數(shù)據(jù)抓。

代做畢業(yè)設(shè)計(jì)

前十名關(guān)鍵詞排名:

代做畢業(yè)設(shè)計(jì)

曲線圖:

畢業(yè)設(shè)計(jì)