您當(dāng)前位置:網(wǎng)站首頁 > jsp畢業(yè)設(shè)計(jì) > 微博情感信息挖掘系統(tǒng)

微博情感信息挖掘系統(tǒng)

2018-01-13 10:33:28 來源:本站原創(chuàng) 瀏覽:205
0
內(nèi)容提要:編號(hào)jsp369:微博在我國(guó)發(fā)展已經(jīng)有很多年了,在微博用戶的不斷增加過程中,也出現(xiàn)了很多的情感微博,很多用戶通過微博抒發(fā)個(gè)人的情感,針對(duì)這種情況,我們可以開發(fā)一款關(guān)于情感信息挖掘的軟件,一方面了解微博用戶的大數(shù)據(jù),另一方面通過微博用戶的建立,分析相關(guān)的大數(shù)據(jù)。

經(jīng)過不完全統(tǒng)計(jì),我國(guó)的微博用戶已經(jīng)達(dá)到了三億多,通過微博很多人能夠表達(dá)自己的情感以及一些其他的信息,如何能夠針對(duì)這種信息,敏感問題進(jìn)行分析,是本課題所要解決的問題。通過對(duì)微博的敏感話題,相關(guān)的熱點(diǎn)情感態(tài)度等分析,能夠了解一個(gè)人的情感動(dòng)向,防止不正當(dāng)?shù)男畔⑦M(jìn)行傳播,也對(duì)不穩(wěn)定因素的分析有一定的主導(dǎo)作用。

計(jì)算機(jī)畢業(yè)設(shè)計(jì)
本系統(tǒng)可以實(shí)現(xiàn)如下幾個(gè)功能:
1、針對(duì)微博的信息進(jìn)行格式化處理,主要是對(duì)微博的標(biāo)題,內(nèi)容,轉(zhuǎn)發(fā)數(shù)等信息進(jìn)行數(shù)據(jù)庫(kù)的存儲(chǔ)。等待后期的分析。
2、數(shù)據(jù)信息清洗:利用分詞系統(tǒng)針對(duì)當(dāng)前熱門的微博進(jìn)行分析,去除特殊符號(hào)和停用詞等不常用詞語。
3、建立情感詞數(shù)據(jù)庫(kù),建立消極情感詞庫(kù)和積極情感詞庫(kù),為針對(duì)微博數(shù)據(jù)挖掘做準(zhǔn)備。
4、利用蟻群算法針對(duì)微博的動(dòng)態(tài)情感信息進(jìn)行分析,主要是要實(shí)現(xiàn)如下幾個(gè)的關(guān)聯(lián):
a)事件與情感的關(guān)聯(lián),可以通過事件與情感的關(guān)聯(lián),發(fā)現(xiàn)引起積極情感和消極情感的事件。
b)通過用戶和情感的關(guān)聯(lián)來發(fā)現(xiàn)用戶在某個(gè)時(shí)間段與積極和消極情感的關(guān)聯(lián),并能給用戶一個(gè)情感變化的曲線。
5、以曲線的方式,能夠針對(duì)直觀的情感波動(dòng)進(jìn)行分析。