為了處理系統移到linux,弄了一個禮拜,幾乎沒什麼睡,因為以前也很少在用linux,用起來很不順手,主要問題還是程式執行會發生錯誤,還有pcntl一直找不到怎樣安裝,雖然說是php內建模組,但是不管是內建的PHP或者自行安裝的版本,兩者都沒有這個模組,真是活見鬼...
另外論文的修改還算順利,畢竟這個領域的文獻閱讀還算足夠,從碩一上就開始接觸,到目前為止背景知識建立算是基礎都有了,只是在撰寫有待加強,所以我現在都有在練習寫文獻摘要,或者是寫下對每天做事情的心得,只是不一定會寫在部落格就是了
這學期有兩門老師的課,有空的話比較想要聽Data Mining,畢竟沒有修過,覺得這方面的背景知識還是不夠。
呼,今天要早點睡,現在在寫這篇時,我的眼睛快要閉上了...
2009年2月17日 星期二
關於字典擴充
因為在background的部分需要不斷增加情緒字典的詞彙,找到一篇還蠻有幫助的論文:combining local and global resources for constructing an error-minimized opinion word dictionary,出自PRICAI 2008,這篇論文中提到一個蠻重要的論點,當我們不斷增加情緒字典的seed word,會產生錯誤判斷,將字放到不正確的屬性,比方fake會被放到positive的部分,但其實fake應該是屬於negative,這篇論文提出的方法目前看起來是有效的解決這個問題,等看完這篇論文後,在和實驗室的同學分享。
2009年2月12日 星期四
系統修改
目前算是告一段落了。
online版本因為採用登凱學長的論文其中一個方法,實做比較快,現在已經和原本系統銜接上,不過其準確率還有帶加強,會用學長的方法主要原因是快,減少原系統的處理時間,固定的情緒字典比起將每個字丟到Altavista查詢快多了,為什麼呢?比方說現在一篇文章有十萬個字,一旦使用altavista查詢並且回傳值,等待時間非常久,就算一個字一秒,也要十萬秒才能完成每個字的權重計算,但是情緒字典不同,在online的系統中,不必等待過多的時間,啪一下就可以完成,多麼令人感動阿。
不過另外一個麻煩是系統移植到unix-like的平台,檔案權限和library的處理始終讓我一個頭兩個大,查了很久,還是沒有找到解決方式,我想最近寄個信件給許富浩老師,畢竟張老師對這個比較熟悉,我自己還是不熟。
希望能夠盡快完成論文,唉,感覺我的寫作仍然有待加強,思路不通,表達不明。
online版本因為採用登凱學長的論文其中一個方法,實做比較快,現在已經和原本系統銜接上,不過其準確率還有帶加強,會用學長的方法主要原因是快,減少原系統的處理時間,固定的情緒字典比起將每個字丟到Altavista查詢快多了,為什麼呢?比方說現在一篇文章有十萬個字,一旦使用altavista查詢並且回傳值,等待時間非常久,就算一個字一秒,也要十萬秒才能完成每個字的權重計算,但是情緒字典不同,在online的系統中,不必等待過多的時間,啪一下就可以完成,多麼令人感動阿。
不過另外一個麻煩是系統移植到unix-like的平台,檔案權限和library的處理始終讓我一個頭兩個大,查了很久,還是沒有找到解決方式,我想最近寄個信件給許富浩老師,畢竟張老師對這個比較熟悉,我自己還是不熟。
希望能夠盡快完成論文,唉,感覺我的寫作仍然有待加強,思路不通,表達不明。
訂閱:
文章 (Atom)