今天在幫傑程學長看論文,做互評的報告,當初在五月的時候也曾有做過一次,不過當時是碩一的時候,時隔半年又再做一次,感覺不太一樣,因為這段時間看了不少論文,自己也有做了類似的實驗,現在在看的時候比較有感覺,能夠瞭解說為什麼要做、該怎樣做...。個人的感覺閱讀論文的量和素質對自己本身的提升有一定的助益,因為閱讀的量與質夠的話,當在閱讀論文的時候,比較能夠反應說這篇論文的想法、做法以及貢獻等。
早上在和老師討論坤彰的論文的部分,因為碩一上的時候已經有實做過,現在要跑四個query,不過呢,反事真的不能急躁,因為我想趕快把結果跑出來,四個query一次跑,結果呢,因為實驗方法有一個步驟要計算每個字屬於positive以及negative,計算權重,要將每個字丟到altavista的網站,但是一次跑四個query,又一次這麼大量的字丟過去,所以現在被鎖IP,沒辦法使用。只能等明天看網頁能不能進去,唉,真的不能急呢。
不過學長的論文有點久沒看了,今天討論的時候還有點忘記。像是在query的部分,因為之前都是以一個word作為query,不過當我們以一個較長的句子或者比較多個單字作為組合的時候,該怎樣去找到計算LODR or PMI的topic word,因為topic word對於計算的影響很大,與老師討論的結果是將query中的stop word刪除,剩餘的字作為topic word。
2008年11月19日 星期三
最近的研究以及目標
最近做的blog content extraction的實驗做出來的效果似乎沒有比較好,而從上禮拜看了一些相關web page content extraction的論文中提到的方式似乎有些不太一樣,比較起來,感覺好像是我們的feature取的比較少,相對的辯析的程度會稍微低一點。
這是一點對於最近做的東西的感想,數據的處理上還需要多想一些,比方說怎樣比較,比較的基準等等。流程的表現、數據的表現,這些都是需要再三思考,不過覺得自己也有點進步,而不是一味的去做,在做之前需要先想清楚為什麼做?怎樣做?怎樣提高效率?這些都是很重要的事情。
另外就是英文也是很重要的,這半年來,每天早上都會唸英文,練聽力,在閱讀論文上的速度比以前快很多,真的幫助不少,一方面可以增加自己的能力,比方說對於英文的語感增加,閱讀論文的速度也跟著增加,文章也更容易理解,當然也不是百分之百懂,不過呢,至少都比以前好很多了,感覺很棒。
當然,在把自己做的這些東西寫成論文後,可以更加瞭解自己在做什麼,在文字上的編排以及修飾,實驗的內容以及調整,相關研究等等,在整理過後,更有條理的寫出來,實驗的數據整理我覺得是比較重要的一件事情,整理的越詳細,在往後撰寫論文上有很大的幫助,這也是我覺得自己之前沒有做好的地方。
希望往後能夠改進,當然論文的方向還是一個比較困擾的地方。雖然說看了不少的論文,也有一些想法,不過總覺得還是缺乏什麼,恩,總而言之,就是加油!
這是一點對於最近做的東西的感想,數據的處理上還需要多想一些,比方說怎樣比較,比較的基準等等。流程的表現、數據的表現,這些都是需要再三思考,不過覺得自己也有點進步,而不是一味的去做,在做之前需要先想清楚為什麼做?怎樣做?怎樣提高效率?這些都是很重要的事情。
另外就是英文也是很重要的,這半年來,每天早上都會唸英文,練聽力,在閱讀論文上的速度比以前快很多,真的幫助不少,一方面可以增加自己的能力,比方說對於英文的語感增加,閱讀論文的速度也跟著增加,文章也更容易理解,當然也不是百分之百懂,不過呢,至少都比以前好很多了,感覺很棒。
當然,在把自己做的這些東西寫成論文後,可以更加瞭解自己在做什麼,在文字上的編排以及修飾,實驗的內容以及調整,相關研究等等,在整理過後,更有條理的寫出來,實驗的數據整理我覺得是比較重要的一件事情,整理的越詳細,在往後撰寫論文上有很大的幫助,這也是我覺得自己之前沒有做好的地方。
希望往後能夠改進,當然論文的方向還是一個比較困擾的地方。雖然說看了不少的論文,也有一些想法,不過總覺得還是缺乏什麼,恩,總而言之,就是加油!
2008年7月2日 星期三
最近閱讀論文的心得
上次與老師meeting後,看了一些相關的論文,也就是對於imbalance data的相關研究。
針對網頁的內容,想要擷取POST的內容,但是一個網頁中總是有許多不需要的資訊在裡面,該怎樣取出來,這也是和imbalance data有關的部分。其實在看了這些論文後,發現在現實生活中還蠻多實際例子,比方說詐欺案件、海面上的浮油等等,諸如此類的事件都和imbalance data有關。
這讓我想到看過的美國影集,這部影集是在講如何透過數學建立的model,幫助警察抓到兇嫌。映象最深刻的是有一集因為兇手已經跑走,數學家透過分析,建立一個針對兇手的習慣和行走模式的model,透過這個model猜測目前兇手所在位置可能在哪。這讓我覺得數學真的很了不起,也很強大,以前在學校學數學的時候,總是想說以後用不到,看了這個影集讓我改觀,
扯遠了,最近看論文的時候覺得之前看的時候還真是偷懶,不太喜歡看reference,下場就是有的時候會一知半解,這次把reference的PAPER都找出來看,雖然真的很多(超級多呢,有兩三篇都是30頁以上),不過越看越有趣,只是看的有點累就是了。
針對網頁的內容,想要擷取POST的內容,但是一個網頁中總是有許多不需要的資訊在裡面,該怎樣取出來,這也是和imbalance data有關的部分。其實在看了這些論文後,發現在現實生活中還蠻多實際例子,比方說詐欺案件、海面上的浮油等等,諸如此類的事件都和imbalance data有關。
這讓我想到看過的美國影集,這部影集是在講如何透過數學建立的model,幫助警察抓到兇嫌。映象最深刻的是有一集因為兇手已經跑走,數學家透過分析,建立一個針對兇手的習慣和行走模式的model,透過這個model猜測目前兇手所在位置可能在哪。這讓我覺得數學真的很了不起,也很強大,以前在學校學數學的時候,總是想說以後用不到,看了這個影集讓我改觀,
扯遠了,最近看論文的時候覺得之前看的時候還真是偷懶,不太喜歡看reference,下場就是有的時候會一知半解,這次把reference的PAPER都找出來看,雖然真的很多(超級多呢,有兩三篇都是30頁以上),不過越看越有趣,只是看的有點累就是了。
2008年5月20日 星期二
meeting後心得
昨日參加老師、登凱學長的meeting,主要是對於國科會報告的修正。
該怎麼說呢,我想,對於論文該怎樣去撰寫,報告該怎樣表示,昨日的meeting感覺有點收穫。
因為對於報告而言,可能還是像大學那樣,對於不是很懂得地方,囫圇吞棗,簡單的帶過,或者文章會看的不夠仔細,想的不夠多,這些地方都是很大的改進空間,亦或者未來在撰寫論文時可以作為警惕。
也希望同學能夠一起注意這些地方。
該怎麼說呢,我想,對於論文該怎樣去撰寫,報告該怎樣表示,昨日的meeting感覺有點收穫。
因為對於報告而言,可能還是像大學那樣,對於不是很懂得地方,囫圇吞棗,簡單的帶過,或者文章會看的不夠仔細,想的不夠多,這些地方都是很大的改進空間,亦或者未來在撰寫論文時可以作為警惕。
也希望同學能夠一起注意這些地方。
訂閱:
文章 (Atom)