當前位置:成語大全網 - 古籍修復 - 如何做研究(5)解決

如何做研究(5)解決

有些同學做了很長時間的題目,卻沒有把問題定義清楚。把自動摘要當成壹個問題,好像是提取了壹篇文章的核心內容。怎麽定義?其實並不是。是什麽樣的文章?議論文,記敘文,還是說明文,還是包括小說在內的文學作品?文章出處在哪裏?是《人民日報》等術語非常規範的文章,還是網絡文體,比如博客或BBS上的文章?文章長度有上限嗎?654.38+萬字以上的博士學位論文需要摘錄摘要嗎?可以把幾篇同話題的文章匯總在壹起嗎?除此之外,摘要,是適合閱讀的報告性摘要還是用來判斷題目相關性的指示性摘要?有字數限制還是比例限制?是否根據用戶需求有所偏差?摘要的連貫性有什麽要求嗎?如何評價壹篇摘要的質量?只有把問題的初始狀態(這裏是原文)和問題的結束狀態(這裏是摘要)說清楚了,才能說問題定義清楚了。“知止以後再決定”,這個問題定義得很清楚,當妳做了壹個明確的決定,就很容易冷靜下來。無論妳怎麽做工作,妳都會始終專註於壹個目標,這樣工作才不會左右搖擺,才有意義。

2,思維邏輯要幹凈。

思維邏輯,思維邏輯!我越來越覺得這是壹個人從事科研最重要的素質。我的學生有兩種。大部分都有非常幹凈的思維,但也有少數同學的思維比較混亂,有粘性。思維邏輯混亂的同學,需要通過不斷的自我認識,找出自己的誤區,否則就會在前進的過程中掙紮。比如人腦就像電腦。讀取數據是數據輸入,處理靠思維邏輯。如果思維邏輯混亂,似乎是程序有Bug。輸入的數據再充分,再正確,也無濟於事。甚至由於處理能力有限,輸入讀數會更加混亂。

有的同學還執著於壹個很細很不相幹的問題;有些同學的思維很跳躍。過了壹段時間,他們在問題的頂端思考,但還沒討論清楚,突然跳到壹個底層細節。有的同學聽不進別人的意見,腦子裏只有自己的聲音;有的同學不懂對立統壹的道理,總想把問題絕對化,給自己造成很大困擾;有的同學習慣於開發,總是想著如何實現壹個系統,而不是專註於創新;有些同學不善於分析問題,分析數據,不了解先分析後綜合的思維方法。他們總是繞開問題的表面,從不深究。。。。。。

計算機大學本科專業的很多內容在以後的工作中是不能直接使用的,但是壹位在醫科大學教計算機課程的老師告訴我,她很難要求醫科大學的學生寫程序,因為思維邏輯完全錯誤,醫學需要大量的死記硬背,很多疾病比較模糊,需要大量的經驗,而計算機思維非常嚴謹透徹。教管理學院學生和人文學院學生學計算機的老師也有自己不同的感受。原因是什麽?原因是計算機本科專業,如離散數學(含數理邏輯)、算法與數據結構、高級編程等課程,為計算機專業打下了壹定的邏輯基礎,思維方式在無形中對壹個人以後的工作有著重要的影響。

我有壹個同事是從理科轉來學計算機的。我和他明顯不壹樣。他很少編程,但每次實驗後,他都習慣花大量時間分析數據。而我對數據分析不夠重視,思維傾向於如何巧妙的制定出壹套方法來實現壹個系統,解決壹個問題。科學重在解釋世界,工程重在實現系統。只有通過不斷的自省,我們才能找到自己的思維方式,並加以利用和修正,才能順利地進行科學研究。

3.分析與綜合

分析和綜合是思維的兩大利器,壹定要用好。通常,當問題來臨時,我們會感到無所適從。別擔心。請用“分析”的“刀”,把問題分成幾個子問題。子問題之間的相關性越小,刀就越合理。如果真的要“骨肉相連”也沒關系,但是要記錄子問題之間的關系。如果子問題很容易解決,那就是原問題,沒必要分。如果還是比較復雜,可以進壹步分析,得出壹些“孫子”問題。深入分析之後,壹個看似強大的問題已經被我們看得很清楚了,也更容易找到每個原問題的解決方法,研究者的精神也能得到放松。

但是,研究不是工程,不能滿足於打補丁解決壹個具體問題。分析完了,還有壹個武器可以“合成”。“合成”的功能是合並相似的項目。比如通過子問題1,4,5的考察,我們覺得這個問題像壹個球體,通過子問題2,3的考察,我們覺得這個問題像壹個圓形平面。經過歸納,我們可以為這個問題建立壹個“半球”模型,這個模型很可能接近真實情況。歸納之後可以推導壹下,看看行不行,也就是用測試數據來檢驗壹下。

壹般來說,分析就是對每壹類的特征進行分類和考察,分析就是壹臺顯微鏡,幫助我們看清問題的每壹個細節。綜合就是找到壹個統壹的模型,盡可能地概括各種現象。統壹模型可能是多個模型的融合,但最好不是簡單的拼接,而是在分子水平上激光焊接整合多個模型。分析決定深度,綜合決定高度,兩者缺壹不可。

順便提壹個觀點:國內普遍認為存在低水平全研究的現象,比如搜索引擎,從涉及的人很少到壹下子冒出來很多家,大部分都是初級階段,不分伯仲。大家都覺得研究空間窄,競爭激烈,卻不知道如何解決這個問題。其實深入分析壹個話題,把大話題分解成小話題,各家不搞大而全,或者就算全了也有自己明確的側重點,比如專註於搜索引擎中的分布式計算,或者專註於跨語言檢索,或者專註於問答系統等精準搜索,等等。對於更小的群體,他們甚至可以專註於更詳細的問題,如問答系統中的問題分類,跨語言搜索中的查詢翻譯和擴展等。我們知道,大樹的根越深,差異就越多,覆蓋的土壤空間就越大。研究也是如此。如果都浮在表面,會覺得空間狹小。如果它們走得更深,空間就大,不容易墜毀。而且在壹個細分問題上,妳可以集中優勢力量做出突破性的成果,而且由於研究同壹個細分問題的學者相對較少,研究工作的積累相對不足,妳動壹動就可能有新的成果。所以,我的建議是:再深入,再深入,再深入。

4.創新思維

創新是科研的靈魂!“不創新,不死亡”,每個科研人員都應該有這個決心。科學界沒有“省運會”、“全運會”,只有“奧運會”。說妳是中國提出“狹義相對論”的第壹人是沒有意義的。那麽,創新應該是世界上第壹個提出想法的人。如果妳的想法已經在地球的某個角落提出來了,那就不是創新,是重復,是浪費科研資源和人力物力。人生短暫,大部分人都在日復壹日的做著重復的工作。他們很幸運是科研人員,他們可以表達自己獨特的想法。有多快,接人智慧就有多痛苦。

創新沒有固定的公式。如果有,就像炒股的某種盈利方式,大家都可以賺錢,都可以創新。我很喜歡嶽飛的那句話:“經營之美,在於壹心”。據史書記載,嶽飛勇猛善戰,受到宗澤的賞識和器重。宗澤曾召見嶽飛說:“妳很勇敢,很有才華,但壹個好將軍不能通過。但是,壹場好的野戰不是萬能的。”因為對蒼蠅的作戰地圖的教導。費曰:“戰後兵法共,用之妙,壹心壹意。”宗澤聽後深表贊賞。做研究就像打仗,有固定的陣列戰術,但如果真的想贏,就需要“奇兵”,所謂“出奇制勝”。有多驚訝?這完全取決於指揮官的頭腦。

什麽樣的人善於創新?我覺得首先是那些總喜歡胡思亂想的人。孔子有個很有才華的學生叫子貢,但是孔子說他只能問壹點知識,說他不如顏回,顏回可以問壹點知識。以此類推,就是利用各種相似性在自己的認知系統內部建立關系,為創新創造條件。“曹聖”張旭的草書是從公孫大娘的劍舞中學來的,因為張旭通過多年的刻苦練習已經掌握了書法的基本功,再想發展就很難從書法本身吸收新的營養。最後從劍舞中得知自己獲得了新的草書結構,藝術上有了轉機,更上壹層樓。

有相當壹部分同學做研究的時候只看和自己課題最相關的文章。如果是壹個新的領域,文章很少,他會覺得很壓抑,不會知道領域之外的靈感。從事文本檢索的人應該對圖像檢索有所了解,從中可以得到啟發,反之亦然。語言模型最初用於語音處理,現在已經成為文本處理領域最成熟的理論方法。類比和嫁接壹直是創新的重要方法,並不博大。他們只知道自己眼皮底下的壹點點東西,跳不出自己給自己設下的思維陷阱,所以無法提出新的想法。

創新也必須來自於自身獨特的體驗。以詩歌為例,詩歌反映的是壹個人獨特的人生體驗,所以最忌諱用壹些大眾常用的籠統詞語,比如描寫長江,而不是說“波濤洶湧”,應該說“強攻岸邊,卷起千堆雪”。研究也是如此。妳要用自己的眼睛去觀察數據,發現別人沒有發現的特點,發現別人沒有發現的毛病點,找到別人從來沒有用過的觀察視角去重新觀察妳的研究對象。人的經歷不同,觀察問題和思考問題的方式也不同。如果妳能在反復研究的基礎上,通過歸納總結,把自己的原創經驗表達出來,那麽哪怕是小小的進步,因為和別人不壹樣。更何況,在妳的課題上,世界上能堅持不懈工作兩三年的人屈指可數,就怕妳沒有自我。只要堅持自己,表現自己,哪怕資質再差,也壹定能創新。

有各種各樣的創新,開辟壹個新的領域,提出壹個新的問題,這是壹個偉大的創新。研究生階段做起來並不容易,可以先做壹些方法層面的創新。方法上有不同的創新。“模式創新”是壹個比較大的創新。“模型”從來不等於“現實”,模型是對現實的最大逼近。對於同樣的輸入,好的模型能給出更接近真實情況的輸出。比如信息檢索中有壹個向量空間模型,因為簡單所以經常使用,但是沒有考慮術語之間的相關性。如果能提出壹個新的模型,考慮到項之間的項約束,就有可能取得更好的結果。這種創新比較直接。如果能徹底推翻向量空間模型,提出類似LSI(隱藏語義索引)的模型,那將是更大的創新。再比如甄提出的基於案例的機器翻譯,也就是壹種思維的轉變,把翻譯過程看成是案例匹配,而不是查字典、調順序。這是壹個比較大的創新,我覺得很有意義。

如果我們在這個問題上提出新的特征,或者新的特征提取方法,或者采用別人沒用過的機器學習方法,只要能說實話,也是創新,只是沒那麽精彩。

創新思維是求異的思維,而不是求同的思維。它技術高超,多變,肆無忌憚。我們應該從東、西、北、南、上、下、左、右觀察事物。如果我們面對的事物過於龐大,我們能在它們被壓扁後再處理嗎?能不能切成塊處理?能不能把它融化成水再處理?在地面上無法處理。能不能運到海底,或者送到空間站?圖像處理存在從空間域到頻率域的變換,空間域無法剝離的噪聲在頻率域很容易分辨出來;在詞義消歧中,bank不知道是“河岸”還是“銀行”。如果我們從宏觀的角度來看,例如,如果我們知道這裏的文章是金融,那麽它十有八九是“銀行”。