當前位置:成語大全網 - 英語詞典 - 如何用程序給寶寶起名?

如何用程序給寶寶起名?

好名字包含了父母對寶寶的美好希望,程序只是按照壹些規則生成名字。由於受NLP和語料庫的限制,程序生成的名字只能作為參考,質量肯定達不到馬寶寶大研究推敲的水平,不如老老實實思考,不考慮全自動制作。

開源代碼庫

/clg456852/Baby_name

程序是用Python 2.7版寫的。該程序只考慮的兩個單詞的名稱。

依賴庫:

因為涉及到爬蟲,如果在公司跑,需要設置代理。同時在/devnettempvisit.aspx申請訪問外網。

我之前說過,壹個好名字,最重要的是包含了父母對寶寶的美好希望。

在此基礎上,盡量滿足意、音、形,中國文化的八字也是壹個考慮選項。

含義:名字最重要的屬性,比如希望寶寶開心,就是“開心”和“快樂”。個人認為,如果第二個詞是動詞,或者名字是形容詞,可以獲得更好的含義,比如“開心”“快樂”。

發音:如果壹個名字中其中壹個字的元音和姓氏的發音相近,名字讀起來會更順口,但不是兩個都是,可能會更迂回。同時最後壹個字應該是舌根,短而有力讀。

形式:如果姓是上下結構,那麽名的其他字就不要用同壹個結構。

八字:八字的平衡性最好,八字喜歡的神是由他們的異質性和相似性決定的。其中神是用來平衡八字的,喜神是生成神的屬性。

從上面的分析來看,程序的實現方案是:從語料庫(古典詩詞)中獲取詞匯,分析詞匯的意、音、八字、五格,給出壹些最靠譜的選擇。

我整理的語料有:《詩經》、《楚辭》、《唐詩三百首》、《宋詞三百首》、《論語》、《全唐詩宋詞》等。有些已經處理過了,從‘語料庫’開始。從語料庫中獲取句子,按照壹定的規則組詞、分詞,得到符合目標函數的名詞作為潛在名稱。

我這裏沒有把名字的形狀作為目標函數來考慮,因為這個屬性屬於為場景添花的類型,馬寶寶爸在選擇過程中可以自己決定。

算算名字的八字五方。我要用爬蟲提交表單/Naming/Default.aspx嗎?Tag=4,然後分析返回的結果。所以如果短時間內密集發送表單,可能會被服務器屏蔽。如果需要大量抓取,最好建立壹個代理池。

為了滿足上述需求,利用現有的壹些第三方包來實現部分功能。

其中包括:

SnowNLP可以分析單詞的詞性、聲母和情感。

解霸可以對現有語料進行切分。

Zhconv用於將傳統語料庫轉換為簡化版本。

Bs4用於分析爬蟲的抓取結果。

Threadpool使用多線程來加速爬蟲請求。

運行create_name腳本從語料庫中合成單詞,並將表單提交給名稱評分網絡。

如果已經有名字,可以直接運行name_score_post腳本,還有其他腳本作為輔助工具。

程序中有兩個主要腳本:‘create _ name . py’和‘name _ score _ post . py’。

從語料庫中分組單詞,選擇符合目標函數的單詞,輸出到目標文件。

默認可以從楚辭中組詞,也可以自己選擇其他語料庫。整個唐詩宋詞太大,不推薦。

構詞法規則:選擇句首、句尾、句間的詞來構詞法,用結巴分詞得到句中的詞。

目標函數:基於snowNLP,用於選擇符合特定規則的正詞、詞性和聲音。

讀取目標文件並使用爬蟲獲取& amp;in & amp;網站&;根據分析結果,得出文化印象、八字、姓名五格的得分,輸出Excel表格以供參考。

理想很豐滿,現實很骨感。

目前NLP和用來爬分析結果的網站都不是很智能,所以生成結果的可用率不高,像“無父”“無母”這樣的詞就能得高分...

然而,從壹個更佛教的角度來看,壹些產生的結果仍然可以給馬寶寶達壹些啟發。還是那句話,名字是父母送給寶寶的禮物,還是更積極參與的好。這種經歷本身也是壹種甜蜜美好的財產。