03 詞彙

如何 將 詞彙轉換為「詞向量」

增快 Forth words 結構?!

近年來蓬勃發展的深度學習 (Deep Learning),提出了另一種方法來教電腦表達詞彙。這種方法是將詞彙轉換為「詞向量」, 也就是 Word Vector 或稱 Word Embedding,作法是讓電腦閱讀大量文章,利用前後文的統計特性,慢慢學習出每一個詞彙的詞向量,不必利用任何語言學知識。

http://research.sinica.edu.tw/nlp-natural-language-processing-chinese-knowledge-information/

VOCABULARY NEW-NAME

Win32Forth Vocabulary dictionary structure

詞與詞彙關係

last @ 20 dump 

  58C075 | 04 43 59 4E 32 00 00 FF  FF FF FF D4 E0 40 00 00 |.CYN2..婄@..|

  58C085 | 00 00 00 00                                      |....| ok

vocabulary new-name  ok

new-name definitions  ok

: dog 1 2 + ;  ok

: cat 2 3 + ;  ok

last @ 20 dump 

  58C125 | 03 43 41 54 00 00 00 FF  FF FF FF D4 E0 40 00 00 |.CAT...婄@..|

  58C135 | 00 00 00 00                                      |....| ok

last-link @ @ 20 dump 

  58C11C | 00 00 00 00 54 93 44 00  03 03 43 41 54 00 00 00 |....T...CAT...|

  58C12C | FF FF FF FF