Skip to content

Latest commit

 

History

History
31 lines (20 loc) · 934 Bytes

File metadata and controls

31 lines (20 loc) · 934 Bytes
作者 頁數 出版時間
吳軍 260 2012

Chapter01 ~ 04

  • 信息的冗餘是信息安全的保障. ( 注意歧義 )

  • 語言是一種編碼的方式. 語言的語法則是編解碼的算法.

  • 單純基於規則的句法分析, 算法複雜度高 且無法遍及所有 situations.

  • 語言中的多義

    The pen is in the box.
    The box is in the pen. ( pen 又可作 “围栏” )

    正確理解第二句 需要超越上下文的常識.

  • 以統計語言模型進行分詞

    在很大程度上是按照 “大眾的想法”, 或者 “多數句子的用法”.

Chapter05 ~ 0

  • 通信的本质即是一个 编解码与传输 的过程

  • 通信的六个要素 ( Roman Jakobson )

    • 信息源 -> 信道 -> 接受者 -> 信息 -> 上下文 -> 解码
  • 隐含马尔可夫模型