N-gram 是自然语言处理(NLP)和概率论中一个非常经典且基础的概念。简单来说,它是指文本序列中 N 个连续的项(通常是词或字符) 组成的序列。
马尔可夫链 (Markov Chain) 是概率论和数理统计中一个非常核心的模型。它以俄罗斯数学家安德雷·马尔可夫(Andrey Markov)的名字命名。