《Python自然语言处理》——1.2 近观Python:将文本当做词链表
本节书摘来自异步社区《Python自然语言处理》一书中的第1章,第1.2节,作者[美]Steven Bird,Ewan Klein,Edward Loper, 陈涛,张旭,崔杨,刘海平 译,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.2 近观Python:将文本当做词链表 大家已经学习过Python编程语言的一些重要元素。下面进行简单的系统复习。 链表 文本是什么?一方面,它是一页纸上的符号序列,就像这页纸一样。另一方面,它是章节的序列,每一章由小节序列组成,这些小节由段落序列组成,以此类推。然而,对于我们而言,认为文本不外乎是单词和标点符号的序列。下面是如何展示Python中《白鲸记》的开篇句。 >>> sent1 = ['Call', 'me', 'Ishmael', '.'] >>> 在提示符后面,输入自己命名的sent1,后跟一个等号,然后是一些引用的词汇,中间以逗号分割并用括号包围。方括号里的内容在Python中叫做链表,是存储文本的方式。可以通过输入名字1来查阅文本。同样可以查询文本的长度2,甚至可以在自己的函数lexica...