数据结构

1. 列表（list）
2. cons
3. 数组
4. 集合（set）
5. 结构体（struct）
6. 键值索引
7. 树
- 7.1. subst/nsubst
- 7.2. sublis
8. 谓词函数
- 8.1. listp
- 8.2. arrayp
9. 相关函数

1. 列表（list）

list 只是一种数据抽象，list 是由多个 cons（cons 是 construct（构造）的简称）组成的。最简单的创建方式：

(list 1 2 3)                            ; => (1 2 3)
(list 1 2 3 'a 'b 'c)                   ; => (1 2 3 A B C)

cons 也叫作“有序对”，cons 也是 Lisp 程序的基本数据结构。有序对有两个对象组成的搜集，元素1叫做“左投影”，元素2叫做“右投影”。有序对可有其他有序对做投影，比如 (a, b, c) 可以定义为 (a, (b, c))，Lisp 就是用的这种作为数据结构，比如 (1 2 3 4 5) 变换为 (1 (2 (3 (4 (5 nil)))))，更多请见维基百科词条页：http://zh.wikipedia.org/wiki/%E6%9C%89%E5%BA%8F%E5%AF%B9

(type-of '(1 2 3)) ; => CONS
(typep '(1 2 3) 'list) ; => T

当要表达 list 这种数据结构时，实质是指 nil 或者 CONS。

'(1 2 3)，这是一个列表。在 Lisp 内部，list 是由 cons cell 链组成的，每个 cons cell 有两个指针，第一个指针指向元素值，第二个指针指向下一个 cons cell。

想象下学习数据结构的“链表”：每个链表的单元都有一个或多个指针指向其他链表（比如下一个），一个链表由 N 个这样的单元组成，在 Lisp 里，这样的单元就是 cons cell:

|cons cell 1| ------> |cons cell 2| ------> |cons cell 3|

我们可以看一下 SBCL 对 list 分配内存的代码（src/runtime/alloc.c）：

lispobj
alloc_cons(lispobj car, lispobj cdr)
{
    struct cons *ptr =
        (struct cons *)pa_alloc(ALIGNED_SIZE(sizeof(struct cons)),
                                BOXED_PAGE_FLAG);

    ptr->car = car;
    ptr->cdr = cdr;

    return make_lispobj(ptr, LIST_POINTER_LOWTAG);
}

如果 list 的最后个元素是 nil，表明这是一个 proper list（合规列表）；如果 cons cell 的右指针不是指向 nil，则不是 proper list，打印时会出现一个“点”，被称为 dotted list：

(cons 1 2)                              ; => (1 . 2)

上面的例子说明这个 cons cell 是以“2”结尾的（右指针指向数字2），注意 length 函数是依赖右指针的，所以 dotted list 不能求长度

列表长度： (1 (2 3)) 的长度是多少呢？答：2。

列表长度是顶层列表的元素个数，而上面的列表只有两个元素——1和一个列表 (2 3)，所以长度为2：

(length '(1 (2 3)))                     ; => 2

空列表和nil： () 和 nil 是同等的，因此 nil 不仅可以表示 false，也能表示空列表：

(eq '() nil)                            ; => T

判断两个列表是否相等：

(equal '(1 2 3) '(1 2 3)) ; => T
(equal '(1 2 3) '(1 2 3 nil)) ; => NIL

consp 和 listp 主要差别在：

(listp nil) ; => T
(consp nil) ; => NIL

几个可以解构的函数，从 1 到 10 都有对应的函数：

first
last
second
third
fourth
fifth
sixth
seventh
eighth
ninth
tenth

对于超出长度的情况，这些函数不会报错，返回 nil。

REST： 获取列表第一个元素之后的所有元素：

(rest '(1 2 3 4))                       ; => (2 3 4)

CAR 和 CDR： 已知一个 cons cell 有两个指针，左边的叫 car，右边的叫 cdr：

(car '(1 2 3)) ; => 1
(cdr '(1 2 3)) ; => (2 3)

可以说：first 函数返回 list 的 car，rest 返回 list 的 cdr。

注意 cadr 和 cdar 两个函数：

对于复杂的列表，Common Lisp 标准也提供了一些操作函数，详细见《Common Lisp the Language, 2nd Edition》第 410 页。这里列举一些：

cadr 的意思是：car of the cdr，就是 cdr 的car，等同于(cdr (car list))

(car (cdr '(1 2 3))) ; => 2
(cadr '(1 2 3)) ; => 2，和以上是等同的

cdar 是：cdr of the car，就是 car 的 cdr，所以 car 返回的必须是一个 list，否则会出错：

(cdar '(1 2 3)) ; => ERROR: The value 1 is not of type LIST.
(cdar '((1 2) 3)) ; => (2)

caddr 等同于 (car (cdr (cdr list)))：

(car (cdr (cdr '(1 2 3 4)))) ; => 3
(caddr '(1 2 3 4)) ; => 3

caaddr，同上的规律：

(car (car (cdr (cdr '(1 2 (3 4) 5)))))  ; => 3
(caaddr '(1 2 (3 4) 5))                 ; => 3

看上很烧脑，但我们根据命名规律就能很好地理解：

c _ r，中间部分，我们从右往左去理解，其中“d”就是“cdr”，“a”就是“car”，比如上面的 caaddr：

c _ _ _ dr，先取 cdr

c _ _ ddr，基于上面的结果再做一次 cdr

c _ addr，基于上面的结果继续做一次 cdr

caaddr，基于上面的结果做一次 car

因此，等价于：

(car (car (cdr (cdr lst))))

1.1. 嵌套列表（Nested list）

list 中可以嵌套其他 list：

'(1 (2 3))

实际等同于：

(cons 1 (cons (cons 2 (cons 3 nil)) nil))

这被称为嵌套列表，非嵌套的被称为平坦列表（Flat list），例如：

'(1 2 3)                                ; 平坦列表

1.2. 循环列表（Circular list）

如下代码：

(setf *print-circle* t)
(defvar x '(1 2 3))
(setf (cdddr x) x)

这样 x 是无法打印出来的，因为这是个循环的 list。list 最后一个元素——即 nil 被指向了 list 的开头，头脑中想象遍历列表并打印的过程吧（是不是找不到终结的打印的条件了？）。如果设置 *print-circle* 为 t，则可以正常打印：

#1=(1 2 3 . #1#)

并且循环列表是不能求长度的：

LENGTH: A proper list must not be circular: #1=(1 2 3 . #1#)

1.3. 环表

(defvar x '(1 2 3))
(setf (cddr x) x)   ; 注意会陷入死循环，得事先设置 *print-circle* 为 t

2. cons

(cons se1 se2)

创建一个 cons cell。se1 是左指针，se2 是右指针。

;;; 左边指针指向存储了“1”的内存地址，右边指针指向存储了“2”的内存地址
(cons 1 2)                     ; => (1 . 2)
(cons 1 nil)                   ; => (1)
(cons 1 (cons 2 nil))          ; => (1 2)

3. 数组

一维数组也称为向量（vector），可以通过 vector 函数创建：

(vector 1 2 3)                          ; => #(1 2 3)
;;; 与 vector 等价的符号
#(1 2 3)                                ; => #(1 2 3)
(type-of #(1 2 3))                      ; => (SIMPLE-VECTOR 3)
                                        ; SIMPLE-ARRAY 表示没有设置 adjustable 和 fill pointer 的数组，后面讲到

数组的元素是放在一块内存块中的，在内存的布局大概如下：

|Array header | element1 | elment2 |

Array header 保存了数组的元信息，比如数组大小。

数组通过下标引用来访问：

(elt #(1 2 3) 1)                        ; => 2

上面创建的数组是 定长数组 ，意味着数组长度不可改变。可改变长度的数组成为 变长数组 ，通过 make-array 创建：

(defvar a-array (make-array 3 :fill-pointer 0))
(vector-push 0 a-array)                 ; => 0
(vector-push 1 a-array)                 ; => 1
(vector-push 2 a-array)                 ; => 2
(vector-push 3 a-array)                 ; => NIL

make-array 比 vector 更加灵活，因为它可以指定数组是变长还是定长、元素的类型以及多维数组等。

创建变长数组只需要为 make-array 指定 fill-pointer 参数，fill-pointer 用于保存数组索引位置。上例代码创建了一个包含 3 个元素数组，fill-pointer 意味着索引位置指到第 0 个，每调用 vector-push 一次就往向量中填充一个元素，并返回下标位置，但最多只能填充 3 个元素，超出范围后返回 nil。

真正变长向量应该是让我们不关注大小，可随意向向量中填充数据。指定 adjustable 参数为 t 即可：

(defvar adj-array (make-array 3 :fill-pointer 0 :adjustable t))

;;; 调用 vector-push-extend，当超出数组大小时自动扩充空间
(loop for i from 1 to 100 do (vector-push-extend i adj-array)) ; => NIL
adj-array ; => #(1 2 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100)

字符串也是个向量（由字符组成）：

(defvar hello "hello world")
(aref hello 1)                          ; => #\e
;;; 修改元素
(setf (aref hello 0) #\H)               ; => #\H
hello                                   ; => "Hello world"

3.1. 元素类型

手册中的定义：

每个元素可以是 Common Lisp 任意对象称为 General array。
每个元素都是同一种类型称为 Specialized array。

;;; make-array 指定 element-type 参数可创建特定类型的数组：
(make-array 3 :element-type 'string)
(make-array 3 :element-type 'integer)
(make-array 3 :element-type 'character)
(make-array 3 :element-type 'float)

;;; 位向量
(make-array 10 :element-type 'bit)

;; 也可以用#*创建：
#*0011

3.2. 多维数组

;;; Common Lisp 支持真正的多维数组，通过 make-array 创建

;;; 创建一个二维数组
(defvar array1 (make-array '(3 3)))
array1                               ; => #2A((0 0 0) (0 0 0) (0 0 0))
;;; “维度”又称作为 rank
(array-rank array1)                     ; => 2

;;; 索引多维数组，以及修改元素
(aref array1 0 1)                       ; => 0
(setf (aref array1 0 0) 1)              ; => 1
(setf (aref array1 0 1) 2)              ; => 2
array1                               ; => #2A((1 2 0) (0 0 0) (0 0 0))

3.3. 数组的限制

数组的大小受限于几个常量：

维度限制：array-rank-limit
数组总大小：array-total-size-limit
数组的元素数量：array-dimension-limit

不同的 Common Lisp 实现、不同的平台，数字是不一样的。

数组 vs 列表（list）：

数组内存分布更加紧密，直接通过下标访问，因此比列表快。
数组中的元素不是 cons cell，不能用 car、cdr 等操作列表的函数。

3.4. svref

快速索引向量（vector），定义如下：

(svref vector index)

示例：

(svref #(1 2 3 4 5 6) 3)                ; => 4

4. 集合（set）

集合包含不重复元素。

;;; intersection 函数求两个集合的交集，函数原型如下：
;;; (intersection list1 list2 &key key (test #'eql) test-not)
(intersection '(1 2 3) '(4 5 6))        ; => NIL
(intersection '(1 2 3) '(1 3 5))        ; => (3 1)

;;; union 函数求两个集合的并集，函数原型如下：
;;; (union list1 list2 &key key (test #'eql) test-not)
(union '(1 2 3) '(4 5 6))               ; => (3 2 1 4 5 6)
(union '(1 2 3) '(1 2 3 4))             ; => (4 1 2 3)

;;; set-difference 函数求两个集合的集合差，原型如下：
;;; (set-difference list1 list2 &key key (test #'eql) test-not)
(set-difference '(1 2 3) '(1 2 3))      ; => NIL
(set-difference '(1 2 3) '(1 2))        ; => (3)

;;; subsetp 函数提供了判断一个集合是否是另个集合的子集，subsetp 原型如下：
;;; (subsetp list1 list2 &key key (test #'eql) test-not)
(subsetp '(a e) '(a e i o u))           ; => T
(subsetp '(b c) '(a e i o u))           ; => NIL

5. 结构体（struct）

;;; 定义结构体
(defstruct my-info (name "lu4nx") (site "www.shellcodes.org")) ; => MY-INFO
;;; 结构体为每个成员分配了默认值，如果不需要默认值：
(defstruct my-info1 name site)          ; => MY-INFO1

;;; 创建新示例以“make-类型名”形式的函数创建：
(make-my-info) ; => #s(MY-INFO :NAME "lu4nx" :SITE "www.shellcodes.org")
                                        ; “#S”是 Common Lisp 显示结构体的符号。

;;; 创建时指定元素的值：
(make-my-info :name "lx")               ; => #S(MY-INFO :NAME "lu4nx" :SITE "www.shellcodes.org")

;;; 结构体的谓词函数，在这里的实例中是 my-info-p：
(my-info-p (make-my-info))              ; => T

;;; 访问结构体成员：
(my-info-name (make-my-info))           ; => "lu4nx"

;;; 修改结构体成员：
(defvar my-self (make-my-info))
my-self                                 ; => #S(MY-INFO :NAME "lu4nx" :SITE "www.shellcodes.org")
(setf (my-info-name my-self) "lux")
my-self                                 ; => #S(MY-INFO :NAME "lux" :SITE "www.shellcodes.org")

;;; 结构体继承：创建新结构体时，可继承原结构体的成员。
;; 如，继承 my-info 结构体
(defstruct (new-my-info (:include my-info)) (sex "man"))
(make-new-my-info) ; => #S(NEW-MY-INFO :NAME "lu4nx" :SITE "www.shellcodes.org" :SEX "man")

6. 键值索引

Common Lisp 键值索引方式有如下三种：

1、hash 表，也是最常见的，剩下两种都是基于列表来完成的

2、association list

3、property list

6.1. hash表

;;; 创建 hash 表
(defvar ahash (make-hash-table))

;;; 设置键值
(setf (gethash 'a ahash) 1)             ; => 1
(setf (gethash 'b ahash) 2)             ; => 2
(setf (gethash 'c ahash) 3)             ; => 3

;;; 移除键值
(remhash 'a ahash)                      ; => T
(gethash 'a ahash)                      ; => NIL

;;; 获得 hash 表大小
(hash-table-count ahash)                ; => 2

;;; 清空 hash 表
(clrhash ahash)     ; => #<HASH-TABLE :TEST EQL :COUNT 0 {10066276A3}>
(hash-table-count ahash)                ; => 0

;;; 遍历 hash 方法 1：
(maphash (lambda (k v)
           (format t "~A: ~A~%" k v))
         ahash)

;;; 遍历 hash 方法 2：

(loop for k being the hash-keys in ahash
   using (hash-value v)
   do
     (format t "key:~A value:~A~%" k v))

6.2. 关联表（association list）

6.2.1. pairlis

构造 alist，定义如下：

(pairlis keys data &optional alist)

示例：

(pairlis '(a b c) '(1 2 3))             ; => ((C . 3) (B . 2) (A . 1))
;;; 指定最后一个 alist 参数
(pairlis '(a b c) '(1 2 3) '((x 1) (y 2) (z 3))) ; => ((C . 3) (B . 2) (A . 1) (X 1) (Y 2) (Z 3))

6.2.2. assoc/rassoc

访问一个 association list 结构，association list 结构每个元素都是一个嵌套列表，定义如下：

(assoc item alist &key key test test-not)

(assoc 'a '((a 1) (b 2)))                             ; => (A 1)
;;; 指定 :test 参数
(assoc "a" '(("a" 1) ("b" 2)) :test #'equal) ; => ("a" 1)

rassoc 则是判断每个关联表的 CDR，如：

  (setf a '(("10.csv" . 76760) ("9.csv" . 500001) ("8.csv" . 500001) ("7.csv" . 500001)
            ("6.csv" . 500001) ("5.csv" . 500001) ("4.csv" . 500001) ("3.csv" . 500001)
            ("2.csv" . 500001) ("1.csv" . 500001) ("xx" . "aa")))
;
  (rassoc 500001 a)                       ; => ("9.csv" . 500001)

对于有多个相同 value 的点对表，只会返回第一个匹配到的，如上，有多个点对表的值都是 500001，返回的是第一个匹配到的。

6.2.3. 关联表的综合示例

;;; 关联表实质是上是一个有规律的嵌套列表：
'((a . 1) (b . 2) (c . 3))

;;; 使用示例：
(defvar alist '((a . 1) (b . 2) (c . 3)))
;; 通过 assoc 函数检索
(assoc 'a alist)                        ; => (A . 1)
;; 取 value
(cdr (assoc 'a alist))                  ; => 1
;; 取 key
(car (assoc 'a alist))                  ; => A
;; 通过 acons 函数增加新的键值，但是 acons 是无副作用的函数，不会直接修改内容，而是返回新的：
(acons 'd 4 alist)                      ; => ((D . 4) (A . 1) (B . 2) (C . 3))
;; 如果要修改内容，可以用 setf
(setf alist (acons 'd 4 alist)) ; => ((D . 4) (A . 1) (B . 2) (C . 3))
;; 或者 push，更为简单
(push '(e . 5) alist)                   ; => ((E . 5) (D . 4) (A . 1) (B . 2) (C . 3))

6.3. 属性表（property list）

;;; 属性表也是基于列表，但无嵌套：
'(a 1 b 2 c 3)
(defvar plist '(a 1 b 2 c 3))

;; 索引
(getf plist 'a)                         ; => 1
;; 重新赋值
(setf (getf plist 'a) 10)               ; => 10
;; 设置新值
(setf (getf plist 'e) 4)                ; => 4
;; 删除元素
(remf plist 'e)                         ; => T
plist                                   ; => (A 1 B 2 C 3)

7. 树

7.1. subst/nsubst

遍历整个树，将树中所有匹配到的元素替换成新值。

(defvar atree '(((a1 a2) (a3 a4)) ((b1 b2) (b3 b4))))
(subst 'b1 'c1 atree)                   ; => (((A1 A2) (A3 A4)) ((B1 B2) (B3 B4)))

nsubst 是 subst 带副作用的破坏性操作版。

7.2. sublis

定义：

(sublis alist tree &key key test test-not)

alist 参数是一个关联列表 ((key1 . value1) (key2 . value2))，key 是要替换的旧值，value 是新值。遍历 tree，将旧值替换成新值，如：

;;; 将 1 替换成 a、2 替换成 b
(sublis '((1 . a) (2 . b)) '(1 2 (1 3))) ; => (A B (A 3))

8. 谓词函数

8.1. listp

(listp object)

谓词函数，判断 object 是否是 list 对象，是的话返回 t，否则返回 nil

(listp '(1 2 3))                        ; => T
(listp 123)                             ; => NIL

8.2. arrayp

(arrayp object)

谓词函数，判断 object 是否是数组

(defvar x (make-array 10 :initial-element 1))
(arrayp x)                              ; => T

9. 相关函数

9.1. append

连接到列表，定义：

(append &REST LISTS)

(append '(a b c) '(c))                  ; => (A B C C)
(append '(a b c) 'c)

9.2. nconc

有副作用版的 append：

  (setf x '(a b c))
(nconc x '(1 2 3))
x                                       ; => (A B C 1 2 3)

9.3. remove

从列表中删除项：

(remove 'c '(a b c))                    ; => (A B)

9.4. remove-duplicates

删除重复项：

(remove-duplicates '(a b c a 1))        ; => (B C A 1)

9.5. reverse

逆转列表：

(reverse '(a b c))                      ; => (C B A)

9.6. member

检查列表中是否包含指定的元素，如果包含就从所在位置开始返回：

(member 'b '(a b c d e))                ; => (B C D E)

9.7. union/intersection

union 做并集：

(union '(a b c) '(c d e))               ; => (B A C D E)

intersection 做交集：

  (intersection '(1 2 3) '(2 3 4))
(3 2)

9.8. notany

定义：

(notany pred seq1 &rest more-seqs)

参数 pred 是一个谓词函数，提供一个或多个序列用作判断，如果全部不为真，notany 返回 T。

如果只提供一个序列，那么序列中的每个元素会被应用到函数上：

(notany #'evenp '(1 2 3 4))             ; => NIL
(notany #'evenp '(1 3 5 7))             ; => T

如果提供多个序列，会同时传递多个参数给函数，所以函数需要支持指定参数数量才行：

(notany #'equal '(1 3 5 7) '(1 3 5 7))          ; => NIL
;;; 全部不相等
(notany #'equal '(1 3 5 7) '(2 4 6 8))  ; => T

9.9. mismatch

定义：

(mismatch seq1 seq2 &rest args &key from-end (test '#eql) test-not (start1 0) end1 (start2 0) end2 key)

返回两个向量首次不同的位置。

(mismatch "http://www.shellcodes.org" "http://") ; => 7

9.10. substitute

定义：

(substitute new old seq &rest args &key from-end (test #'eql) test-not (start 0) count end key)

替换序列中的内容。

(substitute #\a #\b "abcd")    ; => "aacd"
(substitute 10 1 #(1 2 3 4 5)) ; => #(10 2 3 4 5)

9.11. psetf

定义：

(psetf &rest pairs)

给多个 pair 分配新的值。

(defvar x '(1 2 3))
(defvar y '(4 5 6))
(psetf (car x) 'one (car y) 'four) ; => NIL
x                                  ; => (ONE 2 3)
y                                  ; => (FOUR 5 6)
(psetf x 1 y 2)                    ; => NIL
x                                  ; => 1
y                                  ; => 2

9.12. nthcdr

定义：

(nthcdr n list)

对 list 指定 n 次“cdr“。

;;; 等同于 (cdr (cdr '(1 2 3)))
(nthcdr 2 '(1 2 3))                     ; => (3)

9.13. subsetp

判断一个列表是否为另一个列表的子集，示例：

(subsetp '(l o) '(h e l l o))           ; => T

9.14. nthcdr

从指定位置开始做 CDR 操作：

(nthcdr 3 '(h e l l o w o r l d))       ; => (L O W O R L D)