colinaaa
diff --git a/‎Ln9.image/NearestPointsCpi.png‎
19.3 KB b/‎Ln9.image/NearestPointsCpi.png‎
19.3 KB
diff --git a/‎Ln9.image/NearestPointsDef.png‎
23.1 KB b/‎Ln9.image/NearestPointsDef.png‎
23.1 KB
diff --git a/‎Ln9.image/NearestPointsDivide.png‎
24.4 KB b/‎Ln9.image/NearestPointsDivide.png‎
24.4 KB
diff --git a/‎Ln9.image/NearestPointsMerge.png‎
23.5 KB b/‎Ln9.image/NearestPointsMerge.png‎
23.5 KB
diff --git a/‎Makefile‎
Lines changed: 3 additions & 1 deletion b/‎Makefile‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎book.pdf‎
1.37 MB b/‎book.pdf‎
1.37 MB
diff --git a/‎book.tex‎
Lines changed: 3 additions & 1 deletion b/‎book.tex‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎src/Ln11-LargeIntegerMultiplication.tex‎
Lines changed: 164 additions & 0 deletions b/‎src/Ln11-LargeIntegerMultiplication.tex‎
Lines changed: 164 additions & 0 deletions
diff --git a/‎src/Ln9-NearestPoints.tex‎
Lines changed: 158 additions & 0 deletions b/‎src/Ln9-NearestPoints.tex‎
Lines changed: 158 additions & 0 deletions
@@ -4,7 +4,9 @@ TEX=\
 	$(SRC)/example.tex\
 	$(SRC)/dynamic-programming-1.tex\
 	$(SRC)/Network-flows.tex\
-	
+	$(SRC)/Ln9-NearestPoints.tex\
+	$(SRC)/Ln11-LargeIntegerMultiplication.tex\
+
 all: book.pdf
 .PHONY: all clean dev clean-all
 
 
@@ -3,7 +3,7 @@
 \usepackage{tikz}
 \usepackage{graphicx}
 \usepackage{subcaption}
-\usepackage[ruled,linesnumbered]{algorithm2e}
+\usepackage[ruled,linesnumbered,vlined]{algorithm2e}
 \usepackage{hyperref}
 \usepackage{listings}
 
@@ -31,6 +31,8 @@
 \input{src/example.tex}
 \input{src/dynamic-programming-1.tex}
 \input{src/Network-flows.tex}
+\input{src/Ln9-NearestPoints.tex}
+\input{src/Ln11-LargeIntegerMultiplication.tex}
 
 \bibliography{ref.bib}
 \end{document}
@@ -0,0 +1,164 @@
+\chapter{分治法之大数乘法}
+\begin{introduction}
+    \item 问题背景
+    \item 直接分治法
+    \item 改进分治法
+\end{introduction}
+
+\section{问题描述}
+给定两个大数$A$和$B$, 试计算
+\begin{math}
+    A \times B
+\end{math}.
+其中$A$和$B$分别表示为
+\begin{math}
+    A = a_n a_{n-1} a_{n-2} \ldots a_2 a_1
+\end{math}
+,
+\begin{math}
+    B = b_n b_{n-1} b_{n-2} \ldots b_2 b_1
+\end{math}.
+根据已学知识，给出如下引理。
+
+\begin{lemma}{}{label_for_a+b}
+    直接计算$A + B$，其复杂度为$O(n)$, 其中$n$为$A$和$B$的十进制位数。
+\end{lemma}
+
+直接计算$A \times B$时，我们将$A$与$B$的各位相乘，在将各中间结果相加，得到最终结果。
+不难得出，这一过程需要进行$n$次基本乘法与$n+1$次加法。
+根据引理\ref{lem:label_for_a+b}，有：
+\begin{theorem}{}{label_for_a*b}
+    直接计算$A \times B$的时间复杂度为$O(n^2)$.
+\end{theorem}
+
+由定理\ref{thm:label_for_a*b}和引理\ref{lem:label_for_a+b}可知，如果我们直接相乘两个大数，其时间复杂度相比加法运算高出一个量级。
+由于乘法在计算机中大量存在，我们希望找到更好的算法来降低乘法计算的时间复杂度，以提升计算机的性能。
+分治法为我们提供了一条途径。
+\section{直接分治法}
+\subsection{算法描述}
+这是一种简单的分治方法，将两个大数分为前后两部分，进行相乘。不失一般性，这里假设$n$为偶数。
+将$A$与$B$分割为$A_2$, $A_1$, $B_2$, $B_1$,即：
+\begin{displaymath}
+    \begin{split}
+        A_2 &= a_{n} a_{n-1} \ldots a_{\frac{n}{2} + 2} a_{\frac{n}{2} + 1}\\
+        A_1 &= a_{\frac{n}{2}} a_{\frac{n}{2} - 1} \ldots a_2 a_1\\
+        B_2 &= b_{n} b_{n-1} \ldots b_{\frac{n}{2} + 2} b_{\frac{n}{2} + 1}\\
+        B_1 &= b_{\frac{n}{2}} b_{\frac{n}{2} - 1} \ldots b_2 b_1
+    \end{split}
+\end{displaymath}
+
+则$A$可以写为$A = A_2 \times 2^{\frac{n}{2}} + A_1$.
+$B$可以写为$B = B_2 \times 2^{\frac{n}{2}} + B_1$.
+计算$A \times B$的问题在进行上述转换后表示为：
+\begin{displaymath}
+    \begin{split}
+        A \times B
+        & = (A_2 \times 2^{\frac{n}{2}} + A_1) \times (B_2 \times 2^{\frac{n}{2}} + B_1) \\
+        & = A_2 B_2 \times 2^n + (A_2 B_1 + A_1 B_2) \times 2^{\frac{n}{2}} + A_1 B_1
+    \end{split}
+\end{displaymath}
+
+此时将两个大数相乘的问题转化为4个乘法子问题和3个加法子问题。显然，分治策略还可以对子问题使用，继续减小问题的规模。
+
+\subsection{伪代码}
+\begin{algorithm}
+    \DontPrintSemicolon{}
+    \KwIn{Two large numbers $A$, $B$, which both have $n$ decimal digits}
+    \KwResult{$A \times B$}
+    \Begin{
+        $n \leftarrow $ Number of Decimal Digits of $A$ and $B$\;
+        \If{$n \neq 1$}{
+            Divide $A$, $B$ into $A_2$, $A_1$, $B_2$ and $B_1$\;
+            $C_3 \leftarrow DirectDAC(A_2, B_2)$\;
+            $C_2 \leftarrow DirectDAC(A_2, B_1)$\;
+            $C_1 \leftarrow DirectDAC(A_1, B_2)$\;
+            $C_0 \leftarrow DirectDAC(A_1, B_1)$\;
+            \KwRet{$C_3 \ll n + (C_2 + C_1) \ll (n - 1) + C_0$}\;
+        }
+        \Else{
+            \KwRet{$A \times B$}
+        }
+    }
+    \caption{DirectDAC\label{label_for_pseudo_DirectDAC}}
+\end{algorithm}
+
+\subsection{复杂度分析}
+由上述的算法描述可知，算法的主要开销来自于每次分支带来的4个乘法子问题和3个加法子问题，由于移位可在机器中由一个简单的指令完成，我们忽略这个操作的时间。\\
+假设$T(n)$表示两个$n$位大数相乘所需的时间开销，则在直接分治法中：
+\begin{displaymath}
+    \begin{split}
+        T(n)
+        &= 4T(\frac{n}{2}) + 3n \\
+        &= 4T(\frac{n}{2}) + O(n)
+    \end{split}
+\end{displaymath}
+
+根据主方法，$\log_2 4  = 2> 1$, 推出如下定理：
+\begin{theorem}{}{label_for_DirectDAC_complexity}
+    用直接分治法计算$A \times B$的时间复杂度为$O(n^2)$.
+\end{theorem}
+
+根据定理\ref{thm:label_for_DirectDAC_complexity},直接分治法的性能是令人失望的，因为其并不能提供时间上优于直接相乘的性能。
+但分治策略提示我们，这个算法的性能与乘法子问题的数目强相关。我们如果能够用一些其他的开销换取更少的乘法子问题数目，也许能得到更好的算法。
+
+
+\newpage
+\section{改进分治法}
+\subsection{改进思路}
+在直接分治法中，通过对大数进行分割，我们有：
+\begin{displaymath}
+    A \times B = A_2 B_2 \times 2^n + (A_2 B_1 + A_1 B_2) \times 2^{\frac{n}{2}} + A_1 B_1
+\end{displaymath}
+
+这个过程中，引入了4次乘法运算；在上一节中提到，分治策略和主定理提示我们尽可能减少乘法的次数。
+但换取更低的乘法子问题数，需要其他的开销。
+一种想法是，由于加法的复杂度为$O(n)$，我们也许可以用略多的加法子问题，来减少乘法子问题数。
+基于此想法，我们对直接分治法作出一些改进。首先将直接分治法中的计算式修改为：
+\begin{displaymath}
+    \begin{split}
+        A \times B
+        &= A_2 B_2 \times 2^n + (A_2 B_1 + A_1 B_2) \times 2^{\frac{n}{2}} + A_1 B_1\\
+        &= A_2 B_2 \times 2^n + ((A_2 + A_1)\times(B_2 + B_1) - A_2 B_2 - (A_1 B_1)) \times 2^{\frac{n}{2}} + A_1 B_1
+    \end{split}
+\end{displaymath}
+
+观察上式，我们只需要做3次乘法，即计算$A_2 B_2$, $A_1 B_1$, $(A_2 + A_1)\times(B_2 + B_1)$, 以及4次加法，2次减法。
+考虑到加法和减法本质上等同，我们成功地将这一问题转化为了3个乘法子问题和6个加法子问题。相比于直接分治法，我们降低了乘法的数量。
+
+下面给出该算法的伪代码及复杂度分析。
+\subsection{伪代码}
+\begin{algorithm}
+    \DontPrintSemicolon{}
+    \KwIn{Two large numbers $A$, $B$, which both have $n$ decimal digits}
+    \KwResult{$A \times B$}
+    \Begin{
+        $n \leftarrow $ Number of Decimal Digits of $A$ and $B$\;
+        \If{$n \neq 1$}{
+            Divide $A$, $B$ into $A_2$, $A_1$, $B_2$ and $B_1$\;
+            $C_2 \leftarrow DirectDAC(A_2, B_2)$\;
+            $C_1 \leftarrow DirectDAC(A_1, B_1)$\;
+            $C_0 \leftarrow DirectDAC(A_2 + A_1, B_2 + B_1)$\;
+            \KwRet{$C_2 \ll n + (C_0 - C_2 - C_1) \ll (n - 1) + C_1$}\;
+        }
+        \Else{
+            \KwRet{$A \times B$}
+        }
+    }
+    \caption{ModifiedDAC\label{label_for_pseudo_ModifiedDAC}}
+\end{algorithm}
+
+\subsection{复杂度分析}
+同上节的复杂度分析，我们此处也忽略移位操作带来的开销。改进分治法中，我们将问题分解为3个乘法子问题与6个加法子问题。
+因此有：
+\begin{displaymath}
+    \begin{split}
+        T(n)
+        &= 3T(\frac{n}{2}) + 6n\\
+        &= 3T(\frac{n}{2}) + O(n)
+    \end{split}
+\end{displaymath}
+
+根据主方法，$\log_2 3 > 1$. 推出如下定理：
+\begin{theorem}{}{label_for_ModifiedDAC_complexity}
+    用改进分治法计算$A \times B$的时间复杂度为$O(n^{\log_2 3}) \approx O(n^{1.585})$.
+\end{theorem}
@@ -0,0 +1,158 @@
+\chapter{分治算法之平面最近点对问题}
+
+\begin{introduction}
+\item 平面最近点对问题定义
+\item 分治算法设计
+\item 分治算法时间复杂度分析
+\item 伪代码
+\end{introduction}
+
+\section{平面最近点对问题定义}
+给定二维平面上的$n(n \ge 2)$个不同的点$p$组成点集$P = \{p_i \big| 1\le i \le n\}$，
+设计算法寻找欧式距离最近的点对$(A,B)$。
+\begin{figure}[htb]
+    \centering
+    \includegraphics[scale=0.5]{Ln9.image/NearestPointsDef.png}
+    \caption{问题定义图例}\label{fig1}
+\end{figure}
+
+如上图\autoref{fig1}中点对$(A,B)$即为问题的答案。
+
+\section{分治算法设计}
+对于这样一个问题，我们很直接地可以使用BF (Brute Force)算法进行暴力求解，
+即二重循环计算所有点之间的距离，从而获得最小距离，显然该算法的时间复杂度为
+$O(n^2)$。那么有没有更快的算法呢？本章我们使用经典的算法思想——分治，
+设计一个$O(n\log n)$的算法。
+
+\subsection{分治问题}
+遵循分治思想，我们首先要考虑如何分治问题使得问题规模约减。
+
+我们使用X坐标作为第一关键字、Y坐标作为第二关键字，对点集$P$进行排序，
+并以点$p_{\lfloor\frac{n}{2}\rfloor}$作为分治点，获得如下两个点集：
+\begin{equation*}
+    P_1 = \{p_i\ \big|\ 1 \le i \le \lfloor\frac{n}{2}\rfloor \}
+\end{equation*}
+\begin{equation*}
+    P_2 = \{p_i\ \big|\ \lfloor\frac{n}{2}\rfloor < i \le n\}
+\end{equation*}
+这样就将当前问题约减为两个规模为$\frac{n}{2}$的子问题
+分治过程如\autoref{fig2}中所示。
+
+\begin{figure}[htb]
+    \centering
+    \includegraphics[scale=0.5]{Ln9.image/NearestPointsDivide.png}
+    \caption{分治过程图例}\label{fig2}
+\end{figure}
+
+如此递归下去，我们可以求得两个点集相对应的最近点对距离$\delta_1, \delta_2$，取其中较小值
+记为$\delta = \min \{ \delta_1 , \delta_2 \}$。
+
+当分治到点集大小为2个或3个时，可以在常数时间内计算出子问题的解。
+
+\subsection{合并结果}
+
+接着，我们需要考虑如何合并子问题的解。
+
+上述的$\delta$一定是正确的合并结果嘛？显然不是，我们并没有考虑，一端在$P_1$，
+一端在$P_2$的线段。因此，在合并阶段，我们要将这种情况考虑在内。
+
+这里，我们将所有横坐标与分治点$p_{\lfloor\frac{n}{2}\rfloor}$的横坐标
+$x_{\lfloor\frac{n}{2}\rfloor}$差值小于$\delta$的点组成集合$B$，即
+\begin{equation*}
+    B = \{p_i\ \big|\ 
+        \left|x_i - x_{\lfloor\frac{n}{2}\rfloor}\right| \le \delta ,\
+        1 \le i \le n\}
+\end{equation*}   
+因为只有$B$集合中的点之间的距离才有可能小于$\delta$。
+$B$集合如下图\autoref{fig3}中阴影部分所示:
+\begin{figure}[htb]
+    \centering
+    \includegraphics[scale=0.5]{Ln9.image/NearestPointsMerge.png}
+    \caption{合并过程图例}\label{fig3}
+\end{figure}
+
+进一步，我们的目标是检验在$B$集合中是否存在距离比$\delta$更近的点对，以此更新当前问题的解
+。因此，对于每个$p_i = (x_i, y_i) \in B$遍历所有在其之下竖直距离不超过$\delta$的点，
+即遍历集合
+\begin{equation*}
+    C(p_i) = \{ p_j\ \big|\ y_i - \delta \le y_j \le y_i, p_j \in B \}
+\end{equation*}
+为了方便遍历，我们可能会想到对$B$集合中的点，以Y坐标为第一关键字，X坐标为第二关键字，进行排序。
+但是如此一来，每一次合并的时间复杂度为$O(n \log n)$，徒增时间消耗，因此我们采取合并策略，即
+按照Y坐标为关键字，进行$P_1, P_2$的归并来直接获得排序后的集合$B$，这样只需要$O(n)$的时间。
+
+考虑到$C(p_i)$会因为归并操作而维持在$O(n)$数量级，其实不然，该集合的大小不会超过7。下面给出
+证明。
+
+根据定义，$C(p_i)$中的点的纵坐标均处于$(y_i - \delta, y_i]$范围内，且其中的所有点
+的横坐标均处于$\left( x_m - \delta, x_m + \delta \right)$范围内。
+这样便构成了一个$2\delta\times\delta$的矩形。如下图\autoref{fig4}所示
+\begin{figure}[htb]
+    \centering
+    \includegraphics[scale=0.5]{Ln9.image/NearestPointsCpi.png}
+    \caption{$C(p_i)$}\label{fig4}
+\end{figure}。
+
+接着，我们将这个矩形分拆成左右两个$\delta \times \delta$的正方形，左侧正方形的点集为
+$C(p_i)\cap P_1$，右侧正方形的点集为$C(p_i)\cap P_2$，从上述的分治过程可知，这两个点集
+内的点之间的距离一定不小于$\delta$。
+
+进一步，我们将$\delta \times \delta$正方形，分拆成四个$\frac{\delta}{2}\times\frac{\delta}{2}$
+小正方形，因为这个小正方形的对角线为$\frac{\delta}{\sqrt{2}} < \delta$，所以小正方形中最多
+只有一个点，而总共有8个小正方形，最多有8个点，除去$p_i$，则最多只有7个点。
+
+至此，我们完成了父问题的分治与子问题的合并。
+
+\section{分治算法的时间复杂度分析}
+首先，第一次排序可以使用时间复杂度为$O(n\log n)$的排序算法，如快速排序或者归并排序。
+
+接着，我们考虑分治过程，即通过分治，我们将规模为$n$的父问题，分为两个规模为$\frac{n}{2}$的子问题。
+
+最后，归并过程中，根据采用的合并策略以及上述对更新操作的证明，我们需要$O(n)$级别的时间完成。
+
+综上，给出递推式如下：
+
+\[
+    T(n) = \begin{cases}
+        O(1) & 2 \le n \le 3 \\ 
+        2T(\frac{n}{2}) + O(n) & n > 3
+    \end{cases} 
+\]
+
+推导如下：
+\begin{align*}
+        T(n) &= 2T(\frac{n}{2}) + O(n)\\
+             &= 2^2T(\frac{n}{2^2}) + 2O(\frac{n}{2}) + O(n)\\
+             &= 2^2T(\frac{n}{2^2}) + 2O(n)\\
+             &\vdots \\
+             &= 2^k T(\frac{n}{2^k}) + kO(n)\ \ (n = 2 ^ k)\\
+             &= O(n) + O(n\log n) \\ 
+             &= O(n\log n)
+\end{align*}
+
+\section{伪代码}
+\begin{algorithm}
+    \DontPrintSemicolon{}
+    \KwData{
+        Point List $P = \{p_i\ \big|\ 1 \le i\le n, p_i = (x_i, y_i)\}$\;
+        $P$ should be sorted by x-coordinate in descending order.
+    }
+    \KwResult{the minimum distance $\delta$}
+\Begin{
+    \If{$\left| P \right| <= 3$}{ 
+        Return the minimum Euclidean-Distance between each pair of points.
+    }
+    $m \leftarrow \lfloor \frac{n}{2} \rfloor$\;
+    $\delta_1 \leftarrow \text{Nearest-Pair}(P[1,\ \ldots,\ m])$\;
+    $\delta_2 \leftarrow \text{Nearest-Pair}(P[m + 1,\ \ldots ,\ n])$\;
+    $\delta \leftarrow \min \{ \delta_1,\ \delta_2 \}$\;
+    $B \leftarrow \text{MergeByY}(P_1,\ P_2)$\;
+    \ForEach{$p_i \in B$}{
+        \ForEach{$p_j \in C(p_i)$} {
+            $\delta \leftarrow \min \{\delta,\ \text{Euclidean-Distance}(p_i, p_j)\}$
+        }
+    }
+    Return $\delta$
+}
+\caption{Nearest-Pair\label{NPP}}
+\end{algorithm}