Issuu on Google+

Scientific Journal of Information Engineering February 2013, Volume 3, Issue 1, PP.13-18

Research Expectation of Self-Assembled Model Based on Molecular Beacon Zhixiang Yin, Wenyi Zhang# Department of Mathematics and Physics, Anhui University of Science and Technology, Huainan China, 232001 #

Email: zxyin66@163.com

Abstract DNA computing using Self-Assembly and its model based on molecular beacon has been the focus in the research of DNA Computing in the recent years. Self-Assembled DNA computing is the result of the combination of DNA Computing, the theory of tiling and nanotechnology, and moreover, molecular beacon has the advantages of simple structure, high sensitivity, easilymeasured and fast reaction rate. The combination of molecular beacon and Self-Assembly will provide a new effective method of studying DNA Computing. Introduce the significance of research about Self-Assembled model based on molecular beacon, researchful actuality of Self-Assembled DNA computing model and DNA computing model based on molecular beacon, as well as researchful track of Self-Assembled model based on molecular beacon. The first of all, research about the characteristics of structure about molecular beacon and its capacity of the information expressed and handled, the deep research on the assembly rules about the theory of Self-Assembled DNA computing and optimal design, discuss the Self-Assembled methods of molecular beacon and its complexity analysis in detail, create its model. Secondly, establish the Self-Assembled model based on molecular beacon, which contains many combinatorial optimization problems. Furthermore, we make a further discussion on the advantages and the disadvantages about Self-Assembled model based on molecular beacon in order to design a new model with universality. Keywords: Self-Assembly; Molecular Beacon; DNA Computing; Matrix Addition; Combinatorial Optimization

基于分子信标的自组装模型研究展望* 殷志祥,张文逸 安徽理工大学 理学院,安徽 淮南 232001 摘

要:自组装 DNA 计算和分子信标 DNA 计算模型是近年来 DNA 计算研究领域的热点,自组装 DNA 计算是 DNA 计

算、tiling 理论和纳米技术结合的产物,分子信标具有结构简单、灵敏度高、易于检测及反应速度快等优点。将分子信标 与自组装相结合,将为 DNA 计算研究提供新的有效方法。介绍了基于分子信标的自组装模型研究的意义,自组装 DNA 计算模型和分子信标计算模型研究现状,以及基于分子信标的自组装模型研究的途径。首先研究分子信标的结构特性及 分子信标的表达信息和处理信息的能力,深入研究自组装 DNA 计算机理及优化设计的组装规则,讨论分子信标的自组 装方法及复杂性分析,构建分子信标的自组装模型; 其次建立组合优化问题的基于分子信标自组装模型,进一步讨论分 子信标自组装模型的优缺点并对设计方法进行改进,设计具有通用性的分子信标自组装模型。 关键词:自组装;分子信标;DNA 计算;矩阵加法;组合优化

1

分子信标的自组装模型研究的意义 优化计算问题,一直是计算机科学技术领域的核心问题,组合优化中许多问题的解决是检验优化计算方

法优劣的重要方法,如图论、运筹学中的一些困难计算问题甚至 NPC 问题。电子计算机的发展,极大地刺激 *

基金资助: 本文得到国家自然科学基金(60873144,61170172,61073102,60973050)及安徽理工大学本科生研究项目资助. - 13 http://www.sjie.org


了优化计算理论的发展。然而,随着社会和科学技术的发展,工程领域内不断涌现出许多新的复杂或者巨复 杂系统,出现了许多计算机无法解决的困难问题。为了找到解决大规模和超大规模问题的计算方法和手段, 人工神经网络计算、量子计算、分子生物计算及云计算等相继产生。DNA 计算在近十年来倍受科学界的关注 [1-5]

。DNA 计算是一种以 DNA 与相关的某些生物酶等作为最基本材料的、基于某些生化反应原理的一种新型

的分子生物计算方法。它的新颖性不仅仅在于算法和速度,而在于采用迄今为止还没有作为计算机硬件的生 物工业技术来实现,并且开发了生物酶自身潜在的“运算”能力。理论分析证明,未来的 DNA 计算机在信 息存储和运算速度等方面是电子计算机无法比拟的。 如何更好的将信息和算法运用到 DNA 计算中去?科学家们发现生物化学中的自组装可以完成任何一个 DNA 计算,而自组装又是具有一定规则的生物过程。因此,将算法融入到自组装中成为了人们研究的中心, 也就是现在的算法自组装。自组装 DNA 计算模型根据自组装过程形成的基本结构可进一步划分为一维线性 结构 DNA 计算模型,二维平面结构 DNA 计算模型和三维立体结构 DNA 计算模型。按此分类,1994 年, Adleman 提出的 Hamilton 路问题的 DNA 计算模型属于一维线线性结构自组装 DNA 计算模型;1998 年, Winfree 通过 DNA 自组装形成的 DNA 计算模型属于二维平面结构自组装 DNA 计算模型[6];2008 年,Mao 利 用 DNA 单链组装成的多种复杂立体结构属于三维立体结构自组装 DNA 计算模型[5]。 随着 DNA 自组装技术的不断发展,许多研究人员将 DNA 分子组装成更为复杂的二维阵列进行运算。用 于构造二维阵列的初级元件主要可分为以下三种:一条长 DNA 单链、DNA 自组装单元、多条短寡核苷酸 链。目前作为初级元件的长 DNA 单链大多为 M13,它是丝状噬菌体家族的,长度约为 6400 个碱基的单链 DNA 基因组。2006 年,Paul 成功地应用了一条长约为 7kb 的 M13,借助于 200 多条短的寡核苷酸链通过碱 基互补在特定部位折叠成复杂的二维结构图案。在折叠的基本形状的基础上,他还利用荧光或生物素标记特 定位置的 DNA 链,将其作为纳米尺度的像素,并在原子力显微镜和扫描隧道显微镜下观察到字母、雪花及 美洲地图等图案[7]。上海交通大学贺林研究组应用同样的思想将一条长约 7kb 个碱基的 M13,通过 200 多条 短的 DNA 链与其不同区域互补,折叠成直径约为 150nm 的中国地图图案,并在原子力显微镜观察到真实的 纳米级中国地图[8]。生物中的自组装过程本身是由多个反应物和反应机理控制的,其过程涉及动力学、热力 学、化学等诸多方面,加州理工大学的 Winfree 博士提出了利用 Tile System 对自组装过程进行抽象,证明了 Tile 自组装模型的计算能力是图灵机等价的。通过分子自组装可以得到具有新奇的光、电、催化等功能和特性 的自组装材料,其中备受关注的自组装膜材料在非线性光学器件、化学生物传感器、信息存储材料。自组装 的这些特性不仅在工业和生活中由重要的应用,而且与生命活动本身密切相关,成为研究生命现象的奥秘和 发展仿生技术极具价值的体系,因此研究分子自组装特性就显得尤为重要。自组装一定程度上也避开了频繁 操作带来的误差累积,而且一次性生成产物的过程也是容易控制的,因此自组装在 DNA 计算乃至 DNA 计算 机机理研究方面具有极好的研究价值。

2

自组装 DNA 计算模型和分子信标计算模型研究现状

2.1 DNA 计算与自组装 DNA 计算是一种以 DNA 与相关的某些生物酶等作为最基本材料的、基于某些生化反应原理的一种新 型的分子生物计算方法。1994 年,美国加利福尼亚大学的 Adleman 博士提出利用 DNA 对一个图论中的 NP完全问题-有向图的 Hamilton 路问题进行编码,借助连接、变性、复性、PCR 扩增、电泳等生物操作可以求 解出这一问题。它的新颖性不仅仅在于算法,也不仅仅在于速度,而在于采用迄今为止还没有作为计算机 硬件的生物工业技术来实现,并且开发了生物酶自身潜在的“运算”能力。自 1998 年 Winfree 提出 DNA 计 算的自组装模型以来,自组装模型的研究就得到了许多研究者的关注。Gehani 等人在 1999 年采用 DNA 自 组装的方法实现了一次一密体制中的二进制串的异或操作 [9] 。他们采用对每个比特使用一个 TAO 分子, TAO 分子的结构使其能够线性结合起来来表示整个二进制输入串。2000 年,Adleman 建立了 Tile 自组装的 - 14 http://www.sjie.org


随机微分方程模型,并确定了一些一维自组装的均衡概率分布收敛速度[10],LaBean 等人给出了基于 TAE 分 子、生物操作复杂度为常数的 DNA 加法模块设计方案,并首次给出了基于 DNA Tile 自组装计算的实验演 示[11]。DNA 计算研究具有突破性的进展应是 2001 年以色列 Weizmann 科学院的 Benenson 关于基于分子生 物的可编程与自治计算机器的研究[12]。我们称它为是一种“半自动化试管型 DNA 计算机”。当然,此运算 器目前还没有什么实用性,但它的科技意义是开拓性的!该机器是一种可编程的、可自治地解决组合优化 问题的有限自动机,这种有限自动机由 DNA 和操作 DNA 的生物酶构成。同年,Braich 等给出了半自动化 自组装 DNA 计算模型,并利用该模型解决了含有 20 个变元的 3-可满足性问题[13] 。这个模型解决了具有 20 个变元 2 20 种解的组合的可满足性问题,是到现在为止最好结果,也为 DNA 计算的高度并行性提供了更有 力的依据。2002 年 Adleman 对自组装程序复杂性进行深入研究,给出了树状自组装的程序复杂度的界限[14]。 2004 年 Rothemund 和 Winfree 为了进一步证实 DNA 自组装算法的图灵完全计算能力[15],首次给出了一个 2D 自组装的实验展示。将一维自组装进行了推广,选择了一种简单有趣的局部细胞自动机——XOR 函数, 给出了利用 DX Tile 实现一维细胞自动机的一个实验结果,完成了 XOR 运算,并证明了用 DNA Tile 自组装 实现任何细胞自动机的可能性。2005 年 Barish 给出了一个 2D 自组装实现计数和拷贝的实验[16]。2006 年 Brun 从理论上给出了实现二进制加法和乘法运算的 Tile 系统[17],并在此基础上解决大数分解和子集和问题 [18, 19]

。国内关于 DNA 计算与自组装 DNA 计算模型的研究已逐步开展起来,得到了一些可喜的研究成果,

诸如采用自组装 DNA 计算实现一次密的加密方案,破译 MTRU 系统的非确定性方案,整数分解问题,图顶 点着色问题等[20-25]。

2.2 分子信标与自组装模型 自从 Tyagi 和 Krammer 于 1996 年建立分子信标探针以来[26],其作为一种新型的荧光探针得到了广泛的 应用。随着对分子信标特性研究的深入及新型分子信标的出现,人们发现分子信标作为一种核酸探针,不 仅适用于体外核酸分析,而且同样也适用于活体分析。更为重要的是,它可以用于蛋白质等能与核酸发生 相互作用的物质分析,是一种极好的研究蛋白质与核酸的工具。而且分子信标还可用作 DNA 传感器、DNA 芯片等的核酸探针。分子信标是一个用荧光标记的环茎型寡聚核苷酸序列,环上的寡聚核苷酸序列是分子 信标的基因识别部分,它能与靶基因自发地进行杂交。茎部是一段 4-12 对碱基互补的发夹结构。在分子信 标的 5’端和 3’端通过连接臂连接上荧光基团和猝灭基团。在原始状态下,分子信标呈茎环结构,茎部的荧 光分子与猝灭分子非常接近,即可发生荧光共振能量转移。此时,荧光分子发出的荧光被猝灭分子吸收并 以热的形式散发,检测不到荧光信号。当有靶序列存在时,分子信标的环序列即可与靶序列特异性结合, 形成的双链体比分子信标的茎环结构更稳定,荧光分子与猝灭分子分开,此时荧光分子发出的荧光不能被 猝灭分子吸收,于是可检测到荧光。当然在高 pH、高温、DNA 损伤等条件下会使发出的荧光信号增强,这 也就决定了分子信标的多用途。由于分子信标的诸多用途以及良好的灵敏度,因此利用分子信标进行数学 问题的求解将成为可能。自 2003 年殷志祥利用分子信标构造了可满足性问题的 DNA 计算模型以来,分子 信标作为一种新的分子结构已广泛的被用到 DNA 计算中[27, 28-30]。在所有的 DNA 计算模型中,基于 DNA 自 组装技术的计算模型极富发展前景,原因在于 DNA 自组装技术在分子功能和纳米材料的控制合成上具有其 独特性:(1)分子间相互作用的恒定专一性。Watson-Crick 互补原则是 DNA 作为纳米材料建筑单元的首要条 件,它确保 DNA 分子相互配对结合形成纳米结构并且具有完善严密的分子识别功能,使得组装过程具有高 度的选择性,即定向组装的功能。(2)分子空间构象的可逆性。组装后,DNA 晶体的解耦合也很容易,只要 将组装起来的纳米团簇加热到一定温度,随着 DNA 分子的受热,碱基配对性被破坏,纳米团簇将重新分 散。(3)产物结构的可预测性。人工合成的含有 10-100 个碱基的 DNA 单链分子是构成晶体最基本的结构单 元。自 Watson 和 Crick 提出双螺旋结构模型以来,DNA 分子的生化性质、结构和形态得到了充分的研究, 使得 DNA 的纳米结构可通过软件加以预测。 随着 DNA 自组装技术的不断发展,许多研究人员将 DNA 分子组装成更为复杂的二维阵列进行运算。 - 15 http://www.sjie.org


用于构造二维阵列的初级元件主要为 DNA 单链、DNA 自组装单元、多条短寡核苷酸链。DNA 自组装单元 目前主要有:DX 元件,TX 元件和星状元件[5, 31-34],多条短寡核苷酸链是一种与众不同的基本元件[35],它可 自组装成三维立体结构,具有成本低,准确性高的优势,并且由于它不需过多考虑元件之间的角度连接, 故更易于组装成复杂的二级结构。这些自组装单元有一共同特点就是对编码的要求非常高,编码的好坏直 接影响二级结构的构成。分子信标具有操作简便,灵敏度高,重复性好等优点,这正是自组装单元所缺乏 的。因此,将分子信标作为自组装单元,构造各种自组装结构具有极高的研究意义。

3

分子信标的自组装模型研究的途径 为了给出基于分子信标的自组装模型,我们认为首先应该从一下几个方面开展研究。

3.1 自组装 DNA 计算理论 深入研究自组装 DNA 计算理论,尤其是自组装单元的特性和自组装 DNA 计算中编码问题,改进现有 编码理论的不足,充分考虑编码最优化的长度,编码与解空间的关系,编码如何适应最终解的检测等问 题,建立适合自组装 DNA 计算可操作性的编码理论。研究自组装单元的特性,如 DX 元件和星状元件,DX 元件指 DNA 链在两个交叉点处连接两排的,具有四个粘性末端的 DNA 自组装单元;星状元件由中心链, 分支链和末端链三类 DNA 链构成,不同的星状元件需要的 DNA 链数目不同,进一步提出自组装单元的改 进方案。通过对自组装 DNA 计算的自组装单元的研究,找出自组装单元的优缺点,特别是自组装单元的共 性,提出自组装单元的改进方案。同时,探索如何利用分子信标的环部、茎杆及荧光标记方法等表示和处 理信息的有效方法,通过构造不同结构的分子信标,建立适合作为自组装单元的分子信标结构,建立以分 子信标为自组装单元的自组装 DNA 计算系统。

3.2 分子信标表达和处理信息的能力 充分挖掘分子信标表达和处理信息的能力。分子信标的环部序列是���示各种组合信息的主要部位,而 其茎杆部分及各种荧光标记是对环部序列信息进行识别的重要的辅助工具。如分子信标环部的识别区长 度,茎杆部分长度及荧光的颜色强度之间关系。通过三者之间关系的研究,寻找具有稳定二级结构,表达 信息容量大,灵敏性高的分子信标结构。因此,一方面探索如何利用环部、茎杆及荧光标记方法等表示和 处理信息的有效方法,另一方面将通过构造不同结构的分子信标,建立适合作为自组装单元的分子自信标 结构,主要是设计分子信标的茎杆长度,荧光强度,找出分子信标的识别区被杂交的 DNA 链的长度与荧光 的强度关系等。

3.3 自组装 DNA 计算模型 对自组装 DNA 计算模型进行优化,深入研究 DNA 自组装机理及自组装单元的特性,设计以分子信标 为单元的自组装 DNA 计算系统,利用分子信标的茎杆长度的变化,对荧光的强度的不同等建立不同的自组 装 DNA 计算模型,建立组合优化问题的基于分子信标自组装模型,进一步讨论分子信标自组装模型的优缺 点并对设计方法进行改进,设计出具有通用性的分子信标自组装模型。通过对自组装单元分子信标的的设 计编码,给出解决不同问题的自组装模型。重点将在于设计具有一定实用性和通用性的自组装 DNA 计算模 型。 通过自组装 DNA 计算模型设计,构造适合 DNA 计算的模拟布尔电路。利用自组装单元的分子信标的 鸟嘌呤 G-G 的诱导技术,以及分子信标茎-环结构的形成和打开与传统电子计算机中使用的逻辑电路的 0、1 非常相似。因此,研究基于分子信标为自组装单元的逻辑门,并进一步开发基于 DNA 的大规模集成电 路将具有得天独厚的优势。利用定向诱导技术和分子信标的自身特点,可以建立基于的分子信标的逻辑门 的自组装 DNA 计算模型,这样实现的逻辑门具有重复可用性,而且由于分子信标本身有很高的灵敏性,其 可靠性也很高。结合目前的生物芯片技术,构造基于分子信标自组装的各种逻辑门(如与门、或门、非 门、异或门、与非门)。在此基础上,寻找适合于分子信标自组装系统的布尔电路模型,探索大规模集成 - 16 http://www.sjie.org


电路的自组装模型。

REFERENCES [1] Lipton R. J. DNA solution of hard computation problems. Science, 1995, 268(4): 542-545 [2] Ouyang Q., Kaplan P.D, Liu S, et al. DNA solution of the maximal clique problem. Science, 1997, 278(17): 446-449 [3] Liu Q, Wang L, Frutos A, et al. DNA computing on surfaces. Nature, 2000, 403: 175-179 [4] Braich R.S, Chelyapov N, Johnson C, et al. Solution of a 20-variable 3-SAT problem on a DNA computer. Science, 2002, 296(5567): 430-434 [5] He Y, Mao C, et al. Hierarchical self-assembly of DNA into symmetric supra-molecular polyhedra. Nature, 2008, 452: 198-202 [6] Winfree E, Liu F, Seeman N.C, et al. Design and self-assembly of two-dimensional DNA crystals. Nature, 1998, 394:539-544 [7] Paul W.K. Folding DNA to create nanoscale shapes and patterns. Nature, 2006, 440: 297-302 [8] 钱璐璐, 汪颖, 张钊, 贺林. DNA 纳米结构仿中国地图. 科学通报. 2006, 51(24): 2860-2863 [9] Gehani A, LaBean T H, and Reif J H . DNA-based Cryptography.5th DIMACS Workshop on DNA Based Computers, MIT, 1999 [10] Adleman L. Toward a mathematical theory of self-assembly, USC Tech Report, 2000 [11] Mao C, LaBen T H, Relf J H, et al. Logical computation using algorithmic self-assembly of DNA triple-crossover molecules. Nature, 2000, 407(6803): 493-496 [12] Benenson Y, Paz-Elizur T, Adar R, et al. Programmable and autonomous computing machine made of biomolecules. Nature, 2001, 414(6862): 430-434 [13] Braich R. S, Chelyapov N, Johnson C, Rothemund P.W.K, Adleman L. Solution of a 20-Variable 3-SAT Problem on a DNA Computer. Science, 2002, 296: 499-502 [14] Adleman L, Cheng Q, Goel A, et al. Combinatorial optimization problems in self-assemblyl, Thirty-Fourth Annual

ACM

Symposium on Theory of Computing, Montr’eal, Qu’ebec, Canada, May 2002, 19-21 [15] Rothemund W.K, Papadakis N, Winfree E. Algorithmic self-assembly of DNA Sierpinski triangles. PLOS Bioll, 2004, 2(12): e424 [16] Robert B, Paul R, Erik W, Two computational primitives for algorithmic self-assembly: Copying and counting. Nano Letters, 2005, 5(12): 2586-2592 [17] Brun Y. Arithmetic computation in the tile assembly model: Addition and multiplication. Theoretical Computer Science, 2006, 378: 17-31 [18] Brun Y. Nondeterministic polynomial time factoring in the tile assembly model. Theoretical Computer Science, 2008, 395(1): 3-23 [19] Brun Y. Solving NP-complete problems in the tile assembly model. Theoretical Computer Sciience, 2008, 395(1): 31 46 [20] Chen Z, Xu J. One-Time-Pads encryption in the tile assembly model. BICTA 2008, 2008, 23-30 [21] Zhang X, Niu Y, Gui G, et al. Breaking the NTRU Public-key Cryptosystem Using Self-Assembly of DNA Tilings. Chinese Journal of computers, 2008,12: 2129-2137 [22] Zhang X.C, Wang Y. F, Gui G. Z, et al. Arithmetic computation using self-assembly of DNA tiles: subtraction and division. Progress in Natural Science, 2009, 3: 377-388 [23] Zhang X. C, Niu Y, Cui G. Z, Xu J. Application of DNA Self-assembly on Graph Coloring Problem. Journal of Computational and Theoretical Nanoscience, 2009, 6(5): 1067-1074 [24] Zhang X. C, Niu Y, Gui G. Z, Xu J. Application of DNA Self-assembly on 0-1 Integer Programming Problem. Journal of Computional and Theoretical Nanoscience , 2010, 7(1): 165- 172 [25] Zhen C, Huang Y. F, Xu J, Zhang X. C. Algorithm of Elliptic Cure Diffe-Hellman key Exchange Based on DNA Tile Selfassembly. Journal of Computional and Theoretical Nanoscience, 2010, 7(5): 856- 861 [26] Tyagi S, Kramer F R. Molecular beacons: probes that fluoresce upon hybridization. Nat Biotech, 1996, 14(3): 303-308 [27] 殷志祥, 张凤月, 许进. 基于分子信标的 DNA 计算. 生物数学学报, 2003, 18(4) 497-501 [28] 张凤月, 殷志祥, 许进. 基于芯片上的 DNA 计算. 生物化学与生物物理进展, 2003, 30(3): 412-415 [29] Chung W. Y, Chu C.P, Wu K.R. Molecular solutions to the binary integer programming problem based on DNA computation. - 17 http://www.sjie.org


Biosystems, 2006, 83: 56-66 [30] Wang Y.X, Li J.S, Tang H X. Strategy for Molecular Beacon Binding Readout: Separating Molecular Recognition Element and Signal Reporter. Analytical Chemistry, 2009, 81(23): 9703-9708 [31] LaBean T. H, Reif J. H, Seeman N. C, et al. Construction, analysis, ligation, and self assembly of DNA triple crossover complexes. Journal of the Americal Chemical Society, 2000, 122: 1848-1860 [32] Yan H, LaBean T. H, et al. DNA-templated self-assembly of protein aeeays and highly conductive nanowires. Science, 2003, 301:18821884 [33] Park S H, Finkelstein G, Labean T H. Stepwise Self-Assembly of DNA Tile Lattices Using da DNA Bridges. journal of the American Chemical Society, 2008, 130: 40-41 [34] He Y, Mao C, et al. Self-Assembly of Hexagonal DNA Two-Dimensional Arrays. Journal of the American Chemical Society, 2005, 127: 12202-12203 [35] Goodman R. P. Reconfigurable braced three-dimensional DNA nanostructures. Nature nanotechnology, 2008, 3: 93-96

【作者简介】 殷志祥(1966-),男,汉族,工学博

张文逸(1991-),女,汉族,安徽理工大学理学院在读硕

士,教授,主要研究方向为组合优化及

士,主要研究方向为组合优化及 DNA 计算。

DNA 计算。

- 18 http://www.sjie.org


Research Expectation of Self-Assembled Model Based on Molecular Beacon