過去十年來,隨著DNA化學合成的成本不斷降低,DNA片段的組裝方式日益精進,合成生物學邁入了合成整個染色體和基因組的新階段。迄今為止,研究人員可以用最多100萬堿基對構建出合成DNA,比如之前釀酒酵母(Saccharomyces cerevisiae )的一組染色體以及絲狀支原體(Mycoplasma mycoides)的各種合成基因組。如今,Fredens等人在《自然》上發表論文稱,團隊合成了一個有400萬堿基對的大腸桿菌(Escherichia coli)基因組。該研究是合成基因組學這一新興領域內具有里程碑意義的事件,也是合成基因組技術在這個“勞苦功高”的細菌上的首次應用。
合成基因組學賦予了我們認識生命規則的全新方式,同時也在推動合成生物學朝著基因組編寫設計的方向前進。這一領域的先驅是來自美國克雷格·文特爾研究所(J。 Craig Venter Institute)的研究人員,為了確定獨立生存細胞所需的最少基因數量,他們選擇通過這種方法先讓計算機對基因組片段進行重新設計,再化學合成這些片段,最后完成組裝。憑借這一技術,這些研究人員成功地將絲狀支原體的基因組大小縮減了約50%。如果換用基因組編輯工具則會大大增加工作量,以往的大腸桿菌實驗已經證實了這一點——基因刪除方法最多只能去除15%的基因組。
Fredens和同事將縮小后的大腸桿菌基因組作為一個合成基因組模板,但他們腦中還有另一種最小化的辦法——縮減密碼子。遺傳密碼本身具有冗余性:一共有64個密碼子(堿基三聯體)編碼20種氨基酸,以及代表一段蛋白編碼序列啟動和終止的“起始”點和“終止”點。這種冗余意味著有6個編碼絲氨酸的密碼子和3個可能的終止密碼子。大腸桿菌的蛋白編碼序列有64個可用密碼子,Fredens等人通過設計、合成和組裝,只用61個密碼子就構建出了大腸桿菌基因組,他們的做法是將兩個絲氨酸密碼子和一個終止密碼子用同義密碼子替代——同義密碼子是指“拼寫”不同但發出指令相同的密碼子。之前使用基因組編輯工具的研究成功用63個密碼子合成了一個大腸桿菌,但這只需要將序列為TAG的終止密碼子(基因組中有321個)替換成另一個終止密碼子。而這次縮減至61個密碼子則需要改變18214個密碼子,為此必須采用基因組合成的方法。
Fredens和同事通過之前為研究大腸桿菌密碼子縮減極限而開發的大規模DNA組裝和基因組整合方法,合成了這個大腸桿菌基因組。他們先在計算機上對DNA進行設計,再在釀酒酵母載體中化學合成并組裝100千堿基片段,這些載體隨即被大腸桿菌攝取,并直接整合到基因組中對應的天然區域(見圖1)。將這個過程迭代5次,就能讓500千堿基的DNA節段完全被合成DNA取代。研究團隊用這種方法生成了8個大腸桿菌菌株,每個菌株都攜帶有覆蓋不同基因組區域的合成DNA節段。隨后,研究人員再通過“接合”的方法將這些節段拼湊起來,合成完整的基因組。
重編碼基因組的設計與構建。a.Fredens等人對大腸桿菌基因組的3個堿基三聯體(密碼子)進行了重編寫,將編碼絲氨酸的TCG和TCA和代表蛋白編碼序列終止的終止密碼子TAG替換成具有相同功能的密碼子AGC、AGT和TAA。
b、在基因組的某些位點上,開放讀碼框(ORF,即蛋白編碼區域)會發生重疊,對某個ORF密碼子做出改變可能會導致重疊區域出現非預期的變化。Fredens等人通過“重構”這些ORF使其分離,如圖中的ORF1和ORF2(左邊兩個ORF的“讀取”方向相同,右邊兩個讀取方向相反)。
c、經過重新設計的DNA可以在釀酒酵母中合成組裝100千堿基片段;這些片段再組合成節段,整合到大腸桿菌的基因組中。將這些節段結合就能獲得完整的功能合成基因組。
這一大規模的構建工程取得了驚人的成功,脫靶突變率很低,但也存在一些挑戰。大腸桿菌基因組中的許多基因會與其它基因有部分重疊,研究人員發現有91個存在重疊區域含有需要改變的密碼子的情況。這很復雜,因為一個蛋白編碼序列中的同義替換可能會使重疊序列編碼的氨基酸發生改變。為了解決這個問題,研究團隊對基因組中的79個位點進行了“重構”,通過復制這段序列,他們將重疊的編碼序列分開,變成單個重編碼序列(見圖1)。雖然這一方法基本上很成功, 但有些地方需要非常小心的錯誤排查,因為重構可能改變了基因調控。
最后得到的菌株被證實可以存活,并能在各種典型的實驗室環境下生長,但是比天然菌株長得稍慢一些。新的菌株不再需要終止密碼子TAG以及絲氨酸密碼子TCG和TCA,因此,識別這些密碼子的細胞機器也可以被去除或重新用于招募“非標準”氨基酸——大部分活細胞所需的20種常見氨基酸之外的氨基酸。研究人員用只有63個密碼子的大腸桿菌證實了招募非標準氨基酸的用處。對于生物技術項目來說,非標準氨基酸可以被寫入理想的序列位置,提供可以參與天然蛋白無法參與的化學反應的殘基。不僅如此,由于支持合成大腸桿菌細胞運作的遺傳密碼稍不同于自然世界中的其它細胞,輸入和輸出合成大腸桿菌的可讀取DNA編碼信息將變得有限,并因此帶來了生物安全方面的益處。以上種種應用都會在新的61個密碼子的大腸桿菌中得到進一步拓展,新菌株有潛力編碼不止一個非標準氨基酸的使用,并建立一個更嚴苛的基因防火墻(因為64個密碼子中的3個密碼子已不再被識別)。
合成400萬堿基對的基因組,以及將遺傳密碼縮減至61個密碼子創造了合成基因組學的最新紀錄,但這個紀錄可能不會保持得太久。國際Sc2.0聯盟正在設法合成有1200萬堿基對的釀酒酵母基因組的全部16個染色體,這也是首個真核生物(包括植物、動物和真菌)的合成基因組。同時,聯盟還在嘗試合成只有57個密碼子的大腸桿菌基因組以及比天然鼠傷寒沙門氏菌(Salmonella Typhimurium)少兩個密碼子的合成基因組。如果成功,將來擁有合成基因組的細菌有望作為基于細胞的技術,應用于人體腸道。
從純技術的角度來說,這些不同的研究最值得關注的點在于它們構建合成基因組的流程極為相似,都是將合成DNA的千堿基節段(通過同源重組)在酵母細胞中組裝成 50-100千堿基片段,再用這些片段(通過選擇重組的方法)替代目標生物體中的天然序列。方法的標準化有利于實現部分步驟的自動化,讓更多團隊加入研究行列。基因組最小化和密碼子縮減只是這一技術的初步應用,今后,這種技術或能生成功能重組基因組,或者能指示細胞執行特定任務的“定制”基因組。