研究一个蛋白质的第一步是拿到它准确的基因序列,有了基因序列,我们就可以构建合适的质粒,表达出所需要的蛋白。
质粒构建,英文名为plasmidconstruction。选定的目的外源基因(DNA)先要经过PCR扩增。随后用限制性内切酶分别切割载体和外源DNA片段,再使用DNA连接酶将切割后的载体与DNA片段连接,转入宿主细胞。最后经过筛选鉴定出正确的重组克隆质粒,实现目的基因在宿主细胞内的正确表达。

图一:质粒构建流程示意图
1、如何选择载体?
载体通常分为克隆载体(CloningVector)与表达载体(ExpressionVectors)两种。
克隆载体大多是高拷贝载体,能够将外源基因与克隆载体的质粒连接,导入原核细菌内,进行大量复制克隆。主要用途是保存目的基因片段。
在选择克隆载体时应注意:
①具有自主复制能力,拷贝数高;
②携带易于筛选的选择标记;
③含有多种限制酶的单一识别序列,以供外源基因插入;
④载体应尽可能小(<15kb),便于导入细胞和进行繁殖;
⑤使用安全。克隆载体应只存在于有限范围的宿主内,在宿主体内不进行重组,不发生转移,不产生有害性状,并且不能离开工程宿主自由扩散。
表达载体是为了使插入的外源DNA序列转录、翻译成多肽链而进行特殊设计的克隆载体。它含有特定的表达系统元件,即启动子--核糖体结合位点--克隆位点--转录终止信号。
根据表达的类型,表达载体可分四类:
非融合型表达载体,如PKK223-3;
分泌型表达载体,如PINⅢ-ompA1;
融合蛋白型表达载体,如PGEX;
包涵体型表达载体,如pBV220。

图二:基因片段选择
2、引物设计中的规则
运用PCR扩增目的基因的过程中,引物设计十分关键,以下是需要注意的:
①引物长度最好在18-30bp左右,常用的长度是20-22bp;
②引物Tm值最好在60℃左右,两条引物间Tm值要保持接近,相差最好不要超过5°C;
③GC的含量标准通常为40%-60%或45-55%;
④引物自身不应含有连续超过4个的互补的碱基,避免形成发卡结构或形成引物二聚体;
⑤引物的3'端要避免出现连续重复的碱基,如GGG或CCC,这会导致错配的发生,最后一个碱基最好是G或C;
⑥在引物的5′端添加酶切位点时(在不影响扩增的特异性的前提下),根据酶切位点序列,需要添加不同种类和数量的保护碱基,通常多加3个碱基即可满足保护酶切位点的需求;
⑦上下游引物最好加入不同的酶切位点,相同的酶切位点可能导致目的基因片段出现倒置连接现象,影响基因序列的正常表达。
3、PCR扩增中常见的问题
扩增基因的过程并不困难,但未必能保证百分之百的成功率。
如结果出现引物二聚体、非特异性条带(大小不对)的现象,可以通过降低模板和引物的浓度、降低镁离子浓度、适当减少酶量,提高退火温度,来提高扩增特异性。
若出现凝胶条带弥散状态,多为模板不纯、反应体系中各成分比例不合适、退火温度设置偏低、循环次数过多等原因。
长片段基因的扩增容易增加点突变和错配率,选用高扩增能力、高保真、可靠性强的聚合酶也很关键。
4、其他问题
在操作酶切连接的步骤时也要定性定量,保证酶活性充足,例如:双酶切尽可能选择同种缓冲buffer,一般用量40U单位以上(用量不超过总体积1/10),保证酶切过程充分;可根据目标片段量(ng)=(载体量(ng)×目标片段长度(kb))/(载体DNA片段长度(kb))×目标片段和载体的摩尔比(1:3-1:8)计算出目标片段和载体的加入量,提高连接效率。
构建好的载体放入感受态细胞中转化(TOP10、DH5α、BL21等,感受态细胞在使用时尽可能保证新鲜,避免反复冻融,冰上孵育和热激时间应严格控制),经抗性、菌落PCR、酶切、测序等多道程序验证,确定是否转化成功,最终获得正确的重组克隆基因片段。
5、如何选择正确的菌株和载体(详见文末列表)
公司简介
「青云瑞晶」是一家专业的CRO(研发服务提供商)。公司拥有高标准的实验室、先进的设备,和丰富经验的博士硕士研究人员,在结构生物学,药物固态研究和新材料结构表征,三个业务板块,为客户提供最先进的解决方案。
公司自主开发了国际领先的MicroED结构解析平台,结合冷冻电镜单颗粒(CryoEM-SPA)及同步辐射单晶X射线衍射(XRD),为客户解决难点问题。
Ecolistrainlist
No.
strain
annotation
Resistant
1
BL21(DE3)
最常用的
No
2
Rosetta(DE3)
稀有密码子AUA,AGG,AGA,CUA,CCC,GGA
Cl
3
Rosetta2(DE3)
稀有密码子AUA,AGG,AGA,CUA,CCC,GGA和CGG
Cl
3
Origami2(DE3)
二硫键及稀有密码子
StrR,Tet
4
C41(DE3)orC43(DE3)
疏水性蛋白
No
5
Arctic(DE3)
TPN30TPN60分子伴侣
Tet,Cam
6
Tuner(DE3)
通过IPTG精确控制表达量,0.1mMIPTG
No
7
BL21(DE3)pLysS
降低毒性蛋白的本底表达
Cl
8
Rosetta(DE3)pLysS
降低毒性蛋白的本底表达,稀有密码子AUA,AGG,AGA,CUA,CCC,和GGA。
Cl
9
BL21(DE3)del-slyXD
BL21(DE3)knockoutslyXD
No
10
B834(DE3)
Met缺陷菌株
No
11
T7pLysY
具有抗T1噬菌体感染能力
Cl
12
BL21star(DE3)
13
origamiB(DE3)
二硫键
KanR,TetR
14
Origami2(DE3)pLysS
Origami2(DE3)的基础上加pLysS抑制本地表达。
Cl,StrR,Tet
15
Dh5α
克隆菌株
No
16
Dh5α-T1
具有抗T1噬菌体感染能力
No
17
Dh10bac
Bacmid制备
Tet,gentamicin
18
BL21-Gold(DE3)
可以同时用作蛋白表达菌株和质粒克隆菌株
No
Plasmidlist
名称
长度
抗性
特殊性能
PAO815
7709bp
Amp
酵母表达
pAxCAwt
44741bp
Amp
腺病毒表达
pAxcw
42410bp
Amp
腺病毒表达
pAAV-MCS
4.7kbp
Amp
哺乳动物细胞表达
pBacPAK8
5.5kbp
Amp
杆状病毒表达
PBI121
13.0kbp
Kan
植物细胞表达
pBV220
3665bp
Amp
原核表达
pCAMBIA1300
植物细胞表达
pCAMBIA1301
11837bp
Kan
植物细胞表达
pCAT3-Basic
4047bp
Amp
pcDNA3
5446bp
Amp
哺乳动物细胞表达
(+)
5428bp
Amp
哺乳动物细胞表达
/mys-HisA
5494bp
Amp
哺乳动物细胞表达
pCl-neo
5472bp
Amp
哺乳动物细胞表达
pCMV-MCS
4.5kbp
Amp
哺乳动物细胞表达
pET-3a
4640bp
Amp
大肠杆菌表达
pET-11a
5677bp
Amp
大肠杆菌表达
pET-15b(+)
5708bp
Amp
大肠杆菌表达
pET-20b(+)
3716bp
Amp
大肠杆菌表达
pET-22b(+)
5493bp
Amp
大肠杆菌表达
pET-23a(+)
3666bp
Amp
大肠杆菌表达
pET-23b(+)
3665bp
Amp
大肠杆菌表达
pET-23c(+)
3664bp
Amp
大肠杆菌表达
pET-23d(+)
3663bp
Amp
大肠杆菌表达
pET-28a(+)
5369bp
Kan
大肠杆菌表达
pET-28b(+)
5368bp
Kan
大肠杆菌表达
pET-28c(+)
5367bp
Kan
大肠杆菌表达
pET-30a(+)
5422bp
Kan
大肠杆菌表达
pET-30b(+)
5421bp
Kan
大肠杆菌表达
pET-30c(+)
5423bp
Kan
大肠杆菌表达
pET-31b(+)
5742bp
Amp
大肠杆菌表达
pET-32a(+)
5900bp
Amp
大肠杆菌表达
pET-32b(+)
5899bp
Amp
大肠杆菌表达
pET-32c(+)
5901bp
Amp
大肠杆菌表达
pET-39b
6106bp
Kan
大肠杆菌表达
pET-42a
5930bp
Kan
大肠杆菌表达
pGAPZ-aA
3147bp
Zeo
酵母表达
pGBKT7
7.3kbp
Kan
酵母表达
pGEM3Zb
原核表达
pGEM3Zf(+)
原核表达
pGEM7Zf(+)
原核表达
pGEX-2T
4969bp
Amp
原核表达
pGEX-4T-1
4969bp
Amp
原核表达
pGFP-N2
4732bp
Kan
哺乳动物细胞荧光蛋白表达
pEGFP-C1
4731bp
Kan
哺乳动物细胞荧光蛋白表达
pEGFP-C3
4727bp
Kan
哺乳动物细胞荧光蛋白表达
pEGFP-N1
4733bp
Kan
哺乳动物细胞荧光蛋白表达
pLEGFP-N1
6892bp
Amp
哺乳动物细胞荧光蛋白表达
pGL3-Basic
4818bp
Amp
pGL36
pLNCX
6620bp
Amp
反转录病毒表达
pLNHX
5.6kbp
Amp
反转录病毒表达
pLXSN
5.9kbp
Amp
反转录病毒表达
pLXIN
6.1kbp
Amp
反转录病毒表达
pMAL-p2x
6721bp
Amp
原核融合蛋白表达
pMAL-c2x
6721bp
Amp
原核融合蛋白表达
9004bp
Amp/Kan
酵母表达
pPIC9
8024bp
Amp
酵母表达
pPIC9K
9276bp
Amp
酵母表达
pPICZaA
3593bp
Zeo
酵母表达
pQBIPGK
5387bp
Amp
哺乳动物细胞荧光蛋白表达
pQE-30
3461bp
Amp
原核表达
pQE-9
3439bp
Amp
原核表达
pRevTRE
6487bp
Amp
反转录病毒表达
pSE420L
4617bp
Amp
pTacI
Amp
原核表达
pTacI(BamHI)
Amp
原核表达
pTAL-Luc
4956bp
Amp
哺乳动物细胞表达
pTWIN1
7375bp
Amp
pTXB1
6706bp
Amp
pVAX1
2999bp
Kan