VectorBuilder载体是如何命名的?

大多数情况下,载体中使用的元件名称(例如启动子和ORF)都是定义好的,而载体名称则由各元件名称组成,具体命名规则如下:

载体元件命名规则(如启动子、ORF和linker)
  • VectorBuilder常用元件库的元件:使用元件的常用名字,如CMV, EGFP, Neo

  • VectorBuilder基因库中检索的ORF:ORF命名由基因名称和其后面跟着的括号中的RefSeq accession组成(无RefSeq注释的则使用Gene ID)。在基因名称的前面加上小写字母的,则表示种属的缩写。具体命名规则如下:

    • 人(human)、小鼠(mouse)、大鼠(rat)分别对应缩写字母“h”、“m”、“r”
    • 其他常见种属则用两个缩写字母来表示,例如:猫(cat)、黑猩猩(chimpanzee)、狗(dog)分别对应“ct”、“ch”、“dg”。
    • 罕见种属则用学名的三个缩写字母加下划线来表示。缩写的首字母对应属名的首字母,其他两个字母对应种名的前两个字母。例如:黑腹果蝇(Drosophila melanogaster)的缩写是“dme_”。

    以NCBI RefSeq转录本库的一个人类ORF命名为例:hRHO[NM_000539.3]
    以VectorBuilder ORF库里的一个小鼠ORF命名为例:mRho[ORF032112]
    以NCBI RefSeq转录本库的一个黑腹果蝇ORF命名为例:dme_w[NM_057439.2]
    以NCBI RefSeq转录本库的一个E. coli ORF命名为例: eco_nhaA[944758]
  • 用户提供序列的元件:序列命名后才能把该序列添加到载体上,用户提供的名字将显示在大括号里。若用户添加的序列跟VectorBuilder数据库里的某一个元件完全相同,则该序列的名字会自动变成 VectorBuilder元件库里的名字。

    以用户提供的元件命名为例:{MyGene}

  • 用户编辑后的VectorBuilder ORF库元件:当一个来自VectorBuilder数据库的ORF被用户引入突变之后,会在原来的ORF名字上打上*的标记来表示引入了突变。用户可以选择继续使用这个名字,或者对它重命名。如果选择重命名,则名字将显示在大括号里,表示此名字是由客户命名的。请注意,用“添加标签”功能添加到开放阅读框的蛋白标签不视为突变。

    以VectorBuilder数据库里一个经过用户编辑的ORF为例:自动生成名字是hRHO[NM_000539.3]* ,用户重命名后变成{MyGene}

允许用户重命名的规则

为了确保名称的一致性,大多数情况下用户不能改变自动生成的元件名称,但以下情况除外:

  • 由用户提供序列的元件需要由用户来命名,并打上大括号表示此元件是由用户命名的。
  • 当一个从VectorBuilder基因库检索出来的ORF被引入突变后, 该ORF名字上会被自动打上*的标记。用户可以用这个名字命名,也可以对名字进行修改。如果重命名,名字将显示在大括号里,表示此名字是由用户所命名的。
载体命名规则
  • 所有载体名称都以字母“p”开头;
  • “p”字母后面是载体骨架的缩写,以下是常用骨架的例子:
    RP: Regular plasmid,常规质粒载体
    LV: Lentivirus,慢病毒载体
    MMLV: MMLV retrovirus,MMLV逆转录病毒载体
    AV: Adenovirus,腺病毒载体
    AAV: Adeno-associated virus,腺相关病毒载体
    PB: PiggyBac transposon,PiggyBac转座子
    Tol2: Tol2 transposon,Tol2转座子
    ET, BAD or CS:各种细菌蛋白表达载体
    SC: Saccharomyces cerevisiae,酿酒酵母蛋白表达载体
    BV: Baculovirus,昆虫杆状病毒蛋白表达载体
  • 在载体骨架缩写后的中括号里添加其生物学应用的缩写,以下是常用生物学应用的例子: 
    Exp:基因过表达载体
    shRNA:干扰载体
    gRNA:CRISPR系统所需的gRNA表达载体
    En:增强子活性测试载体

载体命名示例

载体名称:pLV[Exp]-Hygro-CMV>FLAG/hRHO[NM_000539.3]*/10xHis:IRES:3xNLS/EGFP/HA

说明:

LV:载体骨架是慢病毒载体

Exp:生物学应用是基因过表达

Hygro:抗性筛选标记是潮霉素B

CMV:驱动目的基因表达的启动子是CMV

FLAG/hRHO[NM_000539.3]*/10xHis:IRES:3xNLS/EGFP/HA:目的基因是含有多个ORF的多顺反子。第一个ORF是hRHO[NM_000539.3],序列被用户编辑过(用*表示),其N端有FLAG蛋白标签,C端有10xHis标签;后面接着的是IRES和第二个ORF,第二个ORF是 EGFP,其N端有3xNLS标签,C端有HA标签。