對於初學生物資訊的不知道 DNA 序列中的「N」是什麼是很正常的,對於有經驗的人,大多也只知道「N」是代表 A 或 T 或 G 或 C,其實這個符號是來自NC-IUB (Nomenclature Committee of International Union of Biochemistry) 所建議的編號,也稱為 NC-IUB codes 或 IUB codes。

IUB codes可分為兩類,一為 Standard Bases,一為 Mixed Bases (Wobble)。

Standard Bases:

Code Base Origin of designation
G G Guanine
A A Adenine
T T Thymine
C C Cytosine

Mixed Bases (Wobble):

Code Base Origin of designation
B C, G, or T not-A, B follows A
D A, G, or T not-C, D follows C
H A, C, or T not-G, H follows G
V A, C, or G not-T (not-U), V follows U
R A or G puRine
Y C or T pYrimidine
K G or T Keto
M A or C aMino
S G or C Strong interaction (3 H bonds)
W A or T Weak interaction(2 H bonds)
N Any Base aNy

在序列中也許只有「N」常會見到,不過其他的 IUB codes在SNP的分析中可是非常常見的,下次看到 SNP 分析的報告時,就知道這些字母代表什麼了。

logo_121_55.png  

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()