本期为您解解答近期生物序列检索的常见问题:
Q:Biosequences BLAST支持的哪些生物序列输入格式?
A:Biosequences BLAST支持的生物序列输入格式包括:Plain、FASTA、EMBL、GCG和Genbank格式。
无需手动编辑序列格式,即可直接复制、粘贴上述一系列格式的序列至BLAST检索的序列输入区,各种格式的序列会被自动标准化处理,用于检索。
Q:Biosequences 输入的查询序列和结果序列都是按5’到3’方向吗?
A:是。Biosequences 输入的查询序列需按5’至3’方向,且序列结果也是按5’至3’方向呈现。如序列5’-GUGUGCACUUCGCUUCACA-3’,以GUGUGCACUUCGCUUCACA 输入。
Q:Biosequences支持检索反向互补序列吗?
A:Biosequences检索结果中会包括匹配的反向互补序列结果。需点击检索结果的Subject标签呈现。如序列:GUGUGCACUUCGCUUCACA
Q:如何检索化学修饰序列?
A:修饰的核苷酸用未修饰的核苷酸代表字母进行检索即可,如:Af(2′-fluoro A)用A或a替代即可。
如序列5′-guguGfcAfCfUfucgcuucaca-3′用GUGUGCACUUCGCUUCACA 输入检索框进行检索。点击检索结果的CAS RN在物质详情页面Sequence Details 中的Sequence Modifications下查看序列修饰详细信息。
Q:检索siRNA序列,如何获取短序列,排除长序列(如基因组序列等)?
A:利用Sequence Length筛选目标长度的短序列。
如下图获得的17857个序列结果,长度范围分布在18nt-236303nt,除了短序列还包含基因组序列等。可利用Sequence Length设置目标序列长度区间,来获取目标长度的序列。
如Sequence Length设置为18-30, 获取到166个短目标序列。
Q:检索siRNA序列,如何获取短序列,排除长序列(如基因组序列等)?
A:利用Sequence Length筛选目标长度的短序列。
如下图获得的17857个序列结果,长度范围分布在18nt-236303nt,除了短序列还包含基因组序列等。可利用Sequence Length设置目标序列长度区间,来获取目标长度的序列。
如Sequence Length设置为18-30, 获取到166个短目标序列。
Q:如何根据酶催化反应的底物或产物, 快速获取作为反应催化剂的生物酶序列?
A:可利用反应检索及科学家标引的反应信息快捷获取。
1. 在结构编辑器中,绘制(上传结构文件、或利用CAS RN、SMILES或InChl编码输入结构)酶催化反应的产物或底物结构,并设定该结构的反应角色,执行反应检索,获取相关反应。以下图产物结构为例:
(如已知底物或产物名称、CAS RN等信息,亦可用文本检索,获取相关反应;之后在反应结果集中限定substance role为product或reactant。)
2. 在反应结果集筛选项Reaction Notes下选择Biotransformation和Enzyme选项,来获取生物转化或酶参与的反应。
或者,亦可在反应结果集筛选项Catalyst下选择目标酶类相关选项,来获取特定酶类作为催化剂的反应。(本示例执行步骤3-7之前未勾选Catalyst下选项)。
点击View All, 查看更多作为反应催化剂的酶类。
3. 获取反应结果集关联的文献。
4. 获取文献结果集关联的物质。
5. 在物质结果筛选项Substance class下,选择Protein/Peptide Sequence或Nucleic Acid Sequence,获取特定产物的生物转化或酶催化反应相关的生物序列结果。
6. 亦可进一步在Reaction Role筛选项下勾选Catalyst,查看由科学家明确标引作为反应催化剂的序列。
还可以在Reference Role下,查看由科学家明确标引了文献中研究角色为Catalyst Use的序列。
7. 点击序列的CAS RN,在物质详情中查看详细的序列结果。
转自:“ACS美国化学会”微信公众号
如有侵权,请联系本站删除!