这两天看了些php的应用,发现php网络应用真是方便…根据前几章关于string的知识写个生物小应用复习下. 以前总是利用网上的dna反向互补工具,但是有时候不能连接,后来用了sms,非常方便,支持下载到本地使用.自己用用php也不错, 练习练习代码.
主要实现以下功能:
1.反向互补….
2.去除多余字段(数字,空格,主要ncbi上下来的序列多含有数字和空格)
3.提示含有非碱基字符,有些时候SNP的出现需要保留
未实现功能:
本来想在原始序列中突出显示非碱基字母,比如红色显示,结果没有成功….substr_replace()无法应用在上面…暂时看到的知识想不出其他解决方案了,先等等吧,下次会了再改,反正问题不大.
演示: DNA rev-complement tool
代码:(有点乱,有些地方觉得能简洁,但似乎没有找到可行的简洁之法,主要是去除序列中数字那段,后来发现ereg_replace()能实现,方便多了)
Read more…
Popularity: unranked
上周文献报告听到一个数据库rice atlas database,感觉不错,文献发在nature genetics,主要是通过大量生物芯片得到数据.会后查了一下,看看一些基因表达有没有收录在里面作为参考.
进入首页后,我就直奔search database,不过进去后发现一头雾水,不知道该输入什么,随便输了2个关键词和序列,都找不到.后来经过一个师弟提醒,尝试使用国际基因名,搜到了….后来发现还支持Oligo ID和gramene的基因名.
选上Show Graph就能比较直观的看到表达强弱对比了,对我来说足够了….虽然我看不懂底下表格那些值…应该是生物芯片里的强弱(PS,网站有bug,点击export无法正确另存为csv或excel).


虽然叫做Rice Atlas Database,不过其实并没有收入水稻所有时期组织的表达情况.主要就是苗的根和叶及其相关组织,根尖,表皮等等,没有花和茎.作为参考就行,毕竟水稻中做的芯片数据不如拟南芥那么全.
参考文献:
A transcriptome atlas of rice cell types uncovers cellular, functional and developmental…
Popularity: 7%
上次介绍了一款启动子预测工具,今天偶尔看到一个网站收录了好几个这方面的在线工具,包括原核和真核的启动子及终止子分析.也包括上次介绍的NNPP
除了列出了工具的网址,还有简单介绍和相关的参考文献,方便对于工具的可信度和对比性进行进一步分析,不过仍然没有专门针对植物方面的.
PROMOTERS & TERMINATORS
Neural Network Promoter Prediction
(Berkeley Drosophila Genome Project, U.S.A.)(Reference: M.G. Reese 2001. Comput. Chem. 26: 51-6).
Promoter 2.0 Prediction Server
(S. Knudsen,Center for Biological Sequence Analysis, Technical University of Denmark)
- predicts transcription start sites of vertebrate Pol II promoters in DNA sequences
Popularity: unranked
Recent Comments