JZTXT
  • 首页
  • Ai
  • Java
  • Python
  • Android
  • Mysql
  • JavaScript
  • Html
  • CSS

批量修改Fasta文件中序列的名称

发布时间 2023-10-30 10:57:08作者: Bonjour_!

比如一个Fasta文件的内容如下:

seq001|aaa
ATCGGGG
seq002|bbb
AAAATTTT

删除序列名称中“|”后的内容,只保留seq001, seq002这样的名称

点击查看代码
#!/usr/bin/env python
import sys
import pysam

with pysam.FastxFile(sys.argv[1]) as fh:
    for r in fh:
        new_name = r.name.split('|')[0]
        print(">"+new_name)
        print(r.sequence)

python rename_fasta.py test.fa > rename.fa

    本栏目推荐文章
  • 代码随想录 day18 找树左下角的值 路径总和 从中序与后序遍历序列构造二叉树
  • C++实现文件内查找字符串
  • IDEA项目名称后面出现中括号,模块Modules的名子和文件夹名称不同,可以右键修改名称也可以在File->Project Structure 修改Modules的Name(快捷键ctrl+Shift+Alt+s)
  • 和利时MACS6通过dat文件实现任意时间范围与测点的历史数据提取与科研分析
  • 类模板分文件编写
  • 【LeetCode 2701. 连续递增交易】MySQL用户变量编程得到严格递增连续子序列的开始位置,结束位置,长度等统计信息
  • Linux文件IO之二 [补档-2023-07-21]
  • Linux文件IO之一 [补偿-2023-07-21]
  • python经典有序序列的list列表推导式
  • 十行python代码实现文件去重,去除重复文件的脚本
版权声明:本网站为非赢利性站点,本网站所有内容均来源于互联网相关站点自动搜索采集信息,相关链接已经注明来源。
联系我们