热点新闻
非模式物种KEGG富集数据库准备(二)
2023-07-12 14:29  浏览:4113  搜索引擎搜索“养老之家”
温馨提示:信息一旦丢失不一定找得到,请务必收藏信息以备急用!本站所有信息均是注册会员发布如遇到侵权请联系文章中的联系方式或客服删除!
联系我时,请说明是在养老之家看到的信息,谢谢。
展会发布 展会网站大全 报名观展合作 软文发布

一、KEGG数据下载

1、先进入官网:https://www.kegg.jp/




image.png


2、进入KO (KEGG ORTHOLOGY) Database


image.png


3、点击此处选择物种


image.png


4、此处以斑马鱼为例,所以选择dre


image.png


5、下载json文件到本地


image.png

二、json文件的处理

import json import re K_ko_dict = {} with open(json, "r")as f: K_ko_file_content = json.load(f) for children_info in K_ko_file_content.get("children"): for next_children_info in children_info.get("children"): for third_children_info in next_children_info.get("children"): name_info = third_children_info.get("name") pathway_id = re.findall(r'PATH:(.*)]', name_info) pathway_name = re.findall(r'\d+\s(.*)\s\[', name_info) if pathway_id and pathway_name: K_ko_dict[pathway_id[0]+"\t"+pathway_name[0]] = [] if third_children_info.get("children"): for fourth_children_info in third_children_info.get("children"): K_name = fourth_children_info.get("name").split(" ")[0] gene_name = fourth_children_info.get("name").split(" ")[1] gene_name=re.sub(';','',gene_name) K_ko_dict[pathway_id[0]+"\t"+pathway_name[0]].append(K_name+'\t'+gene_name) out=open(outfile,'w+') out.write("pathway_gene_id\tgene_name\tpathway_id\tpathway_name\n") key1=sorted(K_ko_dict.keys()) for key in key1: K_ko_dict[key].sort() for i in K_ko_dict[key]: out.write(i+'\t'+key+'\n') out.close()

处理后的文件:


image.png

如果需要gene id 那么需要gtf文件,通过gene name转化即可

注意:json.load(f) 若报错:AttributeError: 'str' object has no attribute 'load',那么需要修改名称,此处的f指向的名称为json,与import json重复,覆盖了此处的名称。因此会报错

发布人:655b****    IP:117.173.23.***     举报/删稿
展会推荐
  • 喜鹊
  • 2023-07-12浏览:2856
  • 人偶
  • 2023-07-12浏览:3285
让朕来说2句
评论
收藏
点赞
转发