官方网址:http://biom-format.org/index.html
格式说明:http://biom-format.org/documentation/biom_format.html
biom 是The Biological Observation Matrix (BIOM) 的缩写。
概述
这个格式是微生物生态研究中衍生出的文件格式,扩展名建议是*.biom,由 www.biom-format.org 开发。
开发此文件格式的目的由以下三点:
- 存储和操作大规模的生物多样性数据
- 存储核心的元数据(metadata,如样品,分组等重要的相关信息,这些信息在分析时是必需的。)
- 统一专有文件格式,促进文件在不同分析工具间的流通。(QIIME,MG-RAST和VAMPS等分析工具都可以支持该文件格式)
版本
目前,biom格式已经有了3个版本。
版本1.0基于JSON格式开发。
版本2.0和2.1基于HDF格式开发。
HDF格式是专门为存储大规模、多对象的科学研究数据开发的。“Solutions to Data Challenges”。
开发工具
biom格式是纯文本文件,可以用文本编辑器打开(我指的不是Windows的记事本,而是专业一点的开发工具。如Notepad++)。
Python版工具
pip install numpy pip install biom-format pip install h5py
R版工具
install.packages("biom")