暗能星系

    • 登录
    • 搜索

    常见的生物信息格式转换成统一的parquet文件

    生物信息分析
    1
    1
    6
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • A
      anneng 最后由 编辑

      https://github.com/BlueGranite/azure-synapse-vcf-analysis/blob/main/ConvertVCFsToParquet.md
      https://techcommunity.microsoft.com/t5/healthcare-and-life-sciences/genomic-data-in-parquet-format-on-azure/ba-p/3150554
      https://techcommunity.microsoft.com/t5/healthcare-and-life-sciences/convert-synthetic-fhir-and-pacbio-vcf-data-to-parquet-and/ba-p/3577038
      微软的Azure使用的parquet格式

      主要使用的是Glow
      https://medium.com/23andme-engineering/genetic-datastore-4b213256db31

      https://github.com/natir/vcf2parquet
      一个RUST项目 感觉很多小工具使用的是RUST 可能性能比较高

      https://github.com/BigDataWUR/tomatula

      https://documentation.dnanexus.com/user/spark/example-applications/vcf-loader
      https://adam.readthedocs.io/en/latest/api/genomicDataset/

      https://www.biostars.org/p/9566003/

      https://github.com/natir/variantplaner

      1 条回复 最后回复 回复 引用 0
      • First post
        Last post
      Powered by 暗能星系