慢慢沉淀下来
01
09
Read Fasta File Read Fasta File
  我们在平时的工作中经常会遇到对生物序列进行提取或修改,不管是基因组DNA序列还是编码蛋白序列,它们都是fasta格式。一般都是将fasta序列存储为dict格式再进行操作,下面就介绍下我常用或遇到的一些处理方式: 1
2025-01-09 zhangchaofan
12
14
GATK_time_compare GATK_time_compare
  事情的起因主要是群里有老哥说INTEL的CPU(有avx512指令集)在用GATK call SNP的时候比AMD(EPYC3代 没有avx512指令集)快8-15倍,直接把我震惊到了。买INTEL,赢在起跑线.jp
2024-12-14 zhangchaofan
12
Variational_AutoEncoders Variational_AutoEncoders
import pickle import datasets # windows 本地下载并保存 # minist = load_dataset("mnist") # with open("minist_dataset.pkl", "wb"
2024-12-12 zhangchaofan
11
02
GROMACS_complex_system GROMACS_complex_system
  在一般的分子动力学模拟体系中,都是在研究相互作用,比如蛋白-蛋白,蛋白-分子和蛋白-细胞膜等。所以我们会将不同的分子组合到一起。 # raw_data wget http://www.mdtut
2024-11-02 zhangchaofan
01
GROMACS_files GROMACS_files
1.GROMACS TOP文件TOP文件(也称为拓扑文件),用于定义分子系统的拓扑结构和力场参数。TOP文件包含了分子系统的原子类型、键合类型、非键合相互作用参数等信息,是进行分子动力学模拟的基础。TOP文件由多个部分组成,每个部分定义了不
2024-11-01 zhangchaofan
01
Install_GROMACS_GPU Install_GROMACS_GPU
GROMACS的安装conda create -n GROMACS conda activate GROMACS conda install cmake -y conda install gcc=12 gxx=12 -c
2024-11-01 zhangchaofan
10
29
GPT_fine_tuning GPT_fine_tuning
1 | Downloading and unzipping the datasetimport os import json import urllib.request import zipfile import numpy as n
2024-10-29 zhangchaofan
23
GPT_model GPT_model
GPT架构总览如下图所示,我们这里简单创建了一个GPT模型,它是ChatGPT的基础架构。 import tiktoken import torch import torch.nn as nn from torch.utils.data
2024-10-23 zhangchaofan
18
alphafold2_install alphafold2_install
原始的AlphaFold2需要docker环境,目前我们服务器还没有配置docker,就先用conda环境替代吧。 1.软件下载git clone https://github.com/kalininalab&
2024-10-18 zhangchaofan
10
slurm单机部署 slurm单机部署
  最近课题组新到了一台8卡GPU服务器,为了更有效的利用计算资源,准备安装一个slurm任务提交系统。 cat /etc/os-release NAME=”CentOS Linux”VERSION
2024-10-10 zhangchaofan
1 / 3