归档 | zhangchaofan's blog

2025

06

02

hzau_RNA-seq

pre { overflow-y: auto; max-height: 900px; } 流程总览：本流程参考华中农业大学李国亮老师的课程PPT，旨在提供一个打包好的pipeline，一行命令进行转录组数据的分析。 0. 环

2025-06-02 zhangchaofan

04

15

EvolvePro-directed evolution

pre { overflow-y: auto; max-height: 300px; } 0. 前言进化（演化）是生物种群在遗传变异、自然选择、遗传漂变等因素作用下，随时间累积而发生的适应性变化过程。进化的结果在宏观上可以体现

2025-04-15 zhangchaofan

Deep Learning Directed evolution Molecular design

01

09

Read Fasta File

我们在平时的工作中经常会遇到对生物序列进行提取或修改，不管是基因组DNA序列还是编码蛋白序列，它们都是fasta格式。一般都是将fasta序列存储为dict格式再进行操作，下面就介绍下我常用或遇到的一些处理方式： 1

2025-01-09 zhangchaofan

Bioinformatics python

2024

12

14

GATK_time_compare

事情的起因主要是群里有老哥说INTEL的CPU(有avx512指令集）在用GATK call SNP的时候比AMD(EPYC3代没有avx512指令集)快8-15倍，直接把我震惊到了。买INTEL，赢在起跑线.jp

2024-12-14 zhangchaofan

Bioinformatics

12

Variational_AutoEncoders

import pickle import datasets # windows 本地下载并保存 # minist = load_dataset("mnist") # with open("minist_dataset.pkl", "wb"

2024-12-12 zhangchaofan

Deep Learning

11

02

GROMACS_complex_system

在一般的分子动力学模拟体系中，都是在研究相互作用，比如蛋白-蛋白，蛋白-分子和蛋白-细胞膜等。所以我们会将不同的分子组合到一起。 # raw_data wget http://www.mdtut

2024-11-02 zhangchaofan

GROMACS

01

GROMACS_files

1.GROMACS TOP文件TOP文件（也称为拓扑文件），用于定义分子系统的拓扑结构和力场参数。TOP文件包含了分子系统的原子类型、键合类型、非键合相互作用参数等信息，是进行分子动力学模拟的基础。TOP文件由多个部分组成，每个部分定义了不

2024-11-01 zhangchaofan

GROMACS

01

Install_GROMACS_GPU

GROMACS的安装conda create -n GROMACS conda activate GROMACS conda install cmake -y conda install gcc=12 gxx=12 -c

2024-11-01 zhangchaofan

GROMACS

10

29

GPT_fine_tuning

1 | Downloading and unzipping the datasetimport os import json import urllib.request import zipfile import numpy as n

2024-10-29 zhangchaofan

Deep Learning

23

GPT_model

GPT架构总览如下图所示，我们这里简单创建了一个GPT模型，它是ChatGPT的基础架构。 import tiktoken import torch import torch.nn as nn from torch.utils.data

2024-10-23 zhangchaofan

Deep Learning