Luna's Blog

一个人,只要他够胖,哪怕他认真地在看书,都像在点菜.

基于R语言的数据分析中的描述性统计

Linux, R, Statistics

描述性统计包含多种基本描述统计量,让用户对于数据结构可以有一个初步的认识。 在此所提供之统计量包含: 基本信息:样本数、总和 集中趋势:均值、中位数、众数 离散趋势:方差(标准差)、变异系数、全距(最小值、最大值)、内四分位距(25%分位数、75%分位数) 分布描述:峰度系数、偏度系数 1.2 详细介绍 1.2.1 样本数和总和 R语言涉及的方法:length(x) 1...

重新安装老版R下已安装的R包

Linux, R

前言 Linux上的R是3.6.2版本的,我另外使用conda也搭建了一个R_env,以防止和以前安装的混了,最近自动更新了R_env的R到4.0.3版本,导致原来的R_env下的R包出现问题,提示重装: Package ‘XXX’ was installed before R 4.0.1: please re-install it 解决方案 R都更新了,那就把以前安装的尽量重装: # ...

Linux安装R包时窗口抓取失败

Perl, R

前言 在Linux上的R中install.packages时,经常会出现窗口抓取失败的情况,如下: > install.packages("ggplot2") Installing package into ‘/home/luna/Desktop/Software/RSoft/lib64/R/library’ (as ‘lib’ is unspecified) --- Please s...

Perl正则匹配和正则表达式

Perl, Regex

正则表达式 前言 正则表达式(Regular Expression,常简写为Regex、Regexp或RE),又称正则表示式、正则表示法、规则表达式、常规表示法,是计算机科学的一个概念,最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式是一种模式,它提供灵活而简洁的方式来描述、匹配一系列匹配某个句法规则的文本字符串。许多程序设计语言都支持利用正则表达式进行字符串操作,在...

Ubuntu安装和使用Speedtest-cl

Ubuntu, Speedtest-cl

Speedtest-cli Speedtest-cli是用Python写的脚本语言,主要用来测试互联网网速,可以测试网速到km单位,也可以正对每个服务器的网速进行测试,还可以测试某个url链接的网速。 Ubuntu安装 推荐使用Python 3.7 的pip3安装 $ pip install --user speedtest-cli Collecting speedtest-cli ...

Unix命令行通配符

Unix, Bash

在Unix下一次性操作多个文件时,命令行提供通配符(wildcards),短文本模式(通常只有一个字符),可以与文件路径中的另一个字符(或多个字符)匹配,这种快捷方式使得可用简洁的模式来代表一组文件或者指定一整套相关的文件路径名。 使用通配符模式,您可以使用单个命令轻松地列出、查看、复制、移动或删除大量文件。通配符比正则表达式早出现,可以看作是原始的正则表达式,功能没有正则强大灵活,但胜在...

Perl模块 Getopt::Long 解析

Perl

Getopt::Long模块 Getopt::Long模块是用于解析命令行参数的Perl模块: ## option variables with default value my $verbose = ""; my $nda = ""; my $more = 0; my $value = ""; my @libs = (); my %defines = (); ## parse optio...

Perl中的文件名通配符和文件查找

Perl

在Unix下进行文件夹的内容展示或者文件查找的时候,会大量的使用*来对文件名进行通配扩展,那么在使用Perl进行搭建流程的时候同样支持文件名通配。在Shell下,通配使用的是glob,一种特殊的模式匹配,也是最常见的通配符扩展,可以理解成精简版的正则表达式;Perl中的glob通配方式和Shell的通配方式是完全一致,因为Perl的glob函数直接调用系统的$SHELL来进行通配的。 gl...

测序数据的深度、覆盖度等计算

sequencing depth、coverage

Coverage Depth 覆盖深度 mapping depth 基因组被测序片段(短读 short reads)“覆盖”的强度有多大? 每一碱基的覆盖率是基因组碱基被测序的平均次数。 基因组的覆盖深度是通过与基因组匹配的所有短读的碱基数目除以该基因组的长度来计算的。 它通常表示为1X、2X、3X、…(1、2或3倍覆盖)。 此处通常被称为测序深度(sequencing depth...

物种基因组大小查询

genome size database

前言 基因组是一个生物体所包含的DNA里的全部遗传信息,精确来讲,一个生物体的基因组是指一套染色体中的完整的DNA序列。比如,人类个体体细胞中的二倍体由两套染色体组成,其中一套染色体的DNA序列就是一个基因组。而基因组大小是一个物种单倍体基因组中的全部DNA碱基对的总和。 分子生物学研究的基础是物种的基因组信息,物种基因组大小与该物种生物形态的复杂性呈现一定的相关性。那么该如何查询物种的基...