본문 바로가기

R basic12

[R] 데이터를 문자를 이용하여 지정하는 방법 (get, assign) 예전에 for문을 돌리다보면 어떠한 데이터나, 파일들을 각자 따로 저장하는 방법을 찾아보곤 했는데, 그 때 당시에는 방법들이 나오지 않았습니다(지금 생각해보면 쓸모가 없는 방법이라 찾을수 없었던 것 일수도?). 변수들이 많아질수록 메모리에 할당되는 부분이 많아지기 때문에 데이터들을 어떠한 특정 문자의 변수에 지정하는 일은 비효율적이라고 생각이 됩니다. 그래도 가끔 필요할 때가 있기 때문에 방법들이 포스팅해보고자 합니다. 데이터를 어떠한 특정 문자변수에 지정하는 방법은 assign을 사용하는 방법입니다. assign의 활용방법은 assign(특정문자, 데이터)를 기반으로 합니다. assign 데이터 부분에는 파일을 바로 읽을 수가 있고, 간단하게 몇 숫자, 문자 등을 넣을 수가 있습니다. assign('t.. 2022. 10. 11.
[R] RColorBrewer 이용해서 색감을 확인해보자. (feat. pheatmap) 논문이나 보고서를 쓸때 heatmap을 그릴 때가 있습니다. 그럴때마다 항상 고민인 것은 Annotation color를 지정하는것입니다. 이번 포스팅은 RColorBrewer를 이용해서 쉽게 색감들의 이름을 확인해보고자 합니다. 먼저 연습 데이터로 Annotation color를 사용하는 heatmap을 그려보겠습니다. 연습데이터는 ggplot2에 있는 diamonds 데이터를 이용하겠습니다. library(ggplot2) library(pheatmap) data(diamonds) diamonds 2021. 12. 21.
[R] ggplot 산점도 만들 때 순서 정하기. 데이터분석시에 산점도를 그릴때, 한번씩 겪는 문제가 있습니다. 데이터가 너무 모여있는 문제입니다.. 내가 표현하고 싶은 점은 미리 찍혀서 다른 데이터들에게 묻히는 경우가 허다합니다. 이럴땐 어떻게 해야할까요? 이럴 경우 다음과 같은 해결책이 있습니다. 1. alpha를 사용 geom_points를 이용하여 점의 희미도를 증가시킵니다. ggplot(data=mat)+ geom_points(aes(x=x,y=y=col=type),alpha=0.5) 2. geom_points 순서 (점찍는 순서 변경) geom_points의 순서를 다르게 표현하면 됩니다. 먼저 전체 geom_points를 넣고, 다음 subset geom_points를 추가해주면 됩니다. ggplot(data=mat)+ geom_point(.. 2021. 3. 10.
[R,GWAS] 카이검정 (chisq.test), 피셔검정(fisher.test) 쉽게 하기 GWAS분석 툴인 Plink를 사용하면 흔하게 볼 수 있는 Header는 CHISQ입니다. 카이 검정이라고 하는 이 CHISQ는 R에서도 쉽게 확인할 수가 있습니다. 카이 검정이나 피셔 검정의 목적은 내가 분석할 데이터들이 실측값 예측값을 이용하여 실측값들이 모집단(예측값)에 맞다.에 대한 오류가 있을 확률을 구하는 것입니다. 영가설 : 예측값들이 실측값과 비슷하다. 큰차이가 나지 않을 것이다. 대립가설 : 예측값들이 실측값과 다르다. 큰차이가 날 것이다. 두 집단이 동일한지 확인 (GWAS에서 plink에서 이용) 영가설 : 두 집단이 비슷할 것이다. 대립가설 : 두 집단이 다를 것이다. 두 개 이상의 변수가 독립성을 띄는지 아닌지 확인 영가설 : 두 집단이 독립적일 것이다. 대립가설 : 두 집단이 독.. 2021. 3. 9.
[R] ggplot package boxplot 그리기 ggplot2 package는 R에서 대표적인 그래프를 만드는 패키지로 여러가지 package를 만들 수가 있습니다. 이번 포스팅에는 그중에서 boxplot 그림을 그리는 것에 대한 이야기를 할까 합니다. boxplot의 기본적인 내용(상자그래프, 상자수염그래프)은 다른 사이트에 자세히 나오니 패스를 하도록 하겠습니다. boxplot을 그리는 이유는 그룹간 차이를 시각적으로 보여주기 위함입니다. 데이터는 ggplot2의 데이터베이스인 diamonds를 이용할 것 입니다. ggplot에서 boxplot을 그리는 기본적인 구조는 다음과 같습니다. ggplot(data=diamonds,aes(x=cut ,y=price))+geom_boxplot() ggplot(data=diamonds)+geom_boxplot.. 2021. 1. 13.
[R] Plot에 expression을 이용하여 특수기호 추가하기! 논문을 이용할때 가끔 log10, 10^2, 10^3 등과 같은 특수한 지수를 추가하려는 때가 있습니다. log10의 경우 log만 이용하면 대부분의 사람들이 알수있겠지만 숫자가 다를 경우는 필수로 넣어줘야 하겠죠. 그럴때 사용하는 것이 expression입니다. R에서 lim표현, 혹은 log 지수표현, 시그마와 같은 수식표현을 할때 사용하며 다음과 같이 코드를 이용하여 진행할 수가 있습니다. plot(NA,xlim=c(0,10),ylim=c(0,10),axes = F,xaxt='n',xlab='',ylab = '') text(1,0,'x value = 1',font=2,cex=2) text(1,1,expression(log[10])) text(1,2,expression(10[2])) text(1,3,.. 2020. 11. 25.