본문 바로가기

분류 전체보기206

[R] ggplot - pair plot 그려보기 (ggplot 기초, gridExtra, ggfittext) 분석에서 사용되는 plot중에 pairplot이 있습니다. 기본적인 R에서는 pairs라는 기능을 이용하면 쉽게 만들수가 있지만, ggplot에서는 손수 만들어줘야하는 불편함이 있습니다. (정정하겠습니다. ggplot에는 plotmatrix, ggpairs등이 있는 것을 확인하였습니다.) 불편하지만, 그만큼 커스텀이 가능하다는 장점도 있습니다. ggplot을 이용하여 간단한 pairplot을 그려보면 다음과 같이 그릴 수 있습니다. library(ggplot2) library(gridExtra) library(ggfittext) data("iris") # pair plot test 2020. 7. 21.
[R] ggplot2 package 기초 (qplot, ggplot) 오늘은 ggplot2의 기초에 대해서 포스팅 해보도록 하겠습니다. ggplot2은 R에서 아주 중요한 plot만드는 tool입니다. ggplot2에는 plot을 그리기 위한 방법이 ggplot(), qplot() 이렇게 두가지가 있습니다. qplot의 경우 대략적으로 그릴때 사용하고, ggplot의 경우는 세세한 컨트롤이 필요할때 사용합니다. 주로 논문을 쓰거나 할때는 ggplot을 이용합니다. 실제로 한번 차이를 비교해 봅시다. 1. ggplot, qplot의 차이점 library(ggplot2) data(iris) head(iris) > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setos.. 2020. 7. 20.
Bioinformatics 대학원생의 단점 제 개인적인 생각이 많이 들어간 단점을 이야기하는 것입니다. 실제와 다를수도 있습니다. 제 주변지인들과 제 경험을 통해 생각한 단점들을 이야기 한 것입니다. 생물정보학이라고 알려져있지만, 우리나라에는 생물정보학이라는 학과를 갖는 학교가 많이 없다. 최근 들어 많이 생기고 있는 추세이다. 아무튼 본론으로 들어와서 생물정보학 대학원생의 단점에 대해 이야기해보고자 한다. 1. 생물정보학하면 사람들은 컴퓨터를 엄청 잘하는줄 안다. 마치 생물학과 학생에게 "모든 생물의 종류를 다 알지않냐?" 말하는 것처럼 국문학과가 국어사전이라고 생각하는 사람처럼... 실제로 컴퓨터 전공을 하는 사람이 생물정보학을 하는 경우가 있긴한데, 우리나라에서는 대학원생들 중에서는 수가 적을 것이다(컴공과 사람들은 데이터 사이언스한다고 다.. 2020. 7. 20.
포스팅을 못하고 있네요 귀찮아서라기 보다는 지금 data analysis에 대해서 조금더 공부해보고자 그쪽을 파고있습니다. 블로그도 그쪽에 더 신경을 쓰고 있습죠. 그래도 시간나면 짬짬이 올리도록 하겠습니다!! 2020. 7. 17.
[R] 쉽게 배우는 R programming 기초 (6) (plot 저장, 크기 조절) 오늘 포스팅은 간단하게 진행하도록 하겠습니다. 블로그 주제를 너무 방대하게 잡아서 그런지 google애드고시도 떨어지고, 해서 다른 블로그도 파버렸습니다. 예측관련된 블로그이고 python을 위주로 포스팅을 하려고 합니다. 두집살림이라 좀 관리할거리가 많아 지네요.. ㅎㅎㅎ 광고나 많이 붙고 사람들이 많이 와주셔야하는데 아무튼 본론으로 들어가서! 블로그 유입 키워드를 보니 R에서 그림 크기 조절에 관련된 포스팅을 찾으시는 분들이 계셔서 그 부분을 포스팅해보고자 합니다. R에서 그림 크기를 조절하기 위해서는 일단 상황이 많기 때문에 나누어서 설명하도록 하겠습니다. 1. 그림내부에 그래프 크기를 조절하기 내부그림을 조절하기 위해서는 par()라는 기능을 알아야 합니다. par는 그림에서의 parameter들.. 2020. 7. 14.
[Python] Data science - numpy 기초 (1) 오늘 포스팅은 data science에서 중요한 모듈중 하나인 numpy에 대해서 배워보도록 하겠습니다. 최근 기계학습(머신러닝, machine learning)과 deep learning에 대한 관심이 높아지면서 그에 따른 프로그래밍 언어와 모듈들이 같이 중요해지게 되었습니다. 프로그래밍 언어로서 데이터를 다루고 분석하는 것은 R이 더 쉽지만, 처리 속도측면이나 최근 동향은 python으로 많이 치우쳐 지는 것을 알 수가 있습니다. python의 빠른 처리 속도를 장점으로 python에서도 R과 비슷하게 데이터 전 처리를 쉽게 하기위해서 나온 모듈이 pandas입니다. 그리고 R과 비슷하게 데이터프레임같은 형태를 다룰 수 있게 하는 모듈이 numpy입니다. 그밖에 scikit-learn,keras,ma.. 2020. 7. 13.