[R] Making publication quality table (HTML)

의학 논문을 쓸 때 테이블을 만드는 게 큰 일입니다. 주요 테이블들을 완성하면 사실 논문이 반쯤 써진 것이나 마찬가지이죠. 통계 분석을 하고 거기서 나온 숫자를 일일히 테이블에 손으로 옮겨 적는 일은 참 사람 지치게 하는 일입니다. 게다가, 일껏 테이블을 만들었는데 연구 대상 집단을 일부 빼고 또는 좀 더해서 다시 통계를 돌리게 되면 그 지루한 작업을 다시 반복해야 하는 일이 벌어지죠. 잘못 옮겨 적는 일도 비일비재하구요. 그래서 통계 패키지에서 바로 테이블을 만들어 줄 수 있으면 정말 환상적인데… 문제는 통계 패키지가 내 필요에 딱 맞는 테이블을 그렇게 출력해주지 않는다는 거죠. 그런데 R을 사용하게 되면서 이 막강한 유연성을 이용하여 거의 못할 것이 없게 되었습니다.

[R] selecting rows with NA

R 은 통계 분야에서 (특히 data science 쪽) 대세라고 할 수 있지요. 몇년 전부터 R을 익혀 데이터 분석에 이용하고 있는데, 많은 장점이 있으나 가끔 전혀 직관적이지 않는 결과를 내던지는 경우가 있어 멘붕했던 적이 여러번 있었습니다. 그 직관이란 것이 지극히 인간적인 것이고 사실은 R 이라는 프로그래밍 언어를 제대로 이해 못한 때문에 생기는 일들이지만, SAS나 Stata 와 같은 통계 패키지들을 다루면서는 겪지 않았던 괴상한 오류에 시달리는 것이 썩 기분 좋지는 않은 일이지요. 그 중 대표적인 것 중 하나가 NA 관련입니다. missing data 를 R 이 다루는 방법이 무척 엄격하달까요, 이걸 이해 못하면 정말 괴이한 에러에 머리를 쥐어 뜯게 됩니다. 다음과 같은 예를

설치형 WordPress 수동 업데이트 하기

퍼옴: 설치형 WordPress 수동 업데이트 하기 Posted on 2015년 4월 3일 by JUN.K. 워드프레스는 사용하기 쉬운 블로그 프로그램이다. 설치형으로 지원되기 때문에 집에 웹서버를 갖추고 있는 사람이라면 네이버나 티스토리에 블로깅을 하는 것 보다는 자신의 서버에 직접 워드프레스를 설치해서 운용하는 편이 좋다. 워드프레스를 운용함에 있어 별다른 제한 사항은 존재하지 않는다. 단지 FTP와 같은 파일 전송 프로토콜과 웹서비스, DB 정도만를 자신의 서버에서 지원하면 되기 때문이다. 설치는 쉽다. 워드프레스 프로그램 파일을 해당 웹서버 디렉토리에 업로드만 해 놓고, 해당 웹페이지에 접속만 하면 자동으로 설치가 된다. 워드프레스의 경우 업데이트가 자주 있는 편이다. 오픈 솔루션이다 보니 많은 이들이 워드프레스가 지니는 보안 취약점을 보완하고, 기능을 향상시키는데 노력하고, 이를 다른

AMTRAC study

제가 PI 로 시행하는 다기관 임상시험입니다. 마무리 단계에 접어들어 금년 말 경에 결과를 낼 수 있을 것으로 기대하고 있습니다. Adherence measured by Medication event monitoring system in TRiple Antihypertensive Combination: single- versus two-pill regimen ISRCTN51756760 Study hypothesis Triple-component single-pill combination has advantage in adherence over equivalent 2-pill combination therapy. Ethics approval Institutional Review Board, Samsung Medical Hospital, Seoul, Republic of Korea, ref: 2015-11-109 Study design Multi-centre open-label randomised parallel trial Primary study design Interventional Secondary study design Randomised parallel trial Trial setting Hospitals Condition Hypertension Intervention Eligible patients are randomized either to the single-pill arm or the two-pill arm, for

[R] useful functions

몇가지 손수 만든 R function 들인데 조잡하지만 나름 편리하게 이용하고 있습니다. extr.num 은 데이터 cleaning 할 때 outlier 들을 보는 데 유용하고, qw 는 perl 에서 쓰는 함수 명을 그대로 따왔는데 정확히 똑같진 않지만 여러 text 들을 하나의 vector 로 묶을 때 편합니다. 안 그러면 따옴표랑 쉼표 찍느라고 무지 번거롭죠. 그 중 logistic() 같은 것은 써보면 제법 편리할 겁니다. R 에서 logistic regression 을 하려면 보시는 바와 같이 glm (…) 으로 한참 길게 써야 하는 번거로움에다가, 우선 보고 싶은 게 odds ratio 인데 그걸 안보여준다는…! 어쩌자고 이리 만들어 놨는지는 모르겠지만… logistic 은 제가 데이터 분석할 때 logistic regression 할 때마다