October 2010
6 posts
2 tags
R 패키지 찾기
구글 검색엔지 이외에 R용 패키지를 검색해 볼만한 사이트
http://cran.r-project.org/web/views/
http://crantastic.org/
http://www.rseek.org/
Tip: sos라는 패키지로 R 관련 검색을 할 수 있다.
1 tag
지루한 글쓰기 요령
논문쓰기에서 지켜야할 일들을 반대로 꼬집어 말하고 있다. 저자도 말미에 언급하는 중요한 부분은 글을 쓸 때 시적 표현이나 유머나 부드럽게 읽히게 하는 흐름이 더 중요하고 이런 것들을 책에 도입한 예들을 들면서 이렇게 바뀌어 가는 것도 좋지 않냐는 말을 한다.
극소수의 사람들을 위한 글을 쓸것인가 아니면 많은 사람들이 읽고 이해의 폭을 넓히는 글을 쓸것인가 하는 딜레머에 빠지게 되는데 결국 오래 남은 글은 후자가 아닐까 한다. 과학문헌의 경우에도 조금은 그런 여유를 집어 넣는것도 좋을듯 하다. 틀에 박힌 형식에서 벗어나기 힘든 과학문헌에 투고하는 것보다 조금은 모험적인 책을 써보는것도 흥미진진한 작업일듯 싶다.
How to write consistently boring scientific...
3 tags
모든 데이터에 관심을 가져라
지천에 널려있는 데이터만 잘 활용해도 재미있는 것들을 많이 발견할 수 있고 그것을 비지니스로 연결 시킬 수 있을텐데 왜 그런 노력들을 못하는 것일까? 이건 역시 마인드의 문제이고 IT수준의 문제인지도 모를 일이다. 직관에만 의존하거나 시대의 흐름에만 급급하니 신선하고 혁신적인 것들을 만들어 내지 못하는듯도 싶다. Data Science에 대해서 회사들이 좀 더 관심을 갖고 투자를 하면 좋겠는데 말이지.
“I think businesses are sitting on all kinds of interesting data,” Yagan says. “The thing to consider is, How does it drive your business? In our case,...
1 tag
글쓰기 작업
When you are planning your paper, write down each idea/concept that you want to talk about, checking that they are in a logical order and then listing what you want to say about each, using bullet points. This will help you create paragraphs that have a logical and coherent structure.
3 tags
The Art of R #1
요즘 다시 R을 많이 써야하는 상황이라 바닥부터 다시 훑고 있다. R을 사용한 예제들을 종종 올릴 예정이다. 이름하여 R의 예술이라고나 할까. 오늘은 참고서적과 간단하게 R로 재미삼아 로고를 만들어 봤다.
참고서적
The R in a nutshell
The R Book
A Handbook of Statistical Analyses Using R
Introductory Statistics with R (Statistics and Computing)
Introduction to Scientific Programming and Simulation Using R
R cheat sheets
#1. 예술적 로고 만들기
Normal Distribution Random 함수(rnorm, runif 등)을...
2 tags
최근 대형SNS의 Downtime 사례
최근 발생한 몇몇 대형 서비스들의 Downtime에 대해 기술적으로 살펴봤다.
#1. Facebook: 9월 23일 / 2시간 30분 downtime
5억명이 넘는 사용자를 가지고 있는 페이스북의 경우 성능을 위해 약800대의 메모리캐슁서버(memcached)에 28테라바이트의 소셜 그래프 데이터를 담아 사용자들에게 서비스 한다. 이는 5억명이라는 사용자를 상대하기 위한 페이스북의 가장 중요한 부분이다. (UDP로 통신하는 가장 고성능의 memcached를 자체적으로 만들어 사용하는 것으로 이미 알려져있다.) 메모리캐슁서비스는 원본 데이터를 빠르게 접근하기 위해 메인 메모리에 데이터를 두는 저장소다. 문제는 원본 데이터가 변경이 되면 캐슁도 따라서 갱신을 해줘야하는데 이번 사건은 모든 메모리캐슁서비스가...