씨앗(키워드)에 대한 크롤링 후 각 클러스터의 대표 단어만 나열해봤다. 클러스터링이 단순히 모아주는 거이 아니라 살아서 움직이는 무언가가 있는데 그건 여기서 공개하기 좀 그렇고.
white word를 버리자니 문맥이나 무드에 대해 파악하기 힘드니 하나라도 버리지 말고 주워다가 잘 이용해야 할듯하다. 대표 단어들만 모아서 문장을 자동생성해보는 것도 재미있을 듯 하지만 이건 beyond the work이기 때문에 패스.
재미로 해보는 건데 이번에는 너무 멀리 나가지 말아야겠다. 내가 NLP하는 것도 아니고. 저 단어들은 그저 데이터 일뿐이다. 이제 이 놈들을 어떻게 요리할 것인가 그것이 관건이다.



그나저나 이제 신정환을 라디오스타에서 못보겠구나.
