본문 바로가기

IT-Consultant

Twitter Streaming API 소개

트위터에서는 Streaming API를 제공한다. 


여기엔 3가지 타입이 존재하는데, 


첫번째로 Public Streaming API가 있다. 

Public Streaming API는 전체 데이터중 1%를 랜덤으로 실시간 전송해준다. 

실제 테스트해보니 하루에 400만건 정도 수집이 됩니다. 

이정도면 Global Trend 분석은 충분히 가능하다고 생각됩니다. 

또한 트위터에서 제공해주는 모든 정보를 얻을 수 있습니다. 

단점이라면 1%만 제공해주는 것입니다. 

부가적인 기능으로 Filter를 제공하는데 이것은 한번 조회 후 연결이 끊어지기 때문에, 

실제 사용하기엔 부담스럽습니다. 

이런 단점들을 극복하기 위해서는 돈을 주고 사면 됩니다. 

트위터의 전체 데이터를 사기엔 돈이 너무 많이 들죠. 그래서 데이터 재판매 회사를 통해서 필터링된 데이터를 사면 직원 한달 월급정도에 구매가 가능합니다. 



두번째로는 User Streaming API입니다. 

이것은 인증된 사용자에게 해당 사용자의 모든 정보를 실시간으로 보내줍니다. 

실시간으로 보내주기 때문에 상업용으로 사용해도 괜잖을 것 같습니다.

예를 들면 회사 공식트위터에 불만 멘션이 들어온다면 그것을 실시간으로 응대를 할 수 있습니다. 


세번째로는 Site Streaming API입니다. 

이것 또한 실제 계약을 하고 사용해야 의미가 있는 것이지, 계약하지 않은 상태에서는 큰 의미가 없습니다. 


결론적으로 보면.. Public Streaming API와 User Streaming API 2가지를 혼용해서 사용하면 의미 있는 데이터를 가져올 수 있다고 생각됩니다.