1、开撕!
2、当然,这条微博火了之后,陈老师把它删了,只留下这条了,我们接下来的分析,都是基于这条微博的评论的。
3、好,开篇写好了,我们直接进入主题,作为一名技术宅,如何使用稀有语言,来分析一下,这个热点事件背后的数据意义。
(相关资料图)
4、粉丝说:"你""的""不""是!"
5、首先当然是要去抓取数据,这里因为笔者有一个网站,它通过了新浪微博开放平台的审核,因此可以使用微博的应用程序接口接口进行数据的获取,当然能获取到的数据也不多,评论数据只能获取40页,每页50条左右,也就是2000条。虽然对于陈老师这种上千万粉的人来说,简直是毛毛雨,但是并不影响我们使用它来做一下简单的分析。
6、库(XML);
7、图书馆(rcu rl);
8、图书馆(RJSONIO);
9、第一页;
10、次-3;
11、GoOn=TRUE
12、睡眠时间-1;
13、while(GoOn){
14、url -粘贴(
15、https://API。微博。com/2/comments/showJSON,”,
16、id=4001968182199220 "
17、第="第""页,
18、访问令牌=这里很私密,就是通过验证的令牌,我当然不会告诉你啦,
19、sep=" "
20、);
21、打印(网址)
22、commentJSONString - getURL(
23、url。opts=list(ssl.verifypeer=FALSE)
24、);
25、comment JSON-from JSON(commentJSONString);
26、len-length(comment JSON $ comments)
27、打印(镜头)
28、if(len==0){
29、打印("需要休息一下下)
30、睡眠时间——睡眠时间1;
31、if(sleepTime10){
32、GoOn-FALSE;
33、}
34、}否则{
35、结果数据帧(
36、id=c(NA),
37、性别=c(NA),
38、追随者_计数=c(NA),
39、friends_count=c(NA),
40、pagefriends_count=c(NA),
41、status _ count=c(NA),
42、favourites_count=c(NA),
43、created_at=c(NA),
44、已验证=c(NA),
45、已验证类型=c(NA),
46、已验证_原因=c(NA),
47、已验证_贸易=c(NA),
48、(NA),
49、urank=c(NA),
50、screen_name=c(NA),
51、name=c(NA),
52、位置=c(NA),
53、描述=c(NA),
54、text=c(不适用)
55、);
56、对于(1中的我:len){
57、结果[i,] - c(
58、comment JSON $ comments[[I]]$ user $ idstr,
59、comment JSON $ comments[[I]]$ user $ gender,
60、comment JSON $ comments[[I]]$ user $ followers _ count,
61、评论JSON $ comments[[I]]$ user $ friends _ count,
62、评论JSON $ comments[[I]]$ user $ page friends _ count,
63、comment JSON $ comments[[I]]$ user $ status _ count,
64、comment JSON $ comments[[I]]$ user $ favourites _ count,
65、comment JSON $ comments[[I]]$ user $ created _ at,
66、comment JSON $ comments[[I]]$ user $已验证,
67、comment JSON $ comments[[I]]$ user $ verified _ type,
68、comment JSON $ comments[[I]]$ user $ verified _ reason,
69、comment JSON $ comments[[I]]$ user $ verified _ trade,
70、comment JSON $ comments[[I]]$ user $ lang,
71、comment JSON $ comments[[I]]$ user $ urank,
72、comment JSON $ comments[[I]]$ user $ screen _ name,
73、comment JSON $ comments[[I]]$ user $ name,
74、comment JSON $ comments[[I]]$ user $ location,
75、comment JSON $ comments[[I]]$ user $ description,
76、commentJSON$comments[[i]]$text
77、)
78、}
79、write.csv(
80、结果,row.names=FALSE,
81、col.names=FALSE,fileEncoding="UTF-8 "
82、file=paste("data/result_ "times," _ "page,"txt "sep=" ")
83、);
84、第一页;
85、}
86、系统睡眠(睡眠时间);
87、}
本文,陈冠希林志玲,从数据角度分析陈冠希大骂林志玲事件到此就分享完毕,希望对大家有所帮助。