“大鹏观察”是 @dapeng 在 steemit 发起的活动,每周一期,旨在对用户数据进行分析,以期得到一些有用有趣的结果,对用户本人在区块链上的活动具有一定的纪念意义和参考价值。使用的数据来源是 steemdata.com,数据获取、分析、图表制作、报告编写全程使用人见人爱的 R 语言。仅供参考,如果与官方有出入,请以官方为准。
对哪些用户进行分析呢?这就需要你的参与了。从本期活动开始,我们采用新的报名方式: 只接受自荐。如果希望下一期对你自己的用户数据进行分析,那么在最新一期的“大鹏观察”上点赞(Upvote)和留言(Reply)即可。被顶次数最多、位置最靠上的 ID,将是我们下一期的故事主角。
大家对活动有什么建议,也欢迎提出来,毕竟现在的数据分析还很粗浅,将来可供拓展的方向很多。
“大鹏观察”第 2 期,故事的主角是 @htliao。看到有朋友开始为知名 ID 写人物志,受其启发,从本期开始,我们稍微换了一下报告方式,那就是——
Steem 史记: @htliao 列传
@htliao 者,Hong Kong 人氏,活跃于东八区。由于本文涉及的时间均采用标准时区 UTC,换算成该时区均需加上 8 小时。
话说那是个载入史册的时刻: 2017-05-09 15:49:57。乾坤混沌,天地苍茫,每个人都不知道 steem 未来的方向在哪里,不知何去何从。就在这时,某个角落,传来一声婴儿的响亮啼哭。 作为这个世界的第 153668 个生命,@htliao 降生了。
光阴荏苒,如今已是 2017-08-23 10:20:07, Steem 全网注册用户总数已有 313550 个,全网发帖总数已经有 1712778 篇。在这茫茫人海里, @htliao 有过哪些壮举和作为?
This is a report of the Steemit ID @htliao. The data were sampled from https://steemdata.com/ at 2017-08-23 10:20:07, when there were in total 313550 accounts and 1712778 posts on Steem. Data were processes and this report was written in R language.
@htliao 的基本信息 Profile
items | info | |
---|---|---|
name | htliao | |
id | 153668/313550 | |
created | 2017-05-09 15:49:57 | |
profile_image | ||
about | Steemit Team HK curator | Gemini. A 20 sth boy with lots of interests and energy. I blog about travel, food, cryptocurrency and drawing |
location | Hong Kong | |
website | NULL | |
post_count | 2582 | |
available_STEEM | 0 | |
available_SBD | 5.935 | |
available_VESTS | 7000753.153246 | |
reputation | 20989959785722 | |
followers_count | 1220 | |
following_count | 465 |
帖中之最 Top Posts
自诞生后,@htliao 就对这个世界发出了自己独特的声音,共发帖 134 篇。我们来看看 @htliao 发布的帖子里的几个第一名。
In this section we listed @htliao's top posts.
字符最多的帖子 Top post with the most characters.
插图最多的帖子 Top post with the most figures.
- 我的深圳一日遊,含 33 张图片。
修改间隔最长的帖子 Top post with the longest time between the publication and the final edit.
- My Silver Coins Collection #7 我的銀幣收藏 #7,发布 136.5 小时即 5.7 天之后,作者做了最后一次修改。
得票数最多的帖子 Top post with the most upvotes.
赚钱最多的帖子 Top post with the most payout value.
帖子里出现最多的关键词 Key words
下面是 @htliao 所有帖子里出现的字符长度超过2个的中文关键词词云图。字符越大,在 @htliao 帖子里出现次数就越多。
粉丝情况 Followers and following
@htliao 广结四海英雄,有 1220 个追随者,@htliao 关注的 ID 总数是 465。其中,有 205 个 ID 跟 @htliao 是双向关注的,而 260 个ID 虽然被 @htliao 关注,但却没有关注 @htliao 。
@htliao had 1220 followers. @htliao followed 465 ID in total, in which 205 IDs interacted with @htliao bidirectionally, while 260 IDs did not follow @htliao.
若问上图中红色和蓝色区域的名单,请使用 @dapeng 开发的在线小工具 steemr。
随着朋友数量的变化, @htliao 逐渐积累着江湖声望。下面是声望值增长的时间趋势。
发帖 Posts
下图是 @htliao 的发帖时间图,图里每个点代表一篇帖子,往左水平看对应的是发帖的时刻,往下垂直看是发帖的日期。图中使用的标准时区 UTC。
The following figure shows @htliao's active time. The green line indicates @htliao's register time on Steem.
下图是个特殊的时钟,一圈是24小时,显示了 @htliao 一天24小时里发帖的频次,面积越大的时段,发帖数就越多。红线显示的是频次分布:每两条相邻红线之间的帖子数,占全部帖子数的 25%。哪两条红线最接近,哪两条红线之间就是 @htliao 发帖的高峰时段。可以发现,@htliao 除了在 18 时到 21 时(香港时间 2 时到 5 时)之间从未发过帖之外,在其他时段均有发帖活动。最活跃的时段是 10 时 到 14 时(香港时间 18 时 到 22 时)。
The figure above shows the frequency of @htliao's posts.
下图是每周累计发帖总数。在 2017 年 6 月发帖最多,高峰期每周发帖超过了 25 篇。
留言 Reply
下图是 @htliao 对别人帖子的评论(留言)时间图。蓝色点表示周一到周五,红色表示周六和周日。
下图是 @htliao 每天发布评论的时刻统计。24 小时均有评论活动!仍然是在香港时间的晚上比较频繁。
下图是每周发表的评论总数。仍然是 6 月份达到高峰的每周超过 1000 条评论。
点赞 Vote
下图是 @htliao 发布投票(点赞)的时间趋势图。
The following figure shows @htliao's active vote time.
下图是 @htliao 点赞的24小时分布图。点赞活动主要集中在香港时间的晚上,其次是在香港时间的上午 8 时 到 12 时之间。
每周点赞总数:
帖子的质量和收入 Quality and money
下面的数据表格是 @htliao 发帖的首选分区的次数。@htliao 发帖最多的圈子是 'chainbb-general'。
The table below shows the categories (the first tags) of @htliao's posts. @htliao posted most posts in 'chainbb-general'.
category | Freq |
---|---|
bitcoin | 2 |
chainbb-general | 35 |
chainbb-suggestions | 1 |
charity | 2 |
cn | 26 |
cn-conspiracy | 1 |
cn-cryptocurrency | 4 |
cn-food | 1 |
cn-money | 5 |
cn-silver | 2 |
colorchallenge | 4 |
conspiracy | 1 |
cryptocurrency | 4 |
curation | 1 |
digibyte | 1 |
drawing | 3 |
drawingchallenge | 1 |
eos | 1 |
ethereum | 2 |
food | 15 |
gold | 2 |
introduceyourself | 3 |
life | 3 |
news | 1 |
silver | 2 |
steem | 1 |
steemit | 6 |
travel | 3 |
treetuesday | 1 |
现在我们来谈谈钱。下图显示的是单篇帖子收入的分布。横坐标是美元,阴影面积越大,对应美元的帖子数量越多。 @htliao 共发帖 134篇,总收入为 3446.29 SBD, 单帖收入最高为320.6 SBD,平均每帖收入为25.72 SBD。
Now let's talk about money. The figure below shows the dollars @htliao got from each post. Averagely @htliao earned 25.72 dollars per post, with the maximum of 320.6 dollars from one post.
下图显示的是每帖收入的时间趋势。高峰期每周收入超过 900 SBD。
The figure below shows the trend of @htliao's money per post.
下图是 @htliao 帖子获得的投票(点赞)数。 @htliao 累计得赞 10021 个,单帖得到的点赞数最高为 2314 个,平均每帖得赞 74.8 个。
The figure below shows the upvote number of each post. Averagely @htliao earned 74.8 upvotes per post, with the maximum of 2314 upvotes.
下图是平均每赞得到的收益 SBD 的时间趋势。
下图是每周收入总和的时间趋势。
为 @htliao 帖子得到的投票次数最多的前三位伯乐是 @susanlo, @cryptoemperor, @yvonnetse。下面为 @htliao 帖子得到的投票次数超过 20 次的 ID 词云图。
为 @htliao 帖子收益贡献最多的前三位伯乐/金主/贵人是 @abit, @linuslee0216, @nicolemoker。他们一共贡献了 @htliao 全部收入的 56%。
感谢关注“大鹏观察”。欢迎参加下一期的活动,也欢迎提出宝贵意见。谢谢。
您也许对以下帖子感兴趣:
- 大鹏观察 A0:Steem 史记 @tumutanzi 前传 1, 前传 2,前传 3。
- 大鹏观察 A1:Steem 史记 @justyy 列传。
- 大鹏观察 P1:谷哥点名第 1 期“精彩瞬间”回顾
有人想當下一個嗎?
是不是这次披露得太多,大家不敢报名了?如果有不妥当的地方,请一定告诉我,我来修改或者删除。
大鵬哥介紹的都是名人,無名小卒不敢報名呀!
这倒不用担心,一经介绍,就从无名小卒变成了名人, @tumutanzi 就是先例(看这里),哈哈。
@tumutanzi早已經是名人呀!
但是因为他留的这个言,所以成名就归功于我了 😜
大鵬兄是金牌經理人呀!
那你是想報名嗎?
要到達3巨頭之一的@htliao的境界,我估計還需要3年時間,到時我會報名的。
沒有這麽久吧......
對,我其實是想打2年的。
感觉你要将CN区的牛人们一个个挖遍啊。
坛子哥是不是还没被观察过,哈哈。
坛子哥是第一个被观察的。我为坛子哥写了三篇帖子。
三篇,看了你很爱坛子哥啊。
是,所以先拿他开刀!
底裤都被他扒光了。
去拜读一下,哈哈。
不论牛不牛,只要自愿报名,就挖。
这真是一个疯狂的人啊,24小时在线。。。。
......沒有那麼誇張啦。
哈哈,自然是香港时间晚上发帖比较多,不过你确实够working hard的。厉害厉害
年轻人嘛。我记得自己20岁的时候,也经常连续24小时不睡觉,然后呼呼大睡。现在不行了。
根据htliao帖子里出现最多的关键词 Key words,可以判断这是个理工科宅男,学过拓扑学,专注于计算机通信等专业,而且目前没有女朋友,买过比特币。
不知道当事人是否同意以上观点。
基于我今天第一次知道这个htliao的id和大鹏的数据分析结果。
其它规律挖一挖肯定还有很多金子。
目前没有女朋友...
htliao 是 steem 香港的重要人物。我在 steem 混的时间也不长,不太了解,但是目前没有女朋友?这是怎么判断出来的?
有女朋友就搂着睡觉去了……
瞧你这大叔的境界!有女朋友不一定同居啊。
有女朋友的话,需要占住不少时间和精力。
那倒是。有孩子的话......
哇塞 评论好劲爆呀
你们这些大叔比我还八卦。。。
都点你的名。你要不要顺应天意报个名?
哇塞 感觉份量不够啊 分析完发现我只会吃喝玩乐 多尴尬
就算我不分析,数据就在哪儿摆着啊,要想人不知除非己莫为啊
这些对你来说还不是小儿科?口味估计还不够重吧。
你看他的关键词里面全是中性和偏男性的词,每一个感性的、妩媚的、阴柔的词语,这不是一个有女朋友的人的关键词,就算是有,估计也不在热恋。
大家可以请htliao来现身说法。
有道理。这是我头一回展示个人帖子的关键词。其实数据展示起来容易,难在解释。
是滴,数据收集和分析可以机器化,但困难的是建模和解释。
这个应该是在计算语言学里面文本分析的研究内容。
现在的人工智能已经在朝着推理和总结的方向发展了,IBM的沃森在读完了诺贝尔文学奖的那个鲍勃迪伦的所有歌词后,说他的感受是,我看到了逝去的爱情和沧桑的人生。
简直不寒而栗了。谁知道现在打字的这个会不会是机器人???
額,誰說我沒有女朋友的?
我错了,其实我是希望你有女朋友的。现在知道你有女朋友了,我就放心了。
放心吧 LOL 真傷心給人的印象就是個宅男...... :(
😂😂😂😂😂😂
通过分析在线时间,得出没有女朋友 ,属于社会工程学了
分析的太全面了。哈哈
你要不要来报个名?大家对你的呼声很高呢!
@jubi,你不是说要报名的么?
@jubi就選你了,你同意嗎?
下一期的报告结构跟本期完全一样。
太有意思了
谢谢关注!
Awesome Post! you did a lot of research, I'll upvote you! Keep it up!
Thank you!
强大的数据分析
全归功于强大的 R 语言。
棒棒哒
谢谢啦
满足咱一颗八卦的♥
这下你开心了吧!
强烈要求下一个点 汉娜姐。
需要本人自愿报名才算数。可以指定哪些信息不愿意披露,我不写出来就行了。其实数据都在那儿晾着,谁都能看得到......
@jubi 报名了啊?好期待黄大帅啊!!!
没有。不如你自己报名吧!
我去喊他,八卦的心停不了 哈哈哈。我推荐jubi
这数据好全面
还可以继续深挖
数据库先生
女士你好!
很有趣的報告!
寓教于乐!
到我有@htliao的程度時,我也會報名的。
居然还可以这样写!你让我开了眼界了,老乡!
开眼不开眼无所谓,开怀开心就好。
下一个汉娜wu,妥妥的
Congratulations @dapeng! You have completed some achievement on Steemit and have been rewarded with new badge(s) :
Award for the number of comments
Click on any badge to view your own Board of Honor on SteemitBoard.
For more information about SteemitBoard, click here
If you no longer want to receive notifications, reply to this comment with the word
STOP
分析的好深刻
分析的好全面啊,厉害!下一个推荐 @hannahwu 哈哈
哈,这个让我想到了网易云音乐在2017年初的时候做的一个H5页面,我博客上还介绍过呢,H5页面传送门。来个厉害的UI,就能根据数据生成专属信息图啦。
不错!我做的这个 http://steemr.org 其实也是类似的性质。从技术上来说,目前“大鹏观察”报告完全能实现在网站上输入个 id就自动生成本文这样的报告,但是这样一个网站需要资金维持。将来本系列如果做大了拉到赞助,我就给大家做一个。