In the last exercise, we used alpha and jitter to reduce
over plotting, but it turns out that there's more that we can
do. Let's hear from Mora about how she used her domain
knowledge and a transformation to make an adjustment to her scatter plot.
>> The next thing that I did, was
to take again, the perceived audience size, and their
actual audience size, but this time I transformed
the axes. So this time, it's as a percentage
of their friend count. Some people in this study had
50 friends, some had 100, some had 2,000, and so,
it actually makes more sense to think about your audience
size as a percentage of the possible audience. All of
the people in the study had shared their post with
friends only privacy, so you'd expect that it would be
bounded by their friend count. So, what we found when
we plotted it this way was that all of the points
are below this line of perfect accuracy, this diagonal line, really
well below. And one other thing I should note about this
plot, we actually ran two different surveys. We ran one survey
where we asked people in a single post, how many people
do you think saw, saw your post? But we also asked
a different set of people, in general, how many people do
you think see the content that you share on Facebook? So
that's what this plot is showing. This is the in general
question, and their guesses are a little bit
higher. But still, people typically think people that maybe
10% of their friends see their content when in
reality it's more like 40% or 50%, even 60%
of their friends will see their content in
a given month. So that's what this plot is
showing, is the percentage of friends who actually saw
their content in the last month, again, they're underestimating.
في التمرين الأخير استخدمنا alpha وjitter لتقليل
الرسم الزائد لكن اتضح أنه يمكننا عمل
المزيد. لنسمع من مورا عن كيفية استخدام معرفتها
.بالمجال والتحويل لعمل ضبط في الرسم المبعثر
>> الشيء التالي الذي قمت به هو
الحصول مرة أخرى على حجم الجمهور المُدرك
وحجم الجمهور الفعلي ولكن هذه المرة قمت بتحويل
المحاور. لذا هذه المرة كانت عبارة عن نسبة مئوية
لعدد أصدقائهم. بعض الأشخاص في هذه الدراسة لديهم
،50 صديقًا والبعض 100 صديق والبعض 2000 صديق
وهذا يعطي معنى أفضل عندما تفكر في حجم الجمهور
على أنه نسبة مئوية للجمهور المحتمل. جميع
الأشخاص في الدراسة شاركوا منشوراتهم
مع أصدقائهم بشكل خاص، لذا نتوقع
أن يكون الأمر مرتبطًا بعدد أصدقائهم. ما وجدناه عندما
قمنا بالتخطيط بهذه الطريقة هو أن كل النقاط
تقع أسفل سطر الدقة التامة هذا السطر القطري
واضح جدًا في الأسفل. يجد شيء آخر يجب ملاحظته حول هذا
المخطط هو أننا أجرينا استطلاعي رأي مختلفين. فقد أجرينا استطلاع رأي
حيث سألنا الأشخاص في منشور واحد، كم عدد الأشخاص
الذين تعتقدون أنهم رأوا منشوركم؟ ولكن سألنا
مجموعة أخرى من الأشخاص بشكل عام، كم عدد الأشخاص
الذين تعتقد أنهم رأوا محتوى ما شاركتموه على Facebook؟ حسنًا
هذا ما يظهره هذا الرسم. هذا سؤال عام
وكانت تخميناتهم
أعلى قليلاً. ولكن لا يزال يعتقد الأشخاص عادة أنه من الممكن
رؤية 10% من أصدقائهم للمحتوى بينما
في الواقع أكثر من 40% أو 50% أو حتى 60%
من أصدقائهم رأوا المحتوى
في شهر معين. هذا ما يعرضه الرسم
وهو النسبة المئوية من الأصدقاء الذين رأوا بالفعل
.المحتوى في الشهر الماضي، ومرة أخرى يستخفون بالعدد
練習問題でアルファとジッタを使って
度数の大小を表しましたがまだ何かできそうです
モイラが彼女の知識と変数変換を用いて
どう散布図を調整したか聞いてみましょう
次に私がしたことは
まず再度 閲覧者数の推測値と実際の閲覧者数を出して
この軸を変換することです
今度は友達数のパーセンテージが軸となります
ユーザの中には友達が50人の人
100人の人、2,000人の人などがいますので
推測閲覧者数を可能な閲覧者数の
割合として考える方が理にかなっているのです
調査対象のユーザ全員が
投稿を友達間でシェアしていたので
友達数が閲覧者の最大数になると予想できます
これで発見したことは
この方法で作図するとすべての点が
この斜線つまり完全な相関を表す線の
ずいぶん下にあるということです
この図で気をつけたいのは
これが2つの異なる調査であるという点です
1つ目の調査は特定の1つの投稿に対し
何人がそれを見たと思うか聞きました
もう1つはFacebookでシェアしている内容全体に対し
何人が見ると思うか質問しました
こちらがその質問に関する図です
こちらの方の予想数は少し高めでした
それでも人々は友達の10%程度と考えています
でも実際は1ヵ月以内に
40%か50% 時には60%の友達が
内容を目にしているのです
この図を見れば前月に
何パーセントの友達が見たか分かるわけです
ここでも推測は実際より低い数字です
No último exercício, usamos alpha e jitter para reduzir
o excesso de plotagem; mas você pode fazer muito
mais. Vamos ouvir Mora falar sobre como ela usou seu conhecimento
e uma transformação para fazer um ajuste no seu gráfico de dispersão.
>> O que fiz foi
pegar novamente o tamanho do público percebido, e seu
tamanho real, mas desta vez transformei
os eixos. Desta vez, trata-se de uma porcentagem
da contagem de amigos. Algumas pessoas neste estudo tinham
50 amigos, outras tinham 100, outras 2.000, etc.,
realmente faz mais sentido pensar no tamanho do
público como uma porcentagem do possível público. Todas as
pessoas no estudo tinham compartilhado suas postagens com
amigos apenas no privado, assim, você espera um número
limitado pela contagem de amigos. O que descobrimos quando
plotamos dessa forma foi que todos os pontos
estão abaixo desta linha de precisão perfeita, esta linha diagonal,
bem abaixo mesmo. E outra coisa que devo observar sobre essa
plotagem é que realizamos duas pesquisas diferentes. Fizemos uma pesquisa
em que perguntamos às pessoas em uma única postagem, quantas pessoas
você acha que viram sua postagem? Mas também perguntamos
a outro conjunto de pessoas, de modo geral, quantas pessoas
você acha que veem o conteúdo que você compartilhada no Facebook? É
isso que esta plotagem está mostrando. Essa é a pergunta
geral e seus palpites são um pouco mais
altos. Mas as pessoas normalmente acham que talvez
10% de seus amigos verão o conteúdo quando, na
realidade, 40% ou 50%, até mesmo, 60%
de seus amigos verão o conteúdo
em um determinado mês. O que esta plotagem está
mostrando é a porcentagem de amigos que realmente viram
o conteúdo no último mês, e mais uma vez, estão subestimando.
在上一个练习中 我们使用 α 和抖动来减少图形重叠
但实际上我们还可以做的更多
我们来听听 Mora 介绍如何使用她的专业知识
和变换来调整她的散点图
我接下来做的就是
重新获取感知的观众数量以及
实际的观众数量 但这次我变换轴
这次是好友数的一个百分比
这个调查中 有些人有 50 个好友
有些有 100 个 有些有 2000 个 等等
实际上 考虑你的观众人数占可能观众的百分比
会更有意义
这个研究中的所有人仅隐秘地与好友分享帖子
所以可预期受其好友数的限制
我们这样绘图时发现的就是
所有的点都低于
这条完美精度线 这条对角线
实际上相当低 我还要说明的一点是
这幅图实际上运行两个不同的调查
在一个调查中 我通过一个帖子询问
你认为多少人看到你的发帖
但是我也还询问不同的人群 通常你认为有多少人
看到你在 Facebook 中分享的内容?
所以这既是这幅图展示出的信息
在平常的问题中 他们的猜测都会有点高
但通常仍有用户认为 可能会有 10% 的好友
会看到他们的内容
而实际上很可能在给定的月份有 40% 或 50% 甚至 60%
的好友会看到他们的内容
所以这就是这幅图所展示出的信息
即上个月内实际看到他们内容的好友百分比
同样被低估