One of the things we'd like able to do is to compute statistics on lists.
Imagine that we've got a set of n nodes and we've got L, which is a list of values--
one for each of the nodes in the network and we want to compute statistics.
What are statistics? Astatistic is actually quite a simple idea.
It's just a number that summarizes a list of numbers.
If we have a list L--say a list of the centrality scores.
There's lots of different statistics that we can imagine that would summarized
these list of numbers--for example, how many numbers are in the list.
What's the largest number in the list? What's the total of all the scores in the list?
How many scores are in the list that are between 2 and 3 inclusive?
These are all different statistics and some of these are may be more useful than others
but there's lots of different statistics that we might want to compute.
In general when you're doing an analysis of large structures like social networks,
we need some way of summarizing this large amount of data--you can't just present the data
in the raw form--it's too much for people to think of all at once.
Statistics and computing statistics ends up being a really important operation.
बातें हम क्या करने में सक्षम करना चाहते में से एक सूची पर आंकड़ों की गणना करने के लिए है।
कल्पना कीजिए कि हम n नोड्स का एक सेट है और हम L, मानों की एक सूची है जो मिल गया है-
एक नेटवर्क में नोड्स के प्रत्येक के लिए और हम आंकड़ों की गणना करना चाहते हैं।
क्या आंकड़े रहे हैं? Astatistic काफी वास्तव में एक सरल विचार है।
यह सिर्फ एक संख्या है कि संख्याओं की एक सूची का सारांश देता है।
यदि हम एक सूची L - एस केंद्र के स्कोर की एक सूची कहते हैं।
वहाँ अलग अलग आँकड़े है कि हम कल्पना कर सकते हैं कि संक्षेप में होगा की बहुत सारी है
इन सूची की संख्या - उदाहरण के लिए, सूची में कितने नंबर हैं।
सूची में सबसे बड़ी संख्या क्या है? सूची में सभी अंकों का कुल क्या है?
2 और 3 समावेशी के बीच रहे हैं सूची में कितने स्कोर कर रहे हैं?
ये सब अलग अलग आँकड़े हैं और इन में से कुछ कर रहे हैं दूसरों से भी अधिक उपयोगी हो सकते हैं
लेकिन वहाँ बहुत सारे अलग अलग आँकड़े है कि हम की गणना करने के लिए चाहते हो सकता है की है।
सामान्य तौर पर जब आप एक सामाजिक नेटवर्क की तरह बड़ी संरचनाओं का विश्लेषण कर रहे हैं,
हम इस बड़ी राशि सारांश की किसी तरह की जरूरत के डेटा - तुम बस डेटा मौजूद नहीं कर सकते
कच्चे रूप में - यह लोगों की एक बार में लगता है कि करने के लिए के लिए बहुत ज्यादा है।
सांख्यिकी और कम्प्यूटिंग के आँकड़े एक वास्तव में महत्वपूर्ण ऑपरेशन किया जा रहा समाप्त होता है।
リスト上の統計量を計算することができます
ここにn個のノードの集合があると考えてください
Lは値のリストです
ネットワークの中の
それぞれのノードに関する統計量を計算します
統計量とは何か?
それは実際のところごく簡単な概念です
単にリストにおける数値を集約した値です
リストLは中心性のスコアのリストだとします
リストを集約する統計量はたくさん考えられます
例えばリストの中に数字が何個あるのか
リストの中の最大数は何か
数字を合計するといくつになるのか
2以上3以下の範囲のスコアは
リストの中にどれぐらいあるのか
異なる統計量がありそれぞれの有用性も異なりますが
確認したい統計量はたくさんあります
ソーシャルネットワークのような
巨大な構造の分析をする場合
まず最初に大量のデータを集約する必要があります
生のデータのままでは人間にとって
考える負担が大きすぎます
統計をとることと統計量を計算することは
とても重要です