Now I want to show you a visualization tool that I found online that I
think does a really great job of helping you see what k-means clustering does.
And that should give you a good intuition for how it works.
So I'd like to give a special shout out to Naftali Harris,
who wrote this visualization and very kindly agreed to let us use it.
I'll put a link to this website in the instructor notes that you can go and
play around with it on your own.
So it starts out by asking me how to pick the initial centroids of my clusters.
I'll start out with Randomly right now.
What kind of data would I like to use?
There are a number of different things here, and
I encourage you to play around with them.
A Gaussian Mixture has been really similar to one of the simple examples we've
done so far.
So Gaussian mixture data looks like this.
These are all the points that we have to classify.
The first question for you is,
how many centroids do you think is the correct number of centroids on this data?
أريد الآن أن أعرض عليكم أداة تصور وجدتها عبر الإنترنت
.وأظن أنها تؤدي عملاً رائعًا في مساعدتكم على معرفة كيف يعمل نظام مجموعات k-means
.ويجب أن أعطيكم خلفية جيدة عن طريقة عملها
لذا أود أن أنبهكم تنبيهًا خاصًا بشأن Naftali Harris
.الذي كتب هذا التصور وأتمنى الموافقة على أن تدعونا نستخدمه
سأضع رابطًا إلى هذا الموقع الإلكتروني في ملاحظات المدرب بحيث يمكنكم الانتقال إليه
.وتجربته بأنفسكم
.ويبدأ الأمر بسؤالي عن طريقة اختيار النقاط المركزية الأولية لمجموعاتي
.سوف أبدأ بالاختيار عشوائيًا الآن
أي أنواع البيانات أود استخدامها؟
،ثمة العديد من الأشياء هنا
.وأنا أشجعكم على تجربتها بأنفسكم
ويتشابه خليط غاوس كثيرًا مع أحد تلك الأمثلة البسيطة
.التي ناقشناها حتى الآن
.لذلك، تبدو بيانات خليط غاوس مثل هذا
.هذه هي جميع النقاط التي يتعين علينا تصنيفها
،السؤال الأول لكم هو
كم عدد النقاط المركزية التي تظنون أنها العدد الصحيح للنقاط المركزية لهذه البيانات؟
Agora, quero mostrar uma ferramenta de visualização que encontrei online
e que acredito que ajuda bastante a ver o que o agrupamento k-means significa.
Ela deve dar uma boa ideia de como ele funciona.
Eu gostaria de agradecer à Naftali Harris,
que criou esta visualização e nos permitiu usá-la.
Colocarei um link para este site nas Notas do instrutor. Você pode
acessá-lo e brincar com ela sozinho.
Ela começa me perguntando como escolher os centroides iniciais dos clusters.
Começarei com Randomly agora.
Que tipo de dados quero usar?
Há coisas diferentes aqui.
Sugiro que você brinque com elas.
Gaussian Mixture é bem semelhante a um dos exemplos simples que vimos
até agora.
Dados Gaussian Mixture se parecem com isto.
Estes são todos os pontos que temos que classificar.
A primeira pergunta é:
quantos centroides você acha que é o número correto nestes dados?
现在我要向大家展示我在网上找到的一种可视化工具
我认为它对帮助大家了解 k-均值聚类的作用非常有用
它能很直观地展示其作用
我要特别为 Naftali Harris 叫好
他编写了这个可视化工具 并且欣然同意我们使用它
我要在讲师注释中加入这个网站的链接
大家可以自行前往使用
开始时 它会先询问 如何选择聚类的初始质心
现在我选择随机
然后询问我需要什么类型的数据
这里有很多选项
我鼓励大家尽量尝试
高斯混合与我们已经用过的一种简单示例
非常相似
高斯混合数据看起来类似这样
这些是我们需要分类的点
第一个问题是
你认为这个数据的质心数量是多少?