So talk about confusion matrices in different context, you might
remember the work that Katie showed you on principle component analysis, on PCA.
Were we looked at seven different, I guess white male politicians from
George Bush to Gerhard Schroeder, and we ran an eigenface analysis.
Extracting the principle components of this data set, and then re-use
the eigenfaces to re-map new faces to names in order to identify people.
So what I'm going to do now, I won't drag you
through the same PCA example again, so let's do away with those faces.
But instead what I'll do is, I give you a typical output and
we're going to study the output using confusion matrices.
So Katie was so nice to run a PCA on the faces of those politicians and
take the resulting features, put it into a support vector machine and
then go through the data and
count how often any of those people were predicted correctly or misclassified.
And just to confuse everybody, in this example,
we follow the convention of putting the true names, the true class labels,
on the left, and the predicted ones on top.
So, for example, this number one over here was truly Donald Rumsfeld, but
was mistaken to be Colin Powell.
And the way I know it's Colin Powell was the same names over here,
from Ariel Sharon to Tony Blair, apply to the columns over here.
Ariel Sharon's on the left and Tony Blair's on the right.
So we ask you a few questions now.
First, a simple one.
Which of those seven politicians was most frequent in our dataset?
عندما يأتي الحديث عن مصفوفات التعارض في سياق مختلف، فإنكم قد تتذكرون
.(ما عرضته عليكم Katie في تحليل المكونات المبدئية (PCA
فإذا أجرينا تحليل الوجوه الذاتية، فإنه يمكننا تحديد سبعة اختلافات بين السياسيين الذكور بيض البشرة من
.George Bush إلى Gerhard Schroeder
ويكون هذا باستخلاص المكونات المبدئية لمجموعة البيانات هذه، ثم إعادة استخدام
.الوجوه الذاتية لإعادة تعيين الأوجه الجديدة للأسماء بهدف تحديد الأشخاص
إذن ما سأفعله الآن هو أنني لن أستعرض
المثال الخاص بتحليل المكونات المبدئية، لذا دعونا نتخلص من تلك الأوجه؛
ولكن بدلاً من ذلك، سأعطيكم مخرجات مثالية
.وسندرسها باستخدام مصفوفات التعارض
لذا Katie كانت رائعة في إجراء تحليل المكونات المبدئية على أوجه هؤلاء السياسيين
والحصول على الميزات الناتجة، ووضعها في جهاز متجهات الدعم
ثم التنقل بين البيانات
.وحساب عدد مرات التنبؤ الصحيح أو التصنيف الخاطئ لهؤلاء الأشخاص
،وبهدف إرباك الجميع في هذا المثال
اتبعنا التقليد المتمثل في وضع الأسماء الحقيقية، حيث تسميات الفئات الحقيقية
.على اليسار، والأسماء والتسميات المتنبأ بها في الأعلى
لذا، فعلى سبيل المثال، يمثل رقم واحد Donald Rumsfeld على سبيل الحقيقة، ولكن
.على سبيل الخطأ فهو Colin Powell
،والطريقة التي عرفت بها أنه Colin Powell هي الأسماء نفسها هنا
.من Ariel Sharon إلى Tony Blair، وينطبق ذلك على الأعمدة هنا
.Ariel Sharon على الجانب الأيسر وTony Blair على الجانب الأيمن
.والآن نطرح عليكم بعض الأسئلة
.وأبسطها هو السؤال الأول
أي من هؤلاء السياسيين السبعة الأكثر تكرارًا في مجموعة البيانات لدينا؟
Portanto, ao falar sobre matrizes de confusão em contexto diferente, você pode
se lembrar do trabalho que Katie mostrou sobre a análise de componente de princípio, sobre a PCA.
Onde examinamos sete diferentes... imagino políticos brancos do sexo masculino, de
George Bush a Gerhard Schroeder, e executamos uma análise eigenface
extraindo os componentes de princípio deste conjunto de dados e, em seguida, reutilizando
os eigenfaces para remapear novas faces para nomes para identificar pessoas.
O que vou fazer agora é, não vou arrastar você
pelo mesmo exemplo de PCA novamente, portanto, vamos abolir estas faces.
Mas, em vez disso, o que vou fazer é dar a você uma saída típica e
vamos estudar a saída usando matrizes de confusão.
Katie foi tão legal ao executar uma PCA nas faces destes políticos e
ao utilizar os recursos resultantes, colocá-los em uma máquina de vetor de suporte e
então explicar os dados e
contar quantas destas pessoas foram previstas corretamente ou classificadas incorretamente.
E só para confundir todo mundo, neste exemplo,
seguimos a convenção de colocar nomes verdadeiros, os rótulos de classes verdadeiros
à esquerda e os previstos na parte superior.
Por exemplo, este número um aqui era realmente Donald Rumsfeld, mas
foi identificado incorretamente como Colin Powell.
E sei que é Colin Powell porque os mesmos nomes aqui,
de Ariel Sharon a Tony Blair, se aplicam às colunas aqui.
Ariel Sharon está à esquerda e Tony Blair está à direita.
Portanto, fazemos algumas perguntas a você agora.
Primeiro, uma simples.
Qual destes sete políticos esteve mais frequentemente em nosso conjunto de dados?
提到不同背景下的混淆矩阵
你可能记得 Katie 向大家展示的主成分分析
比如我们查看七个不同的白人男性政治家
从 George Bush 到 Gerhard Schroeder 然后进行 EigenFace 分析
提取出此数据集的主成分 然后再使用
Eigenfaces 对应着姓名重新绘制新的面部图 从而识别这些人
因此我们现在要做的 不是将你再次拖入
相同的主成分分析中 我们不管这些面部图
我要做的是给你一个有典型的输出
我们将使用混淆矩阵学习输出
Katie 对这些政治家的面部图进行了主成分分析 很棒
再将得到的特征放入支持向量机
然后仔细检查这些数据
计算这些人物被正确预测或错误分类的频率
为了迷惑大家 在本示例中
我们在左侧放置正确的姓名 正确的类型标签
在上方放置预测的内容
比如说 这里的数字 1 对应的是 Donald Rumsfeld
但被错误地认为是 Colin Powell
我知道 Colin Powell 在这里指同一名字
从 Ariel Sharon 到 Tony Blair 适用于这里的各列
Ariel Sharon 在左侧 Tony Blair 在右侧
好 现在我问大家一些问题
首先 一个简单的问题
这七个政治家中 哪个在我们的数据集中出现次数最多?